In un ecosistema digitale in rapida evoluzione, l'integrazione dell'intelligenza artificiale nei motori di ricerca sta ridefinendo i paradigmi consolidati della SEO.
Scopri di piùCome ottimizzare il proprio sito web per i Large Language Models (LLM)
Il futuro della SEO e di Google è oggetto di molte speculazioni.
Per mantenere il ruolo di piattaforma principale per la ricerca, Google dovrà affrontare sfide sempre più complesse. Da un lato, la competizione con giganti come TikTok e Amazon. Dall’altro, la crescita di nuove piattaforme come ChatGPT e Perplexity. A complicare il quadro, si aggiunge la recente causa per monopolio che ha messo sotto pressione il gigante dell’Internet.

Google sta perdendo quote di mercato?
Secondo uno studio citato dal Wall Street Journal, sembra di sì. L’articolo evidenzia che “la presa di Google sul business della pubblicità di ricerca, che vale quasi 300 miliardi di dollari, si sta allentando”.
Ma non tutti sono d’accordo e alcuni esperti sostengono il contrario. Come marketer e specialisti SEO, è importante analizzare criticamente queste affermazioni. Rand Fishkin, per esempio, evidenzia che i dati indicano il contrario: “Google è in realtà forte come non lo è mai stato”.
Alcune statistiche su Google e l’intelligenza artificiale
- Google detiene circa il 90% della quota di mercato globale dei motori di ricerca (dati aggiornati al 2024).
- In Italia, a novembre 2024, la situazione è simile: Google domina con il 93,85% del mercato, mentre Bing si ferma al 3,57%.
- Le persone stanno davvero abbandonando Google per passare ai motori di ricerca basati sull’intelligenza artificiale? I dati dicono di no: il 99% degli utenti di AI utilizza ancora Google.
- In media, gli utenti accedono a Google 200 volte al mese, contro le 13,5 volte di ChatGPT e le 16,5 di Perplexity.
- Curiosamente, a novembre 2024, il principale sito di riferimento per Google, secondo SimilarWeb, è stato OpenAI. Google resta comunque difficile da sostituire.
Per avere un quadro più completo, di seguito vengono mostrate le visite ottenute da Google nel novembre 2024 secondo SimilarWeb, rispetto ad altre piattaforme consolidate. Google è ancora leader indiscusso ed è molto difficile da superare.

Perché è necessario ottimizzare per i LLM?
Se Google rimane il re della ricerca, abbiamo comunque bisogno di ottimizzare per i modelli di linguaggio avanzati (LLM)? La risposta è sì, per due motivi:
- Evoluzione del comportamento degli utenti: Gli utenti stanno cambiando il loro modo di cercare informazioni online, e il nostro obiettivo è anticipare questa tendenza. È meglio adattarsi fin da subito, piuttosto che rincorrere il cambiamento.
- Rilevanza per settore specifici: La necessità di ottimizzare per gli LLM dipende dal vostro business e dal target di riferimento. In alcuni settori, queste tecnologie giocano un ruolo cruciale per raggiungere i clienti in modo efficace.
Come ottimizzare per i LLM?
Se volete ottimizzare per i modelli di linguaggio avanzati (LLM) e ampliare la vostra strategia SEO, ecco alcune azioni che potete intraprendere:
1. Le menzioni del brand sono le nuove parole chiave
Assicuratevi che il vostro sito web contenga tutte le informazioni essenziali sul brand. Questo passaggio, apparentemente banale, è spesso trascurato. Esistono infatti domande nel box “People Also Ask” (PPA) a cui rispondono siti web di terze parti. Non perdete l’occasione di raccontarvi voi stessi.
Un esempio? Cercando “Coca Cola”, compaiono PAA alle quali rispondono siti come My Personal Trainer o Focus. Volete davvero che siano altri a raccontare la storia del vostro brand?
Se qualcuno utilizza un LLM per cercare informazioni su Coca Cola, è probabile che questi siti vengano citati o linkati al posto del sito ufficiale di Coca Cola.
Cosa fare: analizzate le PAA relative al brand e assicuratevi che il vostro sito offra risposte complete e chiare a tutte le domande più frequenti. Così facendo, manterrete il controllo sulla narrazione e migliorerete la visibilità nei risultati degli LLM.
1.1 Menzioni del brand nei dati di training: un fattore cruciale per gli LLM
Un elemento fondamentale per essere citati nei modelli di linguaggio avanzati (LLM) è la presenza del brand nei dati di training.
Ecco cosa sappiamo sulle fonti principali dei dati utilizzati per l’addestramento di ChatGPT:
- Common Crawl: rappresenta il 60% dei dati di training. Questo set copre un’ampia porzione del web conosciuto e contiene quasi un miliardo di parole. I dati sono stati filtrati e de-duplicati per garantirne la qualità.
- WebText2: include post di Reddit dal 2005 al 2020 e pesa per il 22% nell’addestramento.
- Books1 e Books2: questi set, tratti da aziende librarie online, hanno contribuito ciascuno con un peso dell’8%.
- Wikipedia: gli articoli in inglese di Wikipedia costituiscono il 3% dei dati di training.
Cosa significa?
Le attività di Digital PR sono ora più rilevanti che mai. Reddit, ad esempio, non è solo una piattaforma di crescente importanza nelle SERP, ma rappresenta anche una delle fonti principali di dati di training per gli LLM, con un peso significativo del 22%.
Il vostro brand ha una pagina Wikipedia? Se la risposta è no, è il momento di crearne una. Una pagina Wikipedia ben curata non solo migliora la percezione del brand, ma aumenta anche le possibilità che venga inclusa nei dati di training.
2. L’ottimizzazione tecnica è fondamentale
I modelli di linguaggio avanzati (LLM) non sono ancora sofisticati quanto Google. Questo è naturale, considerando che Google ha avuto più tempo per perfezionarsi. Di conseguenza, i LLM e i loro crawler richiedono più accortezze tecniche.
I crawler AI stanno diventando sempre più presenti sul web. Nell’ultimo mese GPTBot di OpenAI ha generato 569 milioni di richieste attraverso la rete di Vercel, seguito da Claude di Anthropic con 370 milioni di richieste. Insieme, rappresentano circa il 20% delle 4,5 miliardi di richieste di Googlebot nello stesso periodo.
Aspetti tecnici da considerare:
- JavaScript: Nessuno dei principali crawler AI, tra cui GPTBot (OpenAI), ClaudeBot (Anthropic), Meta-ExternalAgent (Meta), Bytespider (ByteDance) e PerplexityBot (Perplexity), è in grado di fare il rendering di JavaScript. Per questo motivo, è essenziale assicurarsi che i contenuti siano accessibili in HTML grezzo e non richiedano il rendering JS.
- Dati JSON (dati strutturati):
I crawler AI possono leggere e interpretare contenuti non HTML, come i dati JSON inclusi nella risposta HTML iniziale. Questo è un punto di forza rispetto ai normali web crawler, ma è comunque importante garantire che questi dati siano ben strutturati e rilevanti. - 404 e reindirizzamenti: I crawler AI tendono a essere meno efficienti nella selezione degli URL, causando alti tassi di pagine 404. Per evitare questo problema, è fondamentale: gestire gli URL in modo efficace, mantenere aggiornate le sitemap, garantire pattern di URL coerenti, correggere i reindirizzamenti in modo puntuale.
- Solo perché Google è in grado di gestire determinati aspetti, non significa che lo siano anche tutti gli altri crawler AI. Adottare un approccio mirato e scrupoloso all’audit tecnico SEO è essenziale per identificare e risolvere problemi che potrebbero ostacolare il crawling e l’indicizzazione da parte dei LLM.
3. Tipologie di contenuto e il loro impatto sugli LLM
- Claude: si concentra molto sulle immagini, che rappresentano il 35,17% delle ricerche totali. Ciò significa che anche l’ottimizzazione di elementi come il nome del file, il titolo dell’immagine e l’alt tag dell’immagine è altrettanto importante. Inoltre, le immagini devono essere pertinenti e di alta qualità per ottenere risultati migliori.
- ChatGPT: privilegia i contenuti testuali per un 57,7% delle ricerche totali. Questo significa che una strategia orientata ai contenuti di testo ben strutturati è essenziale per migliorare la visibilità in questo LLM.
Adattate la vostra strategia di contenuti in base al modello di LLM, ottimizzando testo e immagini in modo mirato.
4. L’importanza di Bing Webmaster Tools
Monitorare Bing Webmaster Tools è diventato fondamentale, perché le URL ben posizionate su Bing hanno maggiori probabilità di essere citate in ChatGPT.
Uno studio recente ha dimostrato che “le pagine con un traffico organico più elevato ricevono visite più frequenti dai crawler.” Questo sottolinea l’importanza di continuare a concentrarsi su una buona strategia SEO.
Non lasciatevi distrarre da nuove tattiche o tendenze a scapito della SEO tradizionale. La chiave è un approccio equilibrato: sfruttare le opportunità offerte dai LLM senza trascurare le fondamenta SEO del vostro sito.
Per scoprire come ottimizzare i vostri contenuti per i LLM e rafforzare la vostra strategia SEO, il team di Reelevate è a disposizione per una consulenza su misura.
Il 29 ottobre, nel cuore di Milano, abbiamo esplorato il futuro della trasformazione digitale insieme a Google Cloud e a un panel di esperti d'eccezione.…
Scopri di piùSfruttare GA4, BigQuery e Vertex AI per un vantaggio competitivo nel 2024
Scopri di piùContattaci
Vuoi (re) elevare il tuo business online? Parliamone insieme.