AI Citation Drift: quanto sono stabili le fonti nei risultati di ricerca AI?

Chi appare oggi come fonte in una risposta AI potrebbe essere sparito la settimana prossima. La nostra analisi di 82.619 prompt nell’arco di 17 settimane mostra che Google sostituisce ogni settimana il 56% delle fonti nelle risposte in AI Mode, e ChatGPT addirittura il 74%. Chi rimane, chi sparisce e perché è problematico che le tre grandi piattaforme abbiano in realtà pochissimo in comune.

Dal mid-2025 si discute sotto il termine “AI Citation Drift” di quanto siano realmente stabili le citazioni di fonti AI (“Citations“). Il dibattito è stato avviato da uno studio di Profound incentrato sulla deriva mensile nel mercato statunitense. Noi abbiamo analizzato il tema più in dettaglio utilizzando i dati di SISTRIX, su tre piattaforme, sei paesi e 17 settimane.

I 5 risultati più importanti

  1. Ogni risposta di AI Mode ha un nucleo fisso e un carosello. Per l’86% di tutti i prompt esiste un nucleo stabile composto da pochi domini; il resto ruota per l’89% ogni settimana. La domanda nel GEO non è «sono nella risposta?», ma «sono nel nucleo o nel carosello?».
  2. Tre piattaforme, tre architetture. Le AI Overviews sono completamente stabili per poco più della metà delle query, le risposte di AI Mode ruotano del 56% a settimana e ChatGPT del 74%. Mettere le piattaforme nello stesso calderone distorce più di quanto mostri.
  3. I domini di brand sono ancorati. Nel 43% delle query di brand, il proprio dominio è presente in tutte le 17 settimane; le co-citazioni accanto ruotano del 70% a settimana. Chi è un brand rimane citato. Chi appare accanto al brand verrà sostituito la settimana prossima da un’altra pagina.
  4. Le notizie sono un biglietto di sola andata. Solo l’1,4% degli articoli di notizie citati come fonte rimane in modo duraturo nel citation set. Chi pianifica la propria strategia di citation attraverso contenuti editoriali di notizie, pianifica male. Il contenuto evergreen sopravvive sistematicamente meglio.
  5. Il Citation Drift è globale e permanente. I tassi di drift si attestano in modo consistente tra il 54% e il 59% nei sei paesi analizzati, senza appiattimento nel corso del periodo di 17 settimane. Non è un effetto di introduzione che si esaurisce nel tempo, ma una caratteristica strutturale delle piattaforme.

Tre piattaforme, tre architetture di citation

I dati di drift finora pubblicati per le piattaforme AI sono aggregati: un numero per piattaforma, generalmente su base mensile. Come prima approssimazione va bene, ma nasconde più di quanto mostri. Google AI Overviews, Google AI Mode e ChatGPT Search funzionano in modo fondamentalmente diverso nella selezione delle citation, e un numero medio trasforma tre cose diverse in una sola.

Grafico a barre: Citation Drift settimanale per piattaforma - AI Mode 56%, ChatGPT 74%, AI Overviews 5% Churn-in a settimana

Termini:

  • Churn-in descrive quanti dei domini citati sono nuovi in una settimana, ovvero non erano presenti la settimana precedente.
  • Retention descrive quanti dei domini della settimana precedente sono arrivati alla settimana successiva.
  • Peripheral / Carosello indica tutti i domini in una risposta AI che non appartengono al nucleo stabile. Compaiono, scompaiono e vengono sostituiti settimanalmente da altri.
  • Core / Nucleo indica i pochi domini in una risposta AI che rimangono presenti in modo duraturo. Il loro churn-in è praticamente dello 0%: vengono citati settimana dopo settimana, indipendentemente da quali altre fonti entrino ed escano.

Google AI Overviews: il cerchio chiuso

Le AI Overviews sono la più stabile delle tre piattaforme. Nella mediana vengono citati 11 domini, di cui 8 sono permanentemente presenti. Questo suona rassicurante in un primo momento, ma la stabilità si distribuisce in modo diseguale.

Nel 53% di tutti i prompt non cambia nemmeno una fonte nell’arco di 17 settimane. Nel 28% si verificano cambiamenti occasionali. E nel 19% le fonti derivano con la stessa intensità che in AI Mode, con un 46% di churn-in. Le AI Overviews non sono uniformemente stabili, ma divise tra una maggioranza in cui non si muove nulla e una minoranza in cui tutto ruota.

Abbiamo verificato che questo non è un artefatto di misurazione: per l’87% dei prompt stabili, il testo di risposta generato cambia di settimana in settimana, ma i domini citati rimangono identici. Le AI Overviews scrivono quindi nuove frasi ogni settimana, ma attingono alle stesse otto fonti. Chi è dentro, rimane dentro. Chi non è dentro, non entra nemmeno.

Esempio: Per „abbinamento scarpa pantalone” le AI Overviews citano esattamente gli stessi 12 domini per 17 settimane: bantoa.com, charleskeith.eu, contigo.it, escarpe.it e altri otto. Zero movimento. Per „gita in città a Natale”, invece, il panorama cambia ogni settimana. Probabilmente perché la risposta a «quali scarpe abbinare ai pantaloni» è meno stagionale della domanda «dove andare a Natale».

Google AI Mode: pochi rimangono, molti cambiano

In AI Mode il quadro è diverso. Per risposta vengono citati tra 14 e 16 domini, di cui il 56% cambia ogni settimana. Suona drammatico, ed è così. Ma vale la pena guardare più da vicino: non tutti i domini derivano allo stesso modo.

L’86,5% dei prompt analizzati ha un nucleo stabile di 1-5 domini che rimangono presenti per settimane e mesi. Il resto dei domini, invece, ruota per l’89% a settimana.

Esempio: Per „a cosa abbinare il primitivo?” lebaroudeurduvin.com e masseriaborgodeitrulli.com rimangono nel Core per tutto il periodo. Nella settimana 1 compaiono accanto a loro 9wines.com, argea.com e giordanovini.it. Nella settimana 2 due di essi sono spariti; al loro posto arrivano buonissimo.it e drinkandpair.com. Il Core rimane, gli altri si alternano.

Chi forma il Core? YouTube e Amazon sono frequentemente rappresentati, il che non sorprende nessuno. Più notevole: nell’83% dei prompt è presente anche almeno un dominio specializzato nel nucleo stabile. Non vincono solo le grandi piattaforme.

E tutto ciò è notevolmente indipendente dal paese:

Churn-in e Retention - AI Mode
CountryChurn-in / WeekRetention / WeekDomains / Answer
DE56%46%13.5
US54%49%16.1
UK54%49%15.7
IT59%43%13.7
ES56%44%11.8
FR57%43%12.3

Churn-in e Retention non sommano il 100% perché hanno basi di riferimento diverse. Churn-in chiede: quante delle fonti odierne sono nuove? Retention chiede: quante delle fonti della settimana scorsa sono ancora presenti? Se una risposta aveva, ad esempio, otto fonti in una settimana e dodici in quella successiva, i due valori hanno una relazione diversa con il numero totale.

ChatGPT Search: fluttuazione totale

ChatGPT Search è il caso estremo. Il 74% dei domini è nuovo ogni settimana. Le strutture di core stabili sono rare: il prompt mediano non ha nessun dominio presente in tutte le 17 settimane. Per confronto: in AI Mode la mediana è di circa 2 domini di core stabili per prompt. In ChatGPT esistono certamente prompt con fonti stabili, ma sono l’eccezione, non la regola.

Inoltre: ChatGPT cita significativamente meno fonti. Nella mediana solo 3-4 domini per risposta, rispetto ai 14-16 di AI Mode. E ora viene la parte interessante: anche per le ricerche in tedesco, il 68% delle fonti core di ChatGPT sono in inglese. Chi in Germania chiede a ChatGPT riceve nella maggior parte dei casi risposte da fonti in lingua inglese.

Esempio: Per „come fare domanda per fare il postino?” ChatGPT cita nella settimana 1 un totale di 3 domini: concorsipubblici.com, gazzettaufficiale.it e poste.it. Nella settimana 2: 5 completamente diversi (antoniodepoli.it, circuitolavoro.it, expatica.com, ilcorrieredellacitta.com, jobleads.com). Nella settimana 3: di nuovo 5 diversi (indeed.com, mondocorrieri.it, money.it, poste.it, qualcherisposta.it). Solo poste.it riappare come fonte core. La risposta può sembrare plausibile ogni settimana, ma non ha nulla a che fare con un uso coerente delle fonti.

Il dominio di brand rimane, il resto ruota

Che in una ricerca di «scarpe con tacco gucci» finisca per essere citato gucci.com è poco sorprendente. Più interessante è con quanta coerenza ciò avviene e cosa succede alle co-citazioni accanto.

In Google AI Mode, il proprio dominio di brand è presente in tutte le 17 settimane solo nel 43% delle query di brand. Nella maggior parte dei casi, quindi, anche la fonte più ovvia esce ad un certo punto dal citation set. Per il 66% rimane almeno nell’80% delle settimane. Le query di brand derivano complessivamente il 20% in meno rispetto alla media (45% vs. 56% di churn-in), quindi notevolmente più stabili, ma non radicalmente diverse.

Il vero schema si mostra nelle co-citazioni accanto. Gli altri 12-15 domini citati accanto al brand ruotano del 70% a settimana. I brand forti rimangono ancorati, il posto accanto viene riassegnato settimanalmente.

Heatmap: andamento delle citation di IKEA Billy scaffali nel corso di 17 settimane - ikea.com citato in modo continuo e prominente, altri domini come youtube.com, focus.de e google.com ruotano
Il grafico mostra la visibilità di ikea.com per il prompt tedesco «Billy Regal» (scaffale billy ikea).

Esempio: Per „scarpe con tacco gucci” gucci.com è presente in 17 su 17 settimane. Nella settimana 1 compaiono accanto gaudenziboutique.com, glamood.com e mytheresa.com. Nella settimana 17 sono ancote.com, dimodaoutlet.com e ebay.it. Completamente sostituiti. Solo Gucci rimane.

Chi vuole sapere se il proprio dominio appartiene al Core o alla periferia può verificarlo direttamente nel SISTRIX Prompt Tracking. A tal fine è possibile definire tramite il Prompt Research un set di prompt rilevanti per il proprio brand. SISTRIX determina quindi quotidianamente se e con quale frequenza il proprio brand appare nelle risposte dei sistemi AI, e quali domini vengono utilizzati come fonti.

Tabella SISTRIX Fonti (URL) per Costa Coffee: www.cozymeal.com/magazine/coffee-chains in testa con 11 menzioni, seguita da vari URL caffenero.com con 7-9 menzioni ciascuno

Così diventa visibile, ad esempio, se per il proprio brand anche il proprio dominio è permanentemente ancorato nel citation set o entra ed esce ogni settimana. SISTRIX per AI e chatbot è gratuito per tutti gli account. Chi vuole provarlo può creare un account di prova gratuito.

Quali tipi di dominio sopravvivono al Citation Drift?

Non tutti i tipi di pagina sono ugualmente colpiti. Abbiamo suddiviso i domini citati in categorie e analizzato con quale frequenza riescono ad entrare nel nucleo stabile di una risposta.

Google AI Mode: gerarchia chiara

Grafico a barre orizzontale: tasso di sopravvivenza dei tipi di dominio in AI Mode - Video/YouTube 24%, Big Tech 16%, Wikipedia 12%, Marketplace 10%, Forum/UGC 3%, News/Media 1,4%
Quali tipi di dominio sopravvivono al Citation Drift?
Domain TypeMedian PresenceCore Rate
Video (YouTube)53%24%
Big Tech (Google, Apple, Microsoft)41%16%
Wikipedia24%12%
Marketplace (Amazon, Otto, Zalando)18%10%
News / Media12%1.4%
Forums / UGC (Reddit, Gutefrage)12%3%

YouTube è il chiaro vincitore. La piattaforma è presente come fonte in più della metà di tutte le date di riferimento e, con un core rate del 24%, è quella che finisce più frequentemente in modo permanente nel nucleo. Che proprio la piattaforma video di proprietà di Google ottenga risultati così buoni non dovrebbe sorprendere nessuno.

All’altro estremo dello spettro si trovano i siti di notizie con un core rate dell’1,4%. Gli articoli di notizie sono nelle risposte AI un biglietto di sola andata. Vengono citati e una settimana dopo sono spariti. Per gli editori che vogliono basare il proprio futuro sul GEO, questo non è un messaggio semplice.

ChatGPT: nessuna gerarchia chiara

Con ChatGPT non emerge uno schema comparabile. Le differenze tra i tipi di dominio sono piccole, e anche i domini che ci si aspetterebbe intuitivamente non appaiono sistematicamente più spesso nel nucleo stabile rispetto ad altri. Questo si adatta al quadro della sezione piattaforme: ChatGPT seleziona ampiamente per risposta, senza che una determinata categoria si imponga in modo duraturo. Per GEO questo significa che in ChatGPT nessun tipo di pagina si propone come obiettivo di ottimizzazione affidabile.

Cosa sopravvive? La classificazione degli URL

Abbiamo classificato oltre 2.500 degli URL citati con un’analisi NLP basata su Gemini secondo lingua, tipo di contenuto, modello di monetizzazione, stato evergreen e segnali E-E-A-T. Questo produce due profili chiaramente diversi per ciò che finisce in Core e in Peripheral.

In Google AI Mode, i domini Core sono per l’80% in tedesco (Peripheral: 62%), e l’85% degli URL Core sono evergreen (Peripheral: 77%). Le pagine prodotto e i negozi dominano il nucleo, le guide e le notizie ruotano. Chi vuole quindi apparire nel Core di AI Mode in Germania dovrebbe puntare su pagine prodotto tedesche e senza scadenza, non su articoli di riviste.

Con ChatGPT Search il quadro si capovolge. I domini Core hanno un E-E-A-T score di 16/20, i Peripheral solo 14/20 (la differenza E-E-A-T più marcata di tutte le piattaforme esaminate). La lingua si inclina nella direzione opposta: il Core di ChatGPT è per il 68% in inglese, anche per le ricerche in tedesco. La documentazione e le fonti istituzionali formano il nucleo, le guide editoriali ruotano.

Le due piattaforme premiano quindi profili di contenuto praticamente opposti. Lingua, tipo di contenuto e modello di monetizzazione sono caratteristiche strutturali di un sito web che non si possono semplicemente modificare per GEO. Per alcuni siti un profilo si adatta meglio, per altri entrambi, per altri ancora nessuno. La posizione che si occupa dipende quindi dalla situazione di partenza, non solo dall’ottimizzazione.

Ogni piattaforma cita fonti diverse

Anche i prodotti di Google stessi concordano a malapena. Per lo stesso prompt, le AI Overviews e l’AI Mode citano domini diversi nell’83% dei casi. L’indice di Jaccard, che misura la sovrapposizione, è di 0,17. In altre parole: di tutti i domini che compaiono in una delle due risposte, solo il 17% appare in entrambe. Tra AI Mode e ChatGPT la sovrapposizione è ancora più bassa, con 0,125.

Esempio: „wie kann ich kostenlos online tv schauen?” (trad.: „come posso guardare la TV online gratuitamente?”)

  • AI Mode cita: check24.de, dslweb.de, hoerzu.de (portali di confronto e guide TV)
  • ChatGPT cita: arte.tv, zdf.de, 3sat.de (le emittenti direttamente)
  • In comune: solo joyn.de

Una delle ragioni della bassa sovrapposizione risiede nelle preferenze strutturali delle piattaforme. AI Mode attinge per l’80% a fonti in tedesco, ChatGPT per il 68% a fonti in inglese, anche per le ricerche in tedesco. Già solo questo bias linguistico fa sì che i pool di fonti delle due piattaforme possano a malapena sovrapporsi per il mercato tedesco.

Per GEO questo significa: una strategia che funziona per AI Mode spesso non raggiunge ChatGPT e viceversa. Le strategie di citation specifiche per piattaforma non sono quindi opzionali, ma un requisito fondamentale.

Livello di dominio vs. livello di URL: i nostri dati sono conservativi

Tutti i dati di drift finora menzionati si basano su confronti a livello di dominio. A livello di URL, ovvero la sottopagina concreta e non solo il sito web, il drift è ancora significativamente più forte: l’85% a settimana rispetto al 74% a livello di dominio. Anche quando un dominio rimane stabile nel citation set, Google cambia frequentemente la sottopagina concreta.

Esempio: imdb.com rimane come fonte per „action adventure movie”. Nella settimana 1 viene collegato /list/ls594655800/, nella settimana 2 /chart/moviemeter/. Una pagina completamente diversa sullo stesso dominio.

Per GEO questo significa: il posizionamento di un singolo URL nelle risposte AI non è un obiettivo di misurazione sensato. La presenza a livello di dominio è misurabile e controllabile. Quale URL concreto su quel dominio appaia in una determinata settimana non è però controllabile.

Il Citation Drift è globale

Grafico a colonne: Citation Drift di AI Mode per paese - Italia 59%, Francia 57%, Germania 56%, Spagna 56%, USA e UK rispettivamente 54% di churn-in a settimana

I tassi di drift in Google AI Mode sono notevolmente consistenti in tutti e sei i paesi analizzati: tra il 54% e il 59% di churn-in a settimana, indipendentemente dal paese e dalla lingua. Il Citation Drift non è un fenomeno specifico degli USA o della Germania, ma una caratteristica strutturale della piattaforma.

Con ChatGPT, invece, si notano differenze tra paesi. La Germania, con il 74%, è notevolmente più volatile del Regno Unito (60%) e della Francia (42%). La causa risiede probabilmente nella diversa copertura di crawl per le diverse lingue.

Nell’arco dell’intero periodo di 17 settimane non è riconoscibile alcun trend. Nessuna stabilizzazione, nessun appiattimento. Chi aspetta il momento in cui le piattaforme AI si accordano su un set fisso di fonti può aspettare a lungo.

Cosa significa questo per GEO?

I risultati di questo studio si possono tradurre in tre raccomandazioni concrete.

  1. Pianificazione dei contenuti: evergreen prima delle notizie, prodotto prima della guida.
    I core rate per tipo di contenuto forniscono una chiara prioritizzazione. I contenuti evergreen e le pagine prodotto e negozio hanno sistematicamente maggiori probabilità di essere citati in modo duraturo. Gli articoli di notizie, con un core rate dell’1,4%, sono praticamente inadatti come obiettivo di citation, il che li rende comunque utili come formato di traffico, ma non come investimento GEO. Il video, con un core rate del 24%, è il tipo di contenuto più forte in assoluto. Per le aziende che finora non gestiscono un canale YouTube strutturato, vale la pena dargli una seconda occhiata.
  2. Impostare il focus sulla piattaforma in base alla situazione di partenza.
    AI Overviews, AI Mode e ChatGPT citano per la stessa domanda più dell’80% di domini diversi. Allo stesso tempo premiano profili di contenuto diversi (pagine negozio tedesche in AI Mode, documentazione inglese in ChatGPT). La maggior parte delle aziende è strutturalmente meglio posizionata per una delle piattaforme rispetto alle altre. Invece di giocare su tutte e tre con lo stesso peso, è di solito più sensato scegliere la piattaforma adeguata come obiettivo di ottimizzazione e trattare le altre come obiettivo di monitoraggio.
  3. Calibrare le aspettative GEO.
    Le classiche promesse SEO come «posizione 1 per keyword X» non funzionano nelle risposte AI. GEO è in definitiva l’ottimizzazione delle casualità con cui lavorano gli LLM, e con un drift settimanale del 56%, un singolo posizionamento di citation non è una prestazione riproducibile, ma uno snapshot. Per i progetti questo significa basare la misurazione del successo sulla presenza nel tempo, non sui singoli risultati, e stabilire aspettative chiare con gli stakeholder: GEO è un processo continuo, non un’ottimizzazione una tantum con risultato permanente.

Base dati

Questo studio si basa sul SISTRIX AI Research Index e comprende 82.619 prompt qualificati con 1.548.213 snapshot. Sono stati registrati sei paesi (Germania, USA, UK, Italia, Spagna, Francia), tre piattaforme (Google AI Mode, Google AI Overviews, ChatGPT Search) e 17 settimane dal 17-12-2025 all’08-04-2026 con date di riferimento settimanali. Inoltre sono stati classificati 2.556 URL di fonti per lingua, tipo di contenuto ed E-E-A-T.

Tutte le metriche di drift si basano su confronti a livello di dominio tra snapshot settimanali consecutivi. Le metriche principali sono churn-in (quota di nuovi domini a settimana) e retention (quota di domini sopravvissuti).

Limitazioni: I dati di ChatGPT comprendono solo prompt con menzione coerente delle fonti. I tassi di drift citati sono conservativi; a livello di URL sono del 15% più alti.

Articoli correlati