Come migliorare l’EAT per le proprie pagine web?

Già prima dei Core Update degli ultimi anni il paradigma E-A-T ha giocato un ruolo fondamentale nei ranking delle keyword e dei siti. Hyung-Jin Kim, VP Search di Google, ha reso noto come Google da più di 10 anni converta i principi dell’EAT per i ranking.

Questo post è stato scritto da Olaf Kopp ed è basato su due articoli precedenti: 14 ways Google may evaluate E-A-T (in inglese) e Übersicht: E-A-T und SEO bei Google (in tedesco).

Perché l’EAT è così importante?

Hyung-Jin Kim affermava nel suo keynote al SMX del 2022 quanto segue:

E-A-T is a template for how we rate an individual site. We do it to every single query and every single result. It’s pervasive throughout every single thing we do.

Da questa affermazione risulta chiaro che l’EAT è importante non solo per i contenuti YMYL, ma anche per tutti gli argomenti e le keyword. L’EAT nel frattempo sembra condizionare diversi settori negli algoritmi di ranking di Google.

Google è da alcuni anni sotto una grande pressione per quanto riguarda le informazioni mancanti nei risultati di ricerca, come è stato sottolineato nel Whitepaper “How Google fights disinformation” presentato alla conferenza per la sicurezza di Monaco di Baviera nel febbraio 2019.

Google vuole così ottimizzare il proprio sistema di ricerca per fornire i contenuti migliori possibili per le rispettive query di ricerca in base al contesto dell’utente e tenendo conto delle fonti più affidabili. I Quality Rater hanno in questo caso un ruolo speciale.

A key part of our evaluation process is getting feedback from everyday users about whether our ranking systems and proposed improvements are working well. But what do we mean by “working well”? We publish publicly available rater guidelines that describe in great detail how our systems intend to surface great content.

https://blog.google/products/search/raters-experiments-improve-google-search/

La valutazione secondo i criteri EAT ha un ruolo centrale per i Quality Rater.

They evaluate whether those pages meet the information needs based on their understanding of what that query was seeking, and they consider things like how authoritative and trustworthy that source seems to be on the topic in the query. To evaluate things like expertise, authoritativeness, and trustworthiness—sometimes referred to as “E-A-T”—raters are asked to do reputational research on the sources.

https://blog.google/products/search/raters-experiments-improve-google-search/

Occorre fare una distinzione tra la rilevanza del documento e la qualità della fonte. La magia dei ranking di Google accade secondo la valutazione di due aree: la prima riguarda la rilevanza a livello di documento e la seconda la qualità a livello di dominio o entità secondo il paradigma EAT. Per saperne di più puoi leggere l’articolo Entities and E-A-T: The role of entities in authority and trust.

Per quanto riguarda l’esperienza dell’utente nell’utilizzo del motore di ricerca, l’obiettivo di Google è di fare in modo che i risultati di ricerca mantengano un’alta qualità. Ciò risulta chiaro quando si esaminano le dichiarazioni dei vari portavoce di Google in merito al fattore della qualità a livello di documento e di dominio.

Vediamo, ad esempio, ciò che aveva detto Paul Haahr al SMX West del 2016 nella sua presentazione: How Google works: A Google Ranking Engineer’s Story:

Another problem we were having was an issue with quality and this was particularly bad (we think of it as around 2008 2009 to 2011) we were getting lots of complaints about low-quality content and they were right. We were seeing the same low-quality thing but our relevance metrics kept going up and that’s because the low-quality pages can be very relevant this is basically the definition of a content form in our vision of the world so we thought we were doing great our numbers were saying we were doing great and we were delivering a terrible user experience and turned out we weren’t measuring what we needed to so what we ended up doing was defining an explicit quality metric which got directly at the issue of quality it’s not the same as relevance …. and it enabled us to develop quality related signals separate from relevant signals and really improve them independently so when the metrics missed something what ranking engineers need to do is fix the rating guidelines… or develop new metrics.

Questa citazione è stata presa da una parte del suo contributo sulle linee guida dei Quality Rater e dell’EAT. Nel suo discorso Paul accenna anche che la “Trustworthiness” (affidabilità) è l’elemento più importante del paradigma EAT. Secondo le sue affermazioni, i criteri menzionati nelle linee guida dei Quality Rater relativamente ai contenuti e ai siti di buona o scarsa qualità costituiscono un modello di riferimento per la valutazione dei ranking algoritmici.

Allo stesso modo, durante un Google Webmaster Hangout del 2016 John Müller aveva affermato che:

For the most part, we do try to understand the content and the context of the pages individually to show them properly in search. There are some things where we do look at a website overall though.

So for example, if you add a new page to a website and we’ve never seen that page before, we don’t know what the content and context is there, then understanding what kind of a website this is helps us to better understand where we should kind of start with this new page in search.

So that’s something where there’s a bit of both when it comes to ranking. It’s the pages individually, but also the site overall.

I think there is probably a misunderstanding that there’s this one site-wide number that Google keeps for all websites and that’s not the case.  We look at lots of different factors and there’s not just this one site-wide quality score that we look at. So we try to look at a variety of different signals that come together, some of them are per page, some of them are more per site, but it’s not the case where there’s one number and it comes from these five pages on your website.

John sottolinea qui come, oltre alle classiche valutazioni sulla rilevanza, esistano anche dei criteri di valutazione per il sito completo, che fanno riferimento al contesto tematico dell’intero dominio. Questo significa che ci sono segnali che Google prende in considerazione per valutare e classificare tematicamente il sito nella sua interezza. La vicinanza con l’EAT è evidente.

Nel Whitepaper di Google sopracitato puoi trovare diversi passaggi sull’EAT e sulle linee guida dei Quality Rater:

We continue to improve on Search every day. In 2017 alone, Google conducted more than 200,000 experiments that resulted in about 2,400 changes to Search. Each of those changes is tested to make sure it aligns with our publicly available Search Quality Rater Guidelines, which define the goals of our ranking systems and guide the external evaluators who provide ongoing assessments of our algorithms.

The systems do not make subjective determinations about the truthfulness of webpages, but rather focus on measurable signals that correlate with how users and other websites value the expertisetrustworthiness, or authoritativeness of a webpage on the topics it covers.

Ranking algorithms are an important tool in our fight against disinformation. Ranking elevates the relevant information that our algorithms determine is the most authoritative and trustworthy above information that may be less reliable. These assessments may vary for each webpage on a website and are directly related to our users’ searches. For instance, a national news outlet’s articles might be deemed authoritative in response to searches relating to current events, but less reliable for searches related to gardening.

Our ranking system does not identify the intent or factual accuracy of any given piece of content. However, it is specifically designed to identify sites with high indicia of expertiseauthority, and trustworthiness.

For these “YMYL” pages, we assume that users expect us to operate with our strictest standards of trustworthiness and safety. As such, where our algorithms detect that a user’s query relates to a “YMYL” topic, we will give more weight in our ranking systems to factors like our understanding of the authoritativenessexpertise, or trustworthiness of the pages we present in response.

La dichiarazione che segue è particolarmente interessante in quanto viene chiarito quanto l’EAT possa essere potente in certi contesti e in relazione agli eventi rispetto ai classici fattori di rilevanza.

To reduce the visibility of this type of content, we have designed our systems to prefer authority over factors like recency or exact word matches while a crisis is developing.

Gli effetti dell’EAT possono essere osservati nei vari Google Core Update degli ultimi anni relativi a questa tematica.

L’EAT influenza i ranking, senza esserne però un fattore

Si è discusso molto negli ultimi anni se e come l’EAT influisca sui ranking. Quasi tutti i SEO sono dell’idea che si tratti di un concetto o di una sorta di “layer” con cui viene integrato un punteggio di rilevanza.

Secondo quanto afferma Google, l’EAT non è un fattore di ranking e non esiste nemmeno un punteggio EAT. Si tratta piuttosto di un concetto costituito da vari segnali o criteri che i Quality Rater dovrebbero utilizzare per valutare i risultati di ricerca.

Il concetto EAT funge come una specie di modello relativamente a come gli algoritmi di Google debbano determinare esperienza, autorevolezza e affidabilità, cioè la qualità. Google stesso parla comunque anche di “rating”, che viene applicato in modo algoritmico a ciascuna query di ricerca e a ogni risultato. In altre parole, devono esserci dei segnali o dei dati su cui basare una valutazione.

Google usa le valutazioni manuali dei valutatori di ricerca come dati di allenamento per gli algoritmi di classificazione ad auto-apprendimento (parola chiave: Supervised Machine Learning) per identificare sia modelli di contenuti, sia fonti di alta qualità. Questo avvicina Google ai criteri di valutazione EAT e alle linee guida del Quality Rater.

Se i contenuti e le fonti classificati come di alta o bassa qualità dai valutatori di ricerca si distinguono per gli stessi specifici schemi, e se la frequenza di questi schemi raggiunge un valore soglia, Google potrebbe tenere conto di questi criteri/segnali anche i ranking futuri.

Secondo me l’EAT è costituito da diverse origini.

  • Valutazioni basate sulle entità
  • Valutazioni basate sui Coati (ex-Panda)
  • Valutazioni basate sui link

Per valutare fonti come domini, cioè editori o autori, Google si affida a indici basati su entità come il Knowledge Graph o il Knowledge Vault. Ciò consente d’inserire le entità in un contesto tematico e di cogliere le connessioni tra le entità.

Per la valutazione della qualità dei contenuti a livello di singoli documenti e d’intero dominio invece, Google ricorre ai collaudati algoritmi Panda, oggi chiamati Coati.

Il PageRank è l’unico segnale ufficialmente certificato da Google per l’EAT. Da più di 20 anni Google lo usa per la valutazione dell’affidabilità e dell’autorevolezza relativamente ai link.

Diagramma dell'EAT

Ho raccolto i concreti segnali per una valutazione EAT algoritmica in questa infografica basata su brevetti e dichiarazioni ufficiali di Google.

Fattori della valutazione dell'EAT

È bene differenziare questi segnali in relazione a diversi livelli:

  • Onpage: Segnali che si sviluppano dal proprio sito. Principalmente si tratta del contenuto nel complesso e nel dettaglio.
  • Offpage: Segnali che derivano da fonti esterne. Questi possono essere contenuti, video, audio scansionati da Google, o query. Decisivi sono in particolare i collegamenti e le co-occorrenze dal nome dell’azienda, dell’editore, dell’autore o del dominio in relazione ai termini tematicamente rilevanti.
    Maggiore è la frequenza delle co-occorrenze, maggiore è la probabilità che le entità principali abbiano qualcosa a che fare con il tema e con i rispettivi cluster di keyword. Queste co-occorrenze devono essere identificabili, cioè scansionabili, per Google. Solo allora possono essere riconosciute da Google e integrate del progetto dell’EAT.
    Insieme alle co-occorrenze nei testi online, anche le co-occorrenze nelle query sono una fonte per Google.
  • Sentiment: Google è in grado, con il Natural Language Processing, di analizzare il “Sentiment” di persone, prodotti e aziende. Qui possono essere usate le recensioni su Google, Yelp o altre piattaforme con la possibilità di lasciare una valutazione.
    Ci sono alcuni brevetti di Google, come ad esempio Sentiment detection as a ranking signal for reviewable entities, che si occupano di questo.

Alla luce di questi risultati, è possibile ricavare misure concrete per influenzare positivamente questi segnali.

Accorgimenti per migliorare l’EAT

In definitiva Google cerca di adattare con l’EAT il metodo del “posizionamento tematico del marchio” che i marketer utilizzano da secoli per impiantare nella testa delle persone il brand combinato con il messaggio.

Più uno percepisce una persona e/o un’azienda in un determinato contesto, più fiducia si è propensi a dare al prodotto, al fornitore di un servizio o al mezzo.

Se in aggiunta questa entità viene nominata più spesso nei contesti tematici rispetto ad altri concorrenti e giudicata positivamente da fonti credibili e autorevoli, l’autorevolezza aumenta. Attraverso queste ripetizioni una rete neuronale nel cervello viene nuovamente avviata e veniamo percepiti come un marchio che possiede affidabilità e autorevolezza tematica.

Per l’ottimizzazione EAT è dunque importante creare lungo il Costumer Journey delle co-occorrenze che possano essere rilevate da Google. In questo modo, la rete neuronale di Google apprende anche chi è autorevole e quindi affidabile per uno o più argomenti. Questo vale in particolare per le co-occorrenze nelle fasi di Awareness, Consideration e Preference (consapevolezza, considerazione e preferenza).

Più ci si posiziona avanti nella Costumer Journey, più ampio sarà anche il cluster di keyword con il quale Google ci mette in relazione. Una volta stabilito questo legame, si è quindi parte dell’insieme in questione insieme ai propri contenuti.

Queste co-occorrenze possono avvenire, ad esempio, tramite:

  • contenuti onpage adeguati
  • link interni adeguati
  • contenuti offpage adeguati
  • link esterni in entrata, Anchor text e link environment
  • influenza dei modelli di ricerca

Soprattutto con i segnali offpage si ha un ampio margine di creatività. Ma in questo caso non ci sono nemmeno le tipiche misure SEO che creano le co-occorrenze. I manager SEO stanno diventando sempre di più un punto d’incontro tra tecnologia, redazione, marketing e PR, oltre al resto.

Qui di seguito ecco un riassunto dei concreti accorgimenti per ottimizzare l’EAT:

  • Una quantità sufficiente di contenuti pertinenti all’argomento del proprio sito: costruendo mondi tematici semantici all’interno del tuo sito, dimostrerai a Google di avere una competenza e conoscenza approfondita rispetto all’argomento.
  • Collegamenti a contenuti semanticamente adeguati rispetto al contenuto principale: quando si costruiscono mondi tematici semantici, i singoli contenuti devono essere collegati tra di loro in modo ragionevole. Si deve anche tener conto di una possibile User Journey: cosa interesserà all’utente negli step successivi? I link in uscita sono utili se mostrano all’utente e a Google che ci si riferisce ad altre fonti autorevoli.
  • Collaborazione con esperti riconosciuti come autori, revisori, co-autori e influencer: si tratta di persone riconosciute da Google come esperti, ad esempio perché hanno pubblicazioni online, profili da autore su Amazon, blog e siti propri, profili su social media o su pagine universitarie, e simili. L’importante è che dispongano di referenze che si possono trovare su Google nel rispettivo contesto tematico, soprattutto nel caso di contenuti YMYL. Sono da preferire gli autori che hanno pubblicato dei propri contenuti sull’argomento, ancora meglio se reperibili online già da tempo poiché molto probabilmente sono conosciuti come entità nell’ontologia tematica.
  • Espandere la percentuale di contenuti su un tema: maggiore è il numero di contenuti pubblicati da un’azienda o da un autore su un argomento, maggiore è la quota del corpus di documenti pertinenti all’argomento stesso, aumentandone l’autorità tematica. Il fatto che questi contenuti siano pubblicati sul sito dell’azienda o su altri media è irrilevante, l’importante è però che possa essere trovato da Google. Ad esempio, il guest posting su altri media autorevoli e tematicamente rilevanti può essere usato per espandere la quota dei propri contenuti sempre tematicamente rilevanti al di là del proprio sito. Più questi media sono autorevoli, meglio è.
    Altri modi per aumentare la quota sono:
    – Creare guest post tematicamente adatti e linkare questi contenuti dal proprio sito e dai profili social
    – Organizzare interviste su argomenti rilevanti
    – Tenere presentazioni a eventi professionali
    – Partecipare a webinar come relatore
  • Scrivere testi con parole semplici: Google utilizza sempre di più il Natural Language Processing sia per la comprensione dei contenuti che per il Data Mining. Le strutture semplici sono più facili da rilevare rispetto alle frasi complesse. Le entità devono essere chiamate con il loro nome e i pronomi personali usati solo quando serve. I contenuti devono essere scritti in paragrafi e sottotitoli logici, non solo nell’ottica della leggibilità.
  • Utilizzare le analisi TF-IDF per la creazione di contenuti: gli strumenti di analisi TF-IDF possono essere utilizzati per identificare sotto-entità correlate semanticamente che dovrebbero comparire nei contenuti di un tema. Utilizzando questi termini, dimostrerai a Google la tua competenza.
  • Evitare contenuti superficiali e Thin Content: Google svaluta i contenuti poco approfonditi o superficiali in termini di qualità. Questo tipo di contenuti deve essere eliminato o confluire in un unico articolo.
  • Colmare il Knowledge Gap: la maggior parte dei contenuti che si vedono online sono prodotto di curatela o una copia d’informazioni già citate in centinaia o migliaia di altri contenuti. La vera competenza si ottiene aggiungendo nuovi aspetti e punti di vista.
  • Rispettare il consenso (particolarmente importante per gli argomenti YMYL): in un paper di Google viene descritto un Knowledge Base Trust. Il documento descrive come le fonti di contenuto vengono valutate in base alla conformità delle informazioni con l’opinione comune. Questo può essere determinante, soprattutto per gli argomenti YMYL come ad esempio i temi medici, se ci si vuole posizionare con i propri contenuti tra i primi risultati di ricerca.
  • Contenuti basati sui fatti, compresi link a fonti autorevoli (particolarmente importante per gli argomenti YMYL): le informazioni e le affermazioni devono essere rafforzate da fatti e sostenute da collegamenti corrispondenti a fonti autorevoli.
  • Trasparenza su autori, editori e rispettivi contenuti e impegni: gli Author Box non sono un segnale di ranking diretto, ma possono aiutare Google a saperne di più su un’entità autore in precedenza sconosciuta. I link “Chi siamo” e “Note legali” nella pagina sono utili a questo proposito. Si raccomanda di inserire in entrambe le pagine link alle attività, ai contenuti, ai profili degli autori, ai relatori, alle iscrizioni ad associazioni e ai social media. In quanto Anchor text i nomi delle entità hanno il vantaggio di linkare le proprie rappresentanze. Anche i dati strutturati, come il “sameas” Mark Up, sono consigliati in questo caso.
  • Evitare di usare troppi banner pubblicitari e Recommendation Ads (Outbrain, Taboola…): l’uso di pubblicità troppo aggressiva che condiziona l’uso del sito può portare a una valutazione peggiore in termini di fiducia.
  • Creare co-occorrenze al di fuori del proprio sito attraverso il marketing e la comunicazione: per quanto riguarda l’EAT, è importante posizionarsi tematicamente come un marchio tramite i metodi seguenti:
    – link a pubblicazioni professionali tematicamente rilevanti dal proprio sito in modo che Google possa assegnarle più rapidamente e facilmente
    – link building da environment tematicamente rilevanti
    – pubblicità offline che influenzi gli schemi di ricerca su Google o generi co-occorrenze corrispondenti nelle query (spot televisivi, volantini, pubblicità…). La pubblicità non dovrebbe essere di sola immagine, bensì contribuire al posizionamento in un’area tematica
    – cooperazione (ad esempio con fornitori, partner…) che fornisca co-occorrenze adeguate
    – campagne di PR che creino appropriate co-occorrenze che non siano per pura immagine (come per la pubblicità)
    – creazione di buzz sui social media intorno alla propria entità.
  • Ottimizzazione dei segnali degli utenti sulle proprie pubblicazioni del sito, e inoltre:
    – ottimizzazione degli snippet
    – analisi dell’intento di ricerca delle keyword principali: lo scopo del contenuto dovrebbe corrispondere sempre all’intento di ricerca.
  • Creare entusiastiche recensioni: le persone tendono a condividere pubblicamente le proprie esperienze negative avute con le aziende. Questo può essere un problema anche in termini di EAT, in quanto i feedback negativi possono portare a un sentiment negativo nei confronti dell’azienda. Pertanto, i clienti soddisfatti dovrebbero essere incoraggiati a raccontare le proprie esperienze positive.