Comprendere la coerenza semantica di un sito rispetto a un campo tematico

Leggendo di semantica e SEO ti sarà sicuramente capitato di imbatterti – sempre più spesso negli ultimi dieci anni, soprattutto dall’introduzione di RankBrain – in termini come contesto, coerenza, cluster, profondità, intento, entità, vettori, markup o in acronimi come TF-IDF e LSI.

Questi concetti (e non solo questi), pur se diversi tra loro, hanno un filo conduttore: descrivono il passaggio dalla SEO basata su “keyword” alla SEO delle relazioni semantiche.

E forse avrai anche letto che frasi “non comuni”, metafore e/o parafrasi che un amico capirebbe al volo (perché conosce il nostro modo di esprimerci), per il motore di ricerca potrebbero (ancora) non funzionare alla perfezione. 

Perché? Perché è matematica; non è italiano e non è psicologia (detto a grandissime, gigantesche linee generali). I motori di ricerca “leggono” attraverso modelli matematici che individuano pattern, probabilità e relazioni tra concetti: se una frase non rientra in quei pattern, rischia di essere interpretata in modo impreciso o comunque di perdere rilevanza. 

È anche vero, assolutamente, che i modelli di linguaggio moderni sono diventati decisamente abili nel comprendere le “sfumature” del linguaggio naturale. L’introduzione di frasi non convenzionali non è un vero e proprio “errore” come poteva esserlo in passato, ma quanto non lo sia, dipende da diversi fattori. Ad ogni modo, in questo articolo vedremo alcuni possibili approcci per misurare – seppure a grandi linee – quanto un sito riesca a mantenere coerenza e rilevanza rispetto al proprio campo tematico.

Fermo restando che, anche in questo caso, usare la logica e il buon senso ci sarà già di grande aiuto.
Per esempio se il mio sito web tratta, da sempre, di frutta e verdura, iniziare a vendere bulloni può non avere molto senso (e nemmeno per gli utenti). Così non ha molto senso parlare di gossip se il core del mio sito web è la geo-politica. E via dicendo.

Fatta una doverosa premessa, non sempre scontata: cosa possiamo fare in più?

Scopri subito come sfruttare SISTRIX per il tuo business online! Sette giorni per provare l’intero tool senza alcun costo nascosto, né disdetta necessaria: testa subito SISTRIX gratuitamente.

Un approccio veloce e/o approfondito

1. Scattare velocemente una fotografia con Search Console.
2. Scattare velocemente una fotografia e/o approfondire con Keyword Cluster e Directory.

1. Fotografia veloce con Search Console

Qui è molto più semplice a farsi che a dirsi. C’è giusto l’accortezza di selezionare un periodo di tempo ampio tenendo conto delle tendenze. 

Una volta esportate le query (che ricordiamo essere quelle per le quali Google registra un’azione e non quelle – in assoluto – con più volumi) potremmo farci aiutare anche dall’AI, opportunamente addestrata, per individuare quali termini appartengono davvero al cuore del progetto, quali si collocano, invece, ai margini e quali quelli fuori contesto. Indicando anche una possibile percentuale di riferimento. Comunque, è bene sapere che non si tratta di contare semplicemente quante volte appare una parola, ma di valutare l’insieme delle relazioni tra query.

Potrebbe uscirne fuori una cosa simile:

Esempio di distribuzione delle query di un sito

Come sempre, non fidatevi mai ciecamente degli output di alcuna AI: controllate, editate e se serve (di solito serve anche più volte) riformulate il prompt.

 2. Approfondimento con Keyword Cluster e Directory di SISTRIX

Non è detto che abbiamo Search Console (magari è un prospect e serve un audit veloce) oppure dobbiamo approfondire l’iniziale fotografia (magari perché siamo in fase di content audit): in questo caso possiamo utilizzare, ad esempio, il Keyword Cluster.

Partendo dalle keyword del dominio (da una lista creata ad hoc), possiamo vedere come si raggruppano in cluster semantici. Ovviamente, un sito coerente avrà cluster molto concentrati e collegati fra loro.

Esempio di cluster per una lista

Con l’analisi delle directory possiamo dettagliare l’indagine per capire se ci sono directory fuori tema o che comunque rischiano di essere interpretate come tali (e questo possiamo farlo anche considerando i competitor).

Suddivisione delle directory di un sito d'esempio

È molto probabile (ma non è detto) che quella/e con un indice di visibilità molto inferiore rispetto alla directory migliore possa avere (anche) qualche problema di coerenza semantica.

Grafico delle directory d'esempio

Nel caso riportato nell’immagine sopra, ad esempio, la directory /news/ ha colto la mia attenzione perché per un sito di tipo editoriale che tratta di una tematica ben precisa, è abbastanza anomalo che abbia questo andamento per quanto riguarda le news.

E in effetti ho trovato delle news decisamente lontane dal cuore del progetto, ma probabilmente realizzate per rintracciare traffico a seguito di un calendario editoriale sommario, se non discutibile.

Qui si potrebbe aprire una lunga disquisizione sul fatto che non è detto sia utile che tutti gli eventi e tutte le ricorrenze dell’universo vengano presidiate da un sito web. Se nel farlo ti accorgi che è una forzatura, vuol dire che non ha senso (a proposito di logica e buon senso).

È un po’ come se il nostro ristorante vegetariano preferito, il giorno della Festa della Bistecca decidesse di proporre anche un menù di carne. Noi, clienti abituali, resteremmo sicuramente perplessi (se non infastiditi) e i potenziali clienti carnivori, dall’altra parte, probabilmente diffiderebbero dall’entrare in un locale vegetariano che improvvisamente si mette a servire bistecche.

E – tanto per chiarire il ruolo dei dati strutturati sfruttando questo esempio – non è che basta inserire il markup della ricetta della bistecca impanata o alla Tartara per dire che “sì, c’è semantica nella mia pagina”. 

Conclusioni

Senza entrare nel dettaglio dei tecnicismi, qui basterà capire che la coerenza tra ciò che promette un sito web (la sua “ontologia” per natura) e ciò che realmente pubblica online ha un peso. Non basta coprire le chiavi eventualmente correlate, bisogna coprire un argomento in profondità (che non vuol dire scrivere tanto) costruendo un “reticolo” di relazioni. 

Se un possibile “l’indice di dispersione semantica” può diventare un metro di valutazione, non dimentichiamo mai la bussola a casa: logica e buon senso.

Articoli correlati