Deduplica dei risultati di ricerca più complessa di quanto si pensi

La composizione dei risultati di ricerca sta diventando sempre più complessa: risultati organici normali, ricerche verticali aggiuntive, dati strutturati e semantici, e chi più ne ha più ne metta, il tutto unito in un’unica pagina.

Non è naturalmente da escludersi, quindi, che lo stesso contenuto si trovi in più fonti differenti. Per fare in modo di evitare proprio che si trovino doppioni dello stesso contenuto nelle SERP, Google ha deciso di deduplicarli. Questo significa che vengono riassunti e mostrati una sola volta.

Quanto sia complesso questo processo lo dimostra il caso del giornalista Dieter Bohn, che aveva cercato il titolo del suo articolo su Google e accusato il motore di ricerca di mostrarne soltanto copie.

Tweet di Dieter Bohn

Danny Sullivan ha risposto all’accusa come rappresentante di Google e chiarito la faccenda. Ed è qui che la storia si fa interessante: sembrerebbe che, se vengono cercate più parole insieme (come, in questo caso, il titolo dell’articolo), Google cambia la modalità di ricerca.

Esso non prova più a “comprendere” la query (parola d’ordine: ML / BERT) e di mostrare quindi i risultati adeguati, bensì cerca solo le pagine che contengono tutte le parole digitate, funzionando, in sostanza, come un vero e proprio motore di ricerca testuale.

Se lo stesso URL viene poi trovato in più fonti, Google lo mostra solo in una. In questo caso, l’articolo appariva già come primo link nel box “Top Stories” e questo box appariva anche prima dei risultati della ricerca organica.

Articoli correlati