Vuoi ricevere tutte le novità SEO direttamente via mail?

Perché ottengo dei valori diversi riguardo alle pagine indicizzate su Google, GSC e SISTRIX?

A volte, può accadere che i numeri ottenuti dalle ricerche su Google site:-query, Google Search Console (GSC) e Toolbox SISTRIX non coincidano.

Non puoi infatti comparare direttamente i numeri ottenuti da Google site:-query e quelli di Google Search Console, in quanto essi sono calcolati separatamente, dando luogo a dei risultati differenti.

Confronto delle pagine indicizzate: Google site:-query e SISTRIX

Dati Google site:-query per il dominio zalando.de il 15 agosto 2018

Dati SISTRIX per il dominio zalando.de.: ultimo punto dati per il giorno 6 agosto 2018

Quando valuti due campioni di dati, devi sempre considerare la data della valutazione. Nell’esempio sopra, i dati di Google site:-query sono leggermente più recenti.

Il numero di pagine indicizzate nel Toolbox SISTRIX è una media

Secondo le regole di Google, il numero di pagine indicizzate diventa semplicemente una stima quando si superano le 1000 pagine (infatti davanti ad ogni risultato viene inserito “circa”). Per eliminare la maggior parte delle anomalie, raccogliamo i dati SISTRIX più volte a settimana e poi ne calcoliamo il valore medio. Per fare ciò, effettuiamo delle ricerche su Google site:-query, in modo da avere dei valori provenienti direttamente da Google e calcolare, in base ad essi, la media dei dati settimanali. Se mostriamo una crescita (o una diminuzione), tale andamento deriva direttamente dai dati di Google al momento della richiesta. Inoltre ci limitiamo ad aggiungere un nuovo punto dati allo sviluppo storico, quando notiamo un cambiamento nel valore della media.

I valori poco stabili dovrebbero essere analizzati

Se le tue pagine indicizzate presentano delle variazioni notevoli, dovresti analizzarle per trovare delle possibili cause. Spesso questo può essere dovuto a contenuti doppi o alla presenza di materiale che Google non considera importante. Google indicizzerà queste pagine (il numero di pagine indicizzate quindi salirà) e poi filtrerà nuovamente le pagine doppie o meno importanti (il numero di pagine indicizzate diminuirà). Questo vale anche per le versioni stampabili delle pagine, Sessions IDs, link affiliati e altro.

Esempio con red-simon.com

Per darti un esempio, analizziamo i risultati site:-query per il dominio red-simon.com risalenti al 2013. Verso la fine della ricerca (nel nostro esempio, ci troviamo nella pagina 10), possiamo trovare il motivo della crescita del numero di pagine indicizzate:

Google site:-query for red-simon.com in 2013

Site:-query per red-simon.com nel 2013

Con red-simon.com notiamo la presenza di un gran numero di URL dinamici (con molti parametri) che possono essere trovati nei risultati di ricerca (per esempio red-simon.com/data/cmsv2.asp?mid=41&sid=1&pid=533).

Probabilmente è possibile accedere a questo contenuto da più URL ed esistono quindi dei duplicati. Alcune di queste pagine usavano addirittura un reindirizzamento 302, che Google non riusciva a comprendere. Consigliamo di usare sempre il Redirect 301 per reindirizzare.

Per un sito è sempre fondamentale eliminare gli URL dinamici a favore di quelli statici. mod_rewrite può essere un approccio valido per questo esempio.

Articoli correlati