robots.txt

Cos’è lo User Agent?

Per ogni richiesta lo User Agent viene inviato dal Browser ad un server web, in modo da dare maggiori informazioni sul sistema utilizzato. Si tratta quindi di una sorta di “etichetta identificativa” del browser.

Cos’è il noindex?

Inserendo il valore noindex all’interno del codice sorgente di un determinato URL, si indica al motore di ricerca di non indicizzare la pagina in questione. Cosa significa “noindex” e quando può essere utilizzato? Il Webmaster può utilizzare il valore noindex per informare il motore di ricerca che una determinata sottopagina […]

La mia pagina è stata erroneamente tolta dall’indice: i suoi Ranking sono ormai persi?

Nella maggior parte dei casi i ranking non dovrebbero essere andati persi, tuttavia la risposta a questa domanda dipende molto da quando è stata estromessa la pagina (o il sito).

Come gestire l’indicizzazione di siti web estesi in ottica SEO

Non appena il sito eccede le dimensioni di una tipica homepage privata, emergono una serie di nuove sfide che non bisogna sottovalutare. Una di queste riguarda il fatto che il contenuto esistente appartiene all’indice di Google, e deve essere il più completo ed aggiornato possibile. I punti indicati in questo […]

I file PDF delle mie pagine HTML possono costituire un problema di contenuti duplicati?

Se il proprio contenuto è disponibile sia su una pagina HTML, sia in un file PDF, Google lo potrebbe considerare un caso di contenuti duplicati? In questo articolo approfondiremo l’argomento.

GoogleBot può compilare e scansionare dei moduli?

Generalmente GoogleBot cerca di compilare ed inviare i moduli di una pagina per scoprire nuovi contenuti e URL che altrimenti non sarebbero visibili.

Indice di Google, GoogleBot e Crawler

Un sito può essere trovato tramite la ricerca su Google solo se è stato precedentemente inserito nell’Indice di Google. GoogleBot scansiona ogni giorno migliaia di siti, alla ricerca di contenuti nuovi o aggiornati. In questo modo Google è sicuro che praticamente tutti i siti presenti nel web possono essere trovati […]

Come posso rimuovere un URL del mio sito dall’Indice di Google?

Per rimuovere uno specifico URL (per esempio http://www.esempio.com/pagina4.html) del tuo sito dall’Indice di Google, potrai affidarti ai due modi seguenti. Opzione 1: il valore Noindex del Meta Tag Robots Imposta il Meta Tag Robots come Noindex all’interno del codice sorgente della pagina che non desideri far apparire nell’Indice. Nello specifico, […]

Perché ottengo dei valori diversi quando confronto le pagine indicizzate su Google, GSC e SISTRIX?

A volte può accadere che i numeri ottenuti dalle ricerche su Google tramite la query “site:”, Google Search Console (GSC) e Toolbox SISTRIX non coincidano. Per quale motivo?

Perché utilizzare le virgolette in una ricerca di Google dà più risultati rispetto a quella senza di esse?

Una ricerca su Google può essere effettuata in più modi. L’operatore virgolette: [ “keyword” ] può essere usato per cercare o filtrare specifiche parole chiave o frasi.

Perché un URL bloccato tramite robots.txt compare comunque nelle pagine dei risultati?

Se si usa il robots.txt per bloccare l’accesso al crawler di un motore di ricerca relativamente ad una cartella o una pagina specifica, il contenuto di tale pagina/cartella non verrà scansionato, né indicizzato.

Perché il numero di pagine indicizzate è così instabile?

La quantità di pagine indicizzate può variare fortemente, e questo potrebbe derivare da problemi di contenuti duplicati. In questo articolo ti spiegheremo come risolvere il problema.

Come posso evitare che GoogleBot scansioni il mio sito web?

Qualunque sia la ragione per la quale desideri impedire a Google di scansionare totalmente o parzialmente il tuo dominio, puoi utilizzare il cosiddetto robots.txt per indicare la crawler quali contenuti scansionare e quali escludere.

Quante pagine del mio dominio sono state indicizzate da Google?

Google offre due semplici opzioni per determinare la quantità delle pagine indicizzate di un dominio. Opzione 1: l’operatore site: Usando una semplice query di ricerca con il cosiddetto operatore “site:” seguito dal dominio che t’interessa, potrai ottenere il numero approssimativo delle pagine indicizzate da Google. Digita la formula seguente nel […]