Come risolvere "Scansionato - Attualmente non indicizzato" in Google Search Console
Pubblicato: 2021-12-28La documentazione di Google definisce lo stato Scansionato - attualmente non indicizzato come:
La pagina è stata scansionata da Google, ma non indicizzata. Può essere indicizzato o meno in futuro; non è necessario inviare nuovamente questo URL per la scansione.fonte: Google
Leggere questa spiegazione potrebbe essere frustrante, soprattutto se lo stato interessa una pagina importante per la tua attività. La definizione di Google non chiarisce cosa è successo e cosa potresti fare dopo. Tutto quello che dice è che Googlebot ha eseguito la scansione della tua pagina ma, per qualche motivo, ha deciso di non indicizzarla.
Secondo la nostra ricerca, lo stato Scansionato - attualmente non indicizzato è il problema più comune segnalato nel rapporto sulla copertura dell'indice. Significa che probabilmente l'hai già sperimentato, o è probabile che lo sperimenterai in futuro.
È fondamentale risolvere il problema il prima possibile. Dopotutto, se la tua pagina non è indicizzata, non apparirà nei risultati di ricerca e non riceverà traffico organico da Google.
Questo articolo presenta le possibili cause dello stato Scansionato - attualmente non indicizzato e i modi per risolverli .
Dove puoi trovare lo stato Scansionato - attualmente non indicizzato?
Puoi trovare lo stato nel rapporto sulla copertura dell'indice e nello strumento di controllo degli URL in Google Search Console.
Rapporto sulla copertura dell'indice
Scansionato: attualmente non indicizzato appartiene alla categoria "Escluso", il che indica che Google non ritiene che sia un errore che la pagina non sia indicizzata.
Queste pagine in genere non sono indicizzate e riteniamo che sia appropriato. Queste pagine sono duplicate di pagine indicizzate o bloccate dall'indicizzazione da parte di qualche meccanismo sul tuo sito, o altrimenti non indicizzate per un motivo che riteniamo non sia un errore.fonte: Google

Dopo aver fatto clic sullo stato Scansionato - attualmente non indicizzato, vedrai un elenco di URL interessati. Dovresti esaminarlo e dare la priorità alla risoluzione del problema per le pagine più importanti per te.
Il rapporto è disponibile anche per l'esportazione. Tuttavia, puoi esportare solo fino a 1000 URL. Se sono interessate più pagine, puoi aumentare il numero di URL esportati filtrando le pagine specifiche delle Sitemap. Ad esempio, se hai due Sitemap, ciascuna con 1000 URL, puoi esportarle entrambe separatamente.
Strumento di controllo URL
Lo strumento di controllo degli URL in Google Search Console può anche informarti sugli URL sottoposti a scansione, al momento non indicizzati.

La sezione superiore dello strumento ti informa se l'URL può essere trovato su Google o meno. Se l'URL controllato appartiene alla categoria Esclusi nel rapporto sulla copertura dell'indice, lo strumento Controllo URL riporterà quanto segue: "La pagina non è nell'indice, ma non a causa di un errore".
Di seguito, puoi trovare informazioni più specifiche sullo stato di copertura corrente dell'URL ispezionato, nel caso in cui l'URL sia stato sottoposto a scansione, attualmente non indicizzato.
Segnalazione bug: la tua pagina potrebbe essere effettivamente indicizzata
Dopo aver notato lo stato Scansionato - attualmente non indicizzato, la prima cosa da fare è verificare se la tua pagina non è davvero indicizzata.
Non è raro vedere una pagina contrassegnata come sottoposta a scansione, al momento non indicizzata nel rapporto sulla copertura dell'indice, mentre lo strumento Controllo URL indica che la pagina è effettivamente indicizzata.
Lo strumento Controllo URL consente di controllare i dettagli su un URL specifico, tra cui:
- Problemi di indicizzazione,
- Errori di dati strutturati,
- Usabilità mobile,
- Visualizza le risorse caricate (ad es. JavaScript).
Puoi anche richiedere l'indicizzazione di un URL o vedere una versione renderizzata di una pagina.
John Muller di Google ha affrontato il problema delle differenze tra il rapporto sulla copertura dell'indice e lo strumento di ispezione degli URL durante l'orario di ufficio SEO di Google:
Di recente ho visto alcuni thread come questo su Twitter in cui le persone hanno visto URL contrassegnati come non indicizzati in Search Console. E poi, quando li controlli individualmente, vengono effettivamente indicizzati. Non so ancora esattamente cosa sta succedendo lì. […] Il mio sospetto è che sia più una questione di tempi: li mostriamo nel rapporto di Search Console e poi vengono indicizzati nel tempo. Poi, a un certo punto, avrebbero abbandonato di nuovo il rapporto. E per qualsiasi motivo, abbandonare gli studi richiede un po' più di tempo del dovuto.fonte: John Mueller
Come ha detto John, potrebbe trattarsi semplicemente di un problema di ritardo e di sincronizzazione dei dati tra questi due strumenti e lo stato potrebbe essere aggiornato nel tempo nel rapporto sulla copertura dell'indice.
Tuttavia, non è sempre solo un ritardo. A volte è un bug di segnalazione.
A settembre, abbiamo notato che alcuni dei nostri articoli indicizzati riportavano la scansione, al momento non indicizzata.
Con GSC puoi controllare quali delle tue pagine sono sottoposte a scansione ma non sono ancora indicizzate da Google.
GSC ha elencato alcuni dei nostri articoli come sottoposti a scansione, al momento non indicizzati.
Tuttavia, lo strumento Controllo URL li mostra come indicizzati.
E sono effettivamente indicizzati.
Qualche approfondimento, #SEOTwitter? pic.twitter.com/xKv0IYpGLa
— Onely (@OnelyCom) 16 settembre 2021
Sicuramente non era un problema di ritardo poiché anche i vecchi articoli erano interessati.
Poco dopo, altri SEO, tra cui Lily Ray, hanno iniziato a notare proprio questo problema.
Altri hanno già twittato su questo, ma vedo molti esempi di URL nel rapporto "Crawled, Not Indexed" di GSC (con date di scansione recenti) che sono, di fatto, URL indicizzati.
L'ispezione di singoli URL spesso porta al messaggio di seguito.
Pensieri @danielwaisberg @googlesearchc? pic.twitter.com/i1XfcvldEq
— Lily Ray (@lilyraynyc) 28 settembre 2021
Cosa fare in questa situazione? Di quale rapporto fidarsi?
In genere, lo strumento Controllo URL mostra dati più aggiornati rispetto al rapporto Copertura dell'indice. Ecco perché dovresti sempre fidarti di più dello strumento Controllo URL quando sei costretto a scegliere tra questi rapporti.
Cause e soluzioni per lo stato sottoposto a scansione: attualmente non indicizzato
Ora, andiamo al fondo del problema: cosa fa apparire lo stato e cosa puoi fare per risolverlo.
Google non fornisce una risposta chiara sul motivo per cui la tua pagina è stata scansionata ma non indicizzata, ma ci sono alcuni possibili motivi per cui lo stato potrebbe essere visualizzato, tra cui:
- Ritardo di indicizzazione,
- La pagina non soddisfa gli standard di qualità,
- La pagina è stata deindicizzata,
- Problema di architettura del sito web,
- Problemi di contenuto duplicato.
Ritardo di indicizzazione
Non è raro che Google visiti una pagina, ma ci vuole del tempo per indicizzarla. Internet è infinitamente grande e Google deve dare la priorità a quali pagine vengono indicizzate per prime.
Nella mia mostrato quanto tempo impiegano le pagine di siti Web popolari per essere indicizzate. Ecco alcuni dei risultati della mia indagine:
- Google indicizza solo il 56% degli URL indicizzabili dopo 1 giorno dalla pubblicazione.
- Dopo 2 settimane, solo l'87% degli URL viene indicizzato.
fonte: Tomek Rudzki
Se hai appena pubblicato la tua pagina, potrebbe essere perfettamente normale che non sia ancora indicizzata e devi aspettare un po' di più prima che Google indicizzi i tuoi contenuti.
Soluzione
Non puoi influenzare la scansione e l'indicizzazione della tua pagina a breve termine, ma ci sono alcune cose che puoi fare per aiutare il tuo sito web a lungo termine:
- Crea una strategia di indicizzazione per aiutare Google a dare la priorità alle pagine giuste del tuo sito. Per fare ciò, devi decidere quali pagine devono essere indicizzate e il metodo migliore per comunicarlo a Google.
- Assicurati che ci siano collegamenti interni alle pagine che ti interessano. Aiuterà Google a trovare le pagine e a saperne di più sul loro contesto.
- Crea una mappa del sito ben ottimizzata. È un semplice file di testo che elenca i tuoi preziosi URL. Google lo utilizzerà come tabella di marcia per trovare le pagine più velocemente.
La pagina non soddisfa gli standard di qualità
Google non può indicizzare tutte le pagine su Internet. Il suo spazio di archiviazione è limitato ed è per questo che deve filtrare i contenuti di bassa qualità.

L'obiettivo di Google è fornire pagine della massima qualità che rispondano al meglio alle intenzioni degli utenti. Significa che se una pagina è di qualità inferiore, molto probabilmente Google la ignorerà per lasciare lo spazio di archiviazione disponibile per contenuti di qualità superiore. E possiamo aspettarci che gli standard di qualità diventino solo più severi in futuro.
Soluzione
Come proprietario di un sito web, dovresti assicurarti che la tua pagina fornisca contenuti di alta qualità. Verifica se è probabile che soddisfi le intenzioni dei tuoi utenti e aggiungi contenuti di buona qualità, se necessario. Google offre un elenco di domande per aiutarti a determinare il valore dei tuoi contenuti. Ecco qui alcuni di loro:
- Il contenuto fornisce informazioni originali, rapporti, ricerche o analisi?
- Il contenuto fornisce analisi approfondite o informazioni interessanti che vanno oltre l'ovvio?
- È questo il tipo di pagina che vorresti aggiungere ai preferiti, condividere con un amico o consigliare?
- Se il contenuto attinge ad altre fonti, evita semplicemente di copiare o riscrivere tali fonti e fornisce invece un sostanziale valore aggiuntivo e originalità?
fonte: Google
Inoltre, puoi utilizzare i suggerimenti sui contenuti di qualità dalle Linee guida per i valutatori della qualità di Google. Anche se il documento è destinato principalmente ai valutatori della qualità della ricerca per valutare la qualità di un sito Web, i webmaster possono utilizzarlo per ottenere alcune informazioni su come migliorare i propri siti. Se vuoi saperne di più, consulta la nostra guida sulle Linee guida per i valutatori della qualità.
Contenuto generato dall'utente
Il contenuto generato dagli utenti potrebbe essere un problema dal punto di vista della qualità.
Ad esempio, supponiamo che tu abbia un forum e che qualcuno faccia una domanda. Anche se potrebbero esserci molte risposte preziose in futuro, al momento della scansione non ce n'erano, quindi Google potrebbe classificare la pagina come contenuto di bassa qualità.
Cosa fare per proteggersi da questa situazione?
Quora ha escogitato un'eccellente strategia per il problema. Ogni domanda senza risposta ha il prefisso "/senza risposta/" nell'URL.
Ecco un esempio: https://www.quora.com/unanswered/Are-you-really-happy-with-your-results
Il file robots.txt blocca tutte le pagine con /senza risposta/ nei rispettivi URL. Significa che Googlebot non può eseguirne la scansione.
Una volta che c'è una risposta alla domanda, l'URL cambia e diventa disponibile per la scansione. In questo modo, Quora blocca l'accesso ai contenuti di bassa qualità generati dagli utenti.
La pagina è stata deindicizzata
Un URL può soffrire dello stato Scansionato, attualmente non indicizzato perché indicizzato in passato, ma Google ha deciso di deindicizzarlo nel tempo.
Se ti chiedi perché alcune cose potrebbero scomparire dall'indice, è probabile che vengano semplicemente sostituite da contenuti di qualità superiore.
La selezione dell'indice, sebbene riguardi principalmente lo spazio (RAM/flash/disco), è strettamente legata alla qualità del contenuto. Se abbiamo tonnellate di spazio libero disponibile, è più probabile che indicizziamo contenuti più scadenti. In caso contrario, potremmo deindicizzare le cose per fare spazio a documenti di qualità superiore. pic.twitter.com/jRMkEqdft0
— Gary 鯨理/경리 Illyes (@metodo) 15 maggio 2020
Inoltre, dovresti prestare attenzione agli aggiornamenti degli algoritmi. È possibile che sia stato implementato un nuovo algoritmo e che la tua pagina ne sia stata influenzata.
Sfortunatamente, la deindicizzazione potrebbe anche essere causata da un bug da parte di Google. Ad esempio, Search Engine Land una volta è stato deindicizzato perché Google presumeva erroneamente che il sito fosse violato.
Soluzione
La soluzione per le pagine deindicizzate è strettamente correlata alla sua qualità. Dovresti sempre assicurarti che la tua pagina offra contenuti della migliore qualità e sia aggiornata. Non dare per scontato che una volta che una pagina è stata indicizzata, non devi più fare nulla con essa. Continua a monitorarlo e implementa modifiche e miglioramenti se necessario.
[…]le pagine che cadono dopo un aggiornamento principale non hanno nulla di sbagliato da correggere. Detto questo, comprendiamo che coloro che se la cavano meno bene dopo una modifica dell'aggiornamento di base potrebbero ancora sentire la necessità di fare qualcosa. Ti suggeriamo di concentrarti sull'assicurarti di offrire il miglior contenuto possibile. Questo è ciò che i nostri algoritmi cercano di premiare.fonte: Google
Dopo aver risolto i problemi, puoi inviare tali URL a Google Search Console per aiutare Google a notare le modifiche più rapidamente.
Problema di architettura del sito web
Quando a John Mueller è stato chiesto dei possibili motivi per cui una pagina è stata contrassegnata con lo stato Scansionato, al momento non indicizzato, ha menzionato un'altra possibile causa: la struttura del sito Web scadente.
Non puoi forzare l'indicizzazione delle pagine: è normale che non indicizziamo tutte le pagine su tutti i siti web. Non è un problema con "quella pagina", è più a livello di sito. Creare una buona struttura del sito e assicurarsi che il sito sia della massima qualità possibile è essenzialmente la direzione.
— johnmu.xml (personale) (@JohnMu) 28 giugno 2021
Immaginiamo una situazione in cui hai una pagina di buona qualità, ma l'unico modo in cui Google l'ha trovata è perché la metti nella tua mappa del sito.
Google potrebbe guardare la pagina ed eseguirne la scansione, ma poiché non ci sono collegamenti interni, presumerebbe che la pagina abbia un valore inferiore rispetto ad altre pagine. Non ci sono informazioni semantiche o strutturali per aiutarlo a valutare la pagina. Questo potrebbe essere uno dei motivi per cui Google ha deciso di concentrarsi su altre pagine e di lasciare questa fuori dall'indice dopo averla scansionata.
Soluzione
Una buona architettura del sito web è la chiave per aiutarti a massimizzare le possibilità di essere indicizzato. Consente ai robot dei motori di ricerca di scoprire i tuoi contenuti e comprendere meglio la relazione tra le pagine.
Ecco perché è fondamentale fornire una buona architettura del sito Web e assicurarsi che siano presenti collegamenti interni alla pagina che si desidera indicizzare.
Se vuoi saperne di più sulla struttura del sito Web, consulta il nostro articolo su Come creare un sito Web che classifica e converte.
Contenuto duplicato
Adam Gent, un freelance SEO, ha condiviso un caso interessante con la community SEO. La sua pagina riportava la scansione, al momento non indicizzata perché Google pensava che fosse una pagina duplicata.
Google vuole presentare agli utenti contenuti unici e di valore. Ecco perché quando si rende conto durante la scansione che alcune pagine sono identiche o quasi identiche, potrebbe indicizzarne solo una.
Di solito, l'altro viene etichettato come "Duplicato" nel rapporto sulla copertura dell'indice. Tuttavia, non è sempre così e talvolta Google assegna invece lo stato Scansionato, attualmente non indicizzato.
Non è del tutto chiaro il motivo per cui Google potrebbe scegliere Scansionato, al momento non indicizzato su uno stato dedicato per i contenuti duplicati. Una delle possibili spiegazioni è che lo stato cambierà in seguito dopo che Google avrà deciso se ce n'è uno più adatto per la pagina.
Un'altra opzione potrebbe essere un bug di segnalazione . Google potrebbe semplicemente commettere un errore durante l'assegnazione degli stati. Sfortunatamente, la situazione è più difficile perché Scansionato - attualmente non indicizzato non fornisce tante informazioni quanto uno stato dedicato per i contenuti duplicati.
Come verificare se una pagina duplicata viene visualizzata nei risultati della ricerca?
- Vai alla pagina che non è indicizzata e copia un frammento di testo casuale.
- Incolla il testo in Ricerca Google tra virgolette.
- Analizza i risultati. Se viene visualizzato un URL diverso con il testo copiato, potrebbe significare che la tua pagina non è indicizzata perché Google ha scelto un URL diverso da indicizzare.
Soluzione
Innanzitutto, dovresti assicurarti di creare pagine originali. Se necessario, aggiungi contenuti unici.
Sfortunatamente, i contenuti duplicati potrebbero essere inevitabili (ad esempio, hai una versione mobile e desktop). Non hai molto controllo su ciò che appare nei risultati di ricerca, ma puoi dare a Google alcuni suggerimenti sulla versione originale.
Se noti molti contenuti duplicati indicizzati, valuta i seguenti elementi:
- Tag canonici: questi tag HTML indicano ai motori di ricerca quali versioni sono quelle originali.
- Collegamenti interni: assicurati che i collegamenti interni puntino al tuo contenuto originale. Google potrebbe usarlo come indicatore di quale pagina è più importante.
- Mappe del sito XML: assicurati che solo la versione canonica sia nella tua mappa del sito.
Ricorda che questi sono solo suggerimenti e Google non è obbligato a seguirli. Nel caso descritto da Adam Gent, Google ha scelto la versione del feed RSS da indicizzare, anche se molti segnali di canonizzazione puntavano a un URL originale diverso. Adam ha risolto il problema impostando un 404 per garantire che solo la versione originale rimanesse. Ha anche suggerito che l'impostazione di un'intestazione HTTP di X-robots su tutti gli URL dei feed ne impedirebbe l'indicizzazione.
Scansionato - attualmente non indicizzato e rilevato - attualmente non indicizzato
Lo stato Scansionato - attualmente non indicizzato è comunemente confuso con un altro problema di indicizzazione nel rapporto Copertura dell'indice: Rilevato - attualmente non indicizzato.
Entrambi gli stati indicano che la pagina non è indicizzata. Tuttavia, nel caso di Scansionato, attualmente non indicizzato, Google ha già visitato la pagina. Nel frattempo, in Discovered, attualmente non indicizzato, l'URL è noto a Google, ma, per qualche motivo, non è stato ancora scansionato.
| Scansionato: al momento non indicizzato | Scoperta - attualmente non indicizzata | |
| Pagina scoperta da Google | sì | sì |
| Pagina visitata da Google | sì | No |
| Pagina indicizzata | No | No |
Alcuni dei motivi di questi stati potrebbero essere simili, tra cui pagine di scarsa qualità e problemi di collegamento interno. Tuttavia, quando viene visualizzato uno stato Rilevato - attualmente non indicizzato, è necessario indagare ulteriormente sul motivo per cui Google non ha potuto o non ha voluto accedere alla pagina. Ad esempio, potrebbe indicare problemi con la qualità complessiva dell'intero sito Web, problemi di budget di scansione o sovraccarico del server.
Avvolgendo
Scansionato: attualmente non indicizzato è principalmente associato alla qualità della pagina, ma in realtà può indicare molti più problemi, come l'architettura del sito Web o il contenuto duplicato.
Ecco i punti chiave dell'articolo che possono aiutarti a gestire lo stato Scansionato - attualmente non indicizzato:
- Aggiungi contenuti unici e di valore alle tue pagine. Dopo averlo fatto, invia quegli URL a Google Search Console. In questo modo, Google potrebbe notare i cambiamenti più rapidamente.
- Rivedi l'architettura del tuo sito web e assicurati che ci siano collegamenti interni alle tue pagine preziose.
- Decidi quali pagine devono e non devono essere indicizzate per aiutare Google a dare la priorità agli URL più preziosi.
Se hai bisogno di aiuto per affrontare lo stato Scansionato — attualmente non indicizzato sul tuo sito web, i nostri servizi tecnici SEO sono quello che stai cercando.
