Come controllare lo stato di indicizzazione di un sito Web di grandi dimensioni

Pubblicato: 2022-02-04

Prima che le tue pagine appaiano nei risultati di ricerca e portino traffico al tuo sito, devono essere indicizzate.

Sfortunatamente, essere indicizzati è una sfida, soprattutto se hai un sito Web di grandi dimensioni. Secondo la nostra ricerca, il 16% delle pagine di valore sui siti Web non è indicizzato.  

Prima di adottare misure per migliorare l'indicizzazione e le prestazioni di ricerca del tuo sito, è fondamentale controllare la copertura dell'indice del tuo sito e identificare quali delle tue pagine sono indicizzate correttamente e quali no.

Una sfida che potresti dover affrontare è trovare metodi affidabili per controllare lo stato di indicizzazione del tuo sito che ti consentano di analizzare gli URL in blocco. Se questo è il caso, sei nel posto giusto.

Esistono alcuni strumenti utili che possono aiutarti a determinare la copertura dell'indice del tuo sito, ma anche a un'analisi più approfondita di ciascun URL per identificare il motivo per cui non è indicizzato.

Segui i miei consigli in questo articolo per scoprire come controllare lo stato di indicizzazione di un sito Web di grandi dimensioni, analizzare i problemi che impediscono l'indicizzazione delle pagine e trovare le soluzioni giuste.

I contenuti si nascondono
1 Cosa fare prima di controllare lo stato di indicizzazione del tuo sito web
2 Metodi per controllare lo stato dell'indicizzazione e diagnosticare i problemi di indicizzazione
2.1 Il comando “sito:”.
2.2 Strumenti in Google Search Console
2.2.1 Il rapporto sulla copertura dell'indice
2.2.2 Strumento di ispezione degli URL
2.2.3 API di controllo URL
2.2.4 Limitazioni degli strumenti di Google Search Console
2.2.5 Segnala un problema di indicizzazione
2.3 Chiusura lampo
2.3.1 Analizzare la copertura dell'indice
2.3.2 Monitorare i ritardi di indicizzazione
2.3.3 Avvisi sui contenuti non indicizzati
2.3.4 Indicizzazione JavaScript
2.3.5 Ulteriori informazioni sulle pagine non indicizzate
2.4 Strumenti per i Webmaster di Bing
2.4.1 Esplora sito
2.4.2 Strumento di controllo URL di Bing
3 Problemi di indicizzazione comuni per i siti Web di grandi dimensioni
4 Come affrontare i problemi di indicizzazione
4.1 Assicurati che le tue pagine siano indicizzabili
4.1.1 Le direttive specificate nel file robots.txt
4.1.2 Se le pagine contengono tag noindex
4.2 Assicurati che tutte le pagine importanti siano inviate in una mappa del sito
4.3 Regola il tuo collegamento interno
4.4 Risolvi i problemi di contenuto duplicato
4.5 Segui le migliori pratiche di JavaScript SEO per scansionare e indicizzare più facilmente
4.6 Ottimizza il tuo budget di scansione
5 da asporto

Cosa fare prima di controllare lo stato di indicizzazione del tuo sito web

Prima di controllare lo stato dell'indicizzazione e affrontare i problemi, è necessario disporre di una strategia di indicizzazione adeguata.

Creandolo, puoi determinare quali pagine sono essenziali e dovrebbero essere indicizzate e quali dovrebbero essere escluse dall'indicizzazione.

Alcune delle tue pagine possono essere di scarsa qualità o contenere contenuti duplicati e gli utenti non dovrebbero trovarle nei risultati di ricerca. Di norma, questi sono i tipi di pagine che dovrebbero essere mantenute fuori dall'indice.

Ecco alcuni esempi di pagine che non dovrebbero essere indicizzate:

  • Contenuti archiviati,
  • Pagine protette da login e password,
  • URL con parametri aggiunti, creati a seguito di ordinamento o filtraggio,
  • Risultati di ricerca interni,
  • Grazie pagine.

Se non vuoi che una pagina venga indicizzata, puoi:

  • Includere le direttive appropriate per i bot nel file robots.txt per impedire loro di eseguire la scansione di una determinata pagina,
  • Implementa il tag noindex per impedire ai bot dei motori di ricerca di indicizzare una pagina.

Gli URL che non sono stati indicizzati e dovrebbero rimanere in questo modo non richiedono la tua attenzione. Invece, concentrati sulle pagine che non sono indicizzate ma dovrebbero esserlo.

Come regola generale, dovresti mirare ad avere le versioni canoniche delle tue pagine indicizzate e dovrebbero essere inviate nella tua mappa del sito.  

Quindi, come puoi scoprire esattamente quali pagine sono indicizzate e quali no?

Metodi per controllare lo stato dell'indicizzazione e diagnosticare i problemi di indicizzazione

Ci sono alcuni strumenti utili per controllare la copertura dell'indice del tuo sito.

Ma tieni presente che la maggior parte di essi ha limitazioni per il numero di URL che puoi controllare. Quando cerchi online, potresti imbatterti in molti strumenti inaffidabili.

Ti mostrerò quali strumenti mostrano le informazioni più accurate e soluzioni alternative per estenderne i limiti.  

Inoltre, ti presenterò un nuovo strumento di analisi dell'indicizzazione sviluppato dalla nostra consociata, ZipTie.

Il comando "sito:".

Un metodo popolare per controllare il numero di pagine indicizzate di un sito consiste nell'inserire il comando "site:" in Ricerca Google, seguito dal nome di dominio, ad esempio "site:onely.com".

Sebbene ti permetta di controllare lo stato di indicizzazione di un sito Web, i dati che vedrai possono essere fuorvianti o imprecisi, poiché i numeri sono solo stime.

Questo metodo sarà particolarmente impreciso per i siti Web di grandi dimensioni con contenuti che cambiano dinamicamente.

Può succedere che ogni volta che lo utilizzi, i risultati mostrino un numero completamente diverso di pagine indicizzate per il tuo dominio.

Tuttavia, sebbene il comando "site:domain" sia tutt'altro che ottimale, puoi utilizzare il comando "site:URL", in cui inserisci un URL specifico anziché un nome di dominio. Puoi quindi scoprire se l'URL specifico è stato indicizzato.

John Mueller ha consigliato questa soluzione:

Strumenti in Google Search Console

Google Search Console offre strumenti molto migliori per controllare la copertura dell'indice.

Se non li usi già regolarmente, inizia subito: dovrebbero diventare i tuoi strumenti di monitoraggio SEO standard.

Consentitemi di descriverli in modo più dettagliato e di consigliarvi come sfruttarli al meglio su un sito Web di grandi dimensioni.

Il rapporto sulla copertura dell'indice

Il rapporto sulla copertura dell'indice in Google Search Console ti fornisce i dati di Google su quali pagine sono indicizzate.

Inoltre, ti fornisce informazioni dettagliate sugli stati specifici dei tuoi URL per quanto riguarda la loro individuazione, scansione e indicizzazione e, se applicabile, il problema riscontrato da Google che impedisce loro di essere indicizzati.

stati del rapporto di copertura dell'indice

Il rapporto sulla copertura dell'indice mostra quattro stati:

  • Errore: la pagina non viene indicizzata a causa di un errore.
  • Avviso: la pagina è indicizzata, ma Google ha rilevato un problema di cui dovresti essere a conoscenza,
  • Escluso: la pagina non è indicizzata, ma Google ritiene che tu intendessi mantenerla non indicizzata.
  • Valido: la pagina viene indicizzata senza problemi.

Nell'angolo in alto a sinistra, puoi scegliere tra mostrare "Tutte le pagine conosciute" - che significa tutti gli URL che Google ha scoperto in qualsiasi modo - o "Tutte le pagine inviate" - pagine che Google ha trovato nella tua mappa del sito.

La vista "Tutte le pagine inviate" dovrebbe contenere tutte le pagine che desideri vengano indicizzate. Dovresti confrontare questa visualizzazione con "Tutte le pagine conosciute".

Se alcune pagine vengono visualizzate in "Tutte le pagine conosciute" ma non in "Tutte le pagine inviate" e devono essere indicizzate, inseriscile nella tua mappa del sito. Se non devono essere indicizzati, significa che Google li sta trovando altrove, magari tramite link.

Il limite principale del rapporto è che ogni rapporto che mostra problemi specifici mostra solo 1000 pagine. Fortunatamente, ci sono modi per aggirarlo.

Una soluzione è creare proprietà di dominio separate per diverse sezioni del tuo sito web.

Un'alternativa sarebbe quella di dividere le tue pagine creando più mappe del sito e restringendo il rapporto a una mappa del sito separata.

filtro alle mappe del sito

È consigliabile che ogni mappa del sito contenga un massimo di 50000 URL.

Ci sono molti punti di vista per dividere le pagine tra le mappe del sito. Considera la possibilità di organizzarli in modo da aiutarti a raggruppare tipi di contenuti simili per un'analisi più semplice.

Ecco alcuni suggerimenti:

  • Sitemap separate per diversi tipi di contenuto, ad es. categorie, prodotti, post di blog,
  • Sitemap separate per una quantità o tipo di prodotti selezionati,
  • Sitemap separate per le varie versioni linguistiche del sito.

Ora scegli una delle mappe del sito e vai alla sezione Esclusi del rapporto.

Esamina i problemi visualizzati: sulla destra, puoi vedere il numero di pagine interessate e scoprire quali sono i problemi più comuni.

problemi nel rapporto sulla copertura dell'indice di google

Gli stati del rapporto descrivono le cause di ciascun problema in modo abbastanza descrittivo e, nella maggior parte dei casi, indicano le azioni necessarie per risolverli.

Esamina come affrontare ogni stato nella mia guida completa al rapporto sulla copertura dell'indice di Google Search Console.

Cerca i modelli nelle pagine escluse. Se molte pagine hanno contenuti o layout simili, rivedere solo una parte degli URL può darti un'idea di ciò con cui le pagine rimanenti potrebbero avere problemi.

Strumento di controllo URL

Un'altra funzione utile disponibile in Google Search Console è lo strumento Controllo URL.  

Ti consente di verificare se un URL specifico è nell'indice di Google e visualizzare tonnellate di informazioni aggiuntive. Puoi utilizzare questo strumento per integrare i dati che ricevi dal rapporto sulla copertura dell'indice.

strumento di controllo URL

Ecco una panoramica delle funzioni più importanti dello strumento Controllo URL:

  • Lo stato di presenza : indipendentemente dal fatto che l'URL sia idoneo o meno a comparire nei risultati di ricerca di Google e qualsiasi avviso o errore rilevato da Google.
  • Visualizza la pagina sottoposta a scansione : dettagli tecnici come la risposta HTML e HTTP che Google ha ricevuto.
  • Richiedi indicizzazione : utilizzalo per chiedere a Google di eseguire nuovamente la scansione e reindicizzare il tuo URL. C'è un limite giornaliero per questa funzione. Sebbene non sia esplicitamente specificato nella documentazione di Google, è menzionato come metodo per inviare "solo alcuni URL". Può consentire di inviare fino a 50 URL .
  • Dettagli sullo stato di copertura di una pagina, ovvero:
  1. Se una mappa del sito nota punta all'URL,
  2. La pagina di riferimento – una pagina che Google avrebbe potuto utilizzare per scoprire l'URL,
  3. Quando la pagina è stata scansionata l'ultima volta,
  4. Se una pagina è scansionabile,
  5. Se una pagina può essere recuperata dal server,
  6. Se una pagina è indicizzabile,
  7. L'URL canonico dichiarato dall'utente,
  8. L'URL canonico selezionato da Google.
  • Miglioramenti : questa sezione mostra se Google ha trovato dati strutturati validi su una pagina, nonché dettagli sull'usabilità mobile di una pagina e AMP.
  • Prova URL in tempo reale: puoi eseguire un test in tempo reale su un URL, ad esempio se desideri convalidare correzioni o modifiche.

Lo strumento Controllo URL richiede di controllare lo stato di indicizzazione per URL, il che può richiedere molto tempo se si dispone di un sito Web di grandi dimensioni.

Tuttavia, l'analisi di un campione di pagine può già indicarti quali problemi sta affrontando il tuo sito.

Invece di controllare tutti gli URL, puoi selezionare e controllare una parte degli URL che sono stati esclusi dall'indice di Google. Puoi anche raccogliere URL che dovrebbero essere indicizzati ma non ricevono traffico organico.

Inoltre, il tuo sito potrebbe avere le seguenti sezioni:

  • esempio.com/negozio
  • esempio.com/blog
  • esempio.com/galleria.

Puoi scegliere un numero di URL da analizzare da ciascuna sezione distintiva. Ma non limitarti a selezionare alcuni URL: utilizza un campione rappresentativo per ciascuna sezione.

API di controllo URL

Nel 2022 Google ha annunciato il rilascio dell'API URL Inspection, che consente di inviare fino a 2000 richieste al giorno per una singola proprietà di Google Search Console.

Questa è un'ottima notizia per tutti coloro che hanno trovato utili i dati dello Strumento di ispezione degli URL ma hanno faticato a controllare un solo URL alla volta. Accedendo ai dati dell'ispezione URL tramite un'API, puoi automatizzare il processo, il che apre molteplici nuove possibilità di utilizzo di queste informazioni.

Limitazioni degli strumenti di Google Search Console

Gli strumenti di Google Search Console non sono privi di difetti.

Nell'ottobre 2021, gli utenti hanno segnalato di aver visto gli URL nel rapporto sulla copertura dell'indice contrassegnati come " Scansionati - attualmente non indicizzati ". Tuttavia, se esaminati con lo strumento Controllo URL, questi URL erano elencati come "Inviati e indicizzati" o in un altro stato.

Google ha risposto che questa situazione non è un bug ma piuttosto una limitazione del rapporto sulla copertura dell'indice:

Segnala un problema di indicizzazione

Google ha annunciato nell'aprile 2021 che stava introducendo una funzione chiamata Segnala un problema di indicizzazione per aiutare gli utenti a informare Google di un problema di indicizzazione. La funzione è attualmente disponibile negli Stati Uniti.

Gli utenti possono accedere a un modulo e selezionare se il loro sito o le pagine non sono indicizzati o sono indicizzati ma non sono classificati correttamente. Saranno quindi guidati attraverso le opzioni di risoluzione dei problemi relative al problema segnalato.

Se queste soluzioni falliscono, possono segnalare il problema direttamente a Google.

Tuttavia, questa funzione dovrebbe essere considerata come l'ultima risorsa e non è garantito che Google seguirà la tua richiesta e indicizzerà i tuoi contenuti.

Google mira a indicizzare solo i contenuti più pertinenti e di alta qualità. Pertanto, seguire le best practice e ottimizzare le tue pagine per renderle scansionabili, indicizzabili e degne dell'attenzione di Google può dare al tuo sito risultati duraturi.

cerniera lampo

ZipTie offre un assortimento di funzionalità complete per l'analisi dello stato di indicizzazione di qualsiasi sito Web, indipendentemente dalle sue dimensioni. Lo strumento è particolarmente vantaggioso per i siti Web di grandi dimensioni di tipo aziendale.

Ecco esattamente cosa offre ZipTie:

Analizza la copertura dell'indice

La caratteristica principale di ZipTie è che ti dice quali pagine non sono state indicizzate da Google.  

E, cosa fondamentale, non c'è limite al numero di URL che ZipTie può analizzare. Questo è importante per i siti Web di grandi dimensioni con migliaia o milioni di URL che non possono essere valutati con successo utilizzando altri strumenti.

Fondamentalmente, puoi controllare la copertura dell'indice di qualsiasi dominio, non solo il tuo ma anche quello del tuo concorrente. Quindi, confronta il tuo stato di indicizzazione con i domini concorrenti e vedi quali aree dovresti migliorare per andare avanti.

Monitorare i ritardi di indicizzazione

ZipTie ti consente di monitorare i ritardi di indicizzazione e di stimare quando i tuoi contenuti appena pubblicati verranno indicizzati e quando puoi aspettarti che portino traffico.

Questo viene fatto analizzando i nuovi URL aggiunti alle tue sitemap e studiando il tempo che intercorre tra la pubblicazione del contenuto e il momento in cui appare nei risultati di ricerca.

Avvisi sui contenuti non indicizzati

ZipTie ti aggiornerà sulla quantità di contenuto che è stato deindicizzato. Le pagine che sono già state indicizzate potrebbero essere eliminate dall'indice di Google dopo un po' di tempo: questa funzione ti consente di reagire rapidamente quando accade.

Indicizzazione JavaScript

L'indicizzazione di pagine basate su JavaScript è complicata, ma ZipTie offre una mano.

In particolare, ZipTie può determinare se Google ha indicizzato particolari frammenti di pagina generati con JavaScript.

È fondamentale capire se Google ha problemi con il rendering e l'indicizzazione dei tuoi contenuti basati su JavaScript. In questo caso, ZipTie può farti sapere esattamente quali elementi della pagina sono problematici.

Ulteriori informazioni sulle pagine non indicizzate

Come bonus, ZipTie offre ulteriori informazioni sugli URL non indicizzati come il conteggio delle parole, i titoli, le intestazioni, il conteggio delle immagini, la meta descrizione e altro ancora. Ciò è significativo quando si esaminano le possibili cause dei problemi di indicizzazione e si identificano schemi tra pagine non indicizzate.

Puoi esportare i dati da ZipTie come file CSV e combinarli facilmente con i dati di altri strumenti, come Google Analytics o Google Search Console.

ZipTie non è ancora disponibile apertamente. Maggiori dettagli su di esso verranno rilasciati con l'avanzare dello sviluppo dello strumento. Puoi rimanere aggiornato sul lancio ufficiale iscrivendoti alla mailing list di ZipTie.  

Ma non devi aspettare.

Entra subito in contatto con il team di ZipTie per condurre un'analisi approfondita dello stato di indicizzazione del tuo sito web.

Strumenti per i Webmaster di Bing

Anche se apparire in Bing non è la tua priorità, Bing Webmaster Tools può aiutarti a ottenere informazioni dettagliate su tutti i tipi di problemi di indicizzazione, alcuni dei quali potresti riscontrare anche in altri motori di ricerca.

Esploratore del sito

Prima di tutto, diamo un'occhiata a Site Explorer.  

Lo strumento Site Explorer ti consente di navigare attraverso la struttura del tuo sito web e i dettagli sullo stato di indicizzazione delle pagine, tra gli altri dati:

bing esploratore di siti

Un aspetto che distingue Site Explorer è l'opzione per raggruppare gli URL per cartella, in cui ogni cartella può rappresentare un sottodominio o una parte del percorso dell'URL. Di conseguenza, hai accesso ai dati per un numero significativo di pagine.

Le informazioni di scansione a cui hai accesso includono:

  • Indicizzato : il numero di URL indicizzati all'interno di una determinata cartella,
  • Errore : errori di scansione critici che hanno portato alla mancata indicizzazione degli URL specificati,
  • Avviso : è stato riscontrato che questi URL presentano problemi con le linee guida, problemi di scansione temporanei, non consentiti in robots.txt, ecc. Monitora regolarmente questa sezione per individuare eventuali picchi o cali negli URL interessati,
  • Escluso : URL che sono stati esclusi dall'indice, ad esempio a causa di violazioni di spam o di basso rango.

Hai la possibilità di filtrare ulteriormente gli URL per visualizzare le pagine in base a caratteristiche specifiche.

bing filtra per

Questi filtri ti consentono di identificare gli URL che richiedono la tua attenzione e indirizzarti nella giusta direzione quando affronti i problemi di indicizzazione.

Strumento di controllo URL di Bing

Un'altra grande funzionalità è lo strumento Bing URL Inspection che integra Site Explorer. Ti consente di verificare se un URL specifico è nell'indice di Bing e se sono stati rilevati errori di indicizzazione o scansione.

Incolla un URL nello strumento: vedrai quindi molte informazioni supplementari.

Nella sezione Scheda indice , puoi visualizzare lo stato di indicizzazione di un URL e i dettagli su di esso, ad esempio quando l'URL è stato rilevato e come è stata scansionata.

È inoltre possibile visualizzare il codice HTML della pagina e la risposta HTTP ricevuta dal sistema.

strumento di ispezione URL bing

Se l'URL non è stato indicizzato a causa di errori, potrai intraprendere ulteriori azioni, come richiedere l'indicizzazione di un URL, contattare l'assistenza, apportare modifiche al tuo file robots.txt, ecc.

Bing fornisce indicazioni sul motivo per cui una pagina potrebbe non essere indicizzata : ecco alcuni motivi:

  • Nessun link punta alla tua pagina,
  • La pagina non soddisfa le soglie di qualità,
  • Le direttive Robots.txt stanno bloccando la scansione della pagina,
  • Ci sono altri problemi di scansione con la pagina: la funzione URL live ti aiuterà a esaminarla ulteriormente,
  • La pagina ha un tag noindex che ne impedisce l'indicizzazione,
  • L'URL non è stato ancora individuato e scansionato e richiede semplicemente più tempo,
  • La pagina viola le linee guida sulla qualità ed è stata penalizzata e rimossa dall'indice.

Puoi inoltre utilizzarlo come punto di riferimento durante la diagnosi di problemi di indicizzazione in altri motori di ricerca, come Google.

Se gli URL non sono indicizzati e dovrebbero esserlo, Bing ti consente di inviare URL per l'indicizzazione .

L'importante è che il limite sia relativamente alto: puoi inviare fino a 10000 URL al giorno. Ciò supera di gran lunga il limite segnalato da Google di un massimo di 50 URL.

Problemi di indicizzazione comuni per siti Web di grandi dimensioni

I problemi di indicizzazione si verificano sulla maggior parte dei siti e possono avere un effetto disastroso sulle prestazioni di ricerca organica del tuo sito.

Tomek Rudzki ha esaminato i problemi di indicizzazione più comuni per le diverse dimensioni del sito web.

Attraverso la sua ricerca, ora sappiamo che i siti Web di grandi dimensioni in genere soffrono dei seguenti problemi:

  • Scansionato: attualmente non indicizzato,
  • Scoperta – attualmente non indicizzata,
  • contenuto duplicato,
  • morbido 404,
  • Problemi di scansione.

Un altro problema tipico riguarda i collegamenti interni. Googlebot deve seguire un percorso per trovare una pagina: se non è collegata ad altre pagine, potrebbe essere tenuta fuori dall'indice.

Come affrontare i problemi di indicizzazione

Puoi adottare misure per massimizzare le possibilità di ottenere l'indicizzazione delle tue pagine.

Queste soluzioni sono utili anche quando trovi URL non indicizzati e non riesci a identificare il motivo per cui non sono indicizzati.

Assicurati che le tue pagine siano indicizzabili

Scoprire se le tue pagine sono indicizzabili consiste nell'esaminare due aspetti:

Le direttive specificate nel tuo file robots.txt

Il file robots.txt contiene le istruzioni per i crawler web su ciò che dovrebbe essere scansionato su un sito. Assicurati che non vi sia alcuna direttiva "Disallow" che impedisca la scansione delle tue pagine preziose.  

Se le pagine contengono tag noindex

I tag Noindex consentono ai bot dei motori di ricerca di visitare le pagine ma impediscono loro di essere indicizzati.

Per verificare in blocco se le tue pagine sono indicizzabili, utilizza un crawler SEO, ad esempio Screaming Frog.  

Puoi incollare un elenco dei tuoi URL nello strumento e avviare la scansione. Al termine, guarda la colonna Indicizzabilità, che ti dirà se una pagina è indicizzabile o non indicizzabile.

indicizzabilità della rana urlante

Assicurati che tutte le pagine importanti siano inviate in una mappa del sito

Controlla se le pagine non indicizzate sono state inviate in una mappa del sito , in caso contrario, aggiungile di conseguenza.

Inoltre, assicurati che le tue Sitemap non contengano URL che non dovrebbero essere indicizzati in primo luogo. Consentire ai motori di ricerca di scoprire ed eseguire la scansione di pagine irrilevanti può portare a una scansione inefficiente e prolungare il tempo necessario ai bot per trovare i tuoi contenuti della massima qualità.

Se non hai una mappa del sito, puoi crearla facilmente o utilizzare strumenti dedicati che la manterranno aggiornata, come Yoast SEO o Screaming Frog's SEO Spider . Puoi anche utilizzare uno degli strumenti del generatore di mappe del sito.  

La nostra guida definitiva alle mappe del sito sarà la tua risorsa numero uno per la creazione di una mappa del sito ottimizzata.

Modifica il tuo collegamento interno

Il collegamento interno è un aspetto cruciale del tuo sito dal punto di vista SEO.

Includere semplicemente un URL in una mappa del sito non è sufficiente per Google. Googlebot deve essere sicuro che un URL meriti la sua attenzione, per questo motivo deve trovare segnali che ne evidenzino l'importanza.

Assicurati di non avere pagine orfane, ovvero pagine senza collegamenti in entrata. Puoi eseguire la scansione del tuo sito Web per trovare pagine orfane, ad esempio utilizzando il rapporto sulle pagine orfane di Screaming Frog.

Alcune idee per migliorare i tuoi collegamenti interni includono la creazione di sezioni per prodotti correlati o la scrittura di post di blog per collegarsi ad altre pagine del tuo sito.

È inoltre necessario disporre di un'architettura del sito Web pulita. Significa organizzare il contenuto del sito in modo che utenti e bot possano navigare in modo intuitivo e rapido in ogni sezione del tuo sito.

Risolvi i problemi di contenuto duplicato

Quando sul tuo sito sono presenti più versioni dello stesso contenuto o molto simili, i motori di ricerca potrebbero avere difficoltà a decidere quale pagina sia la versione più rappresentativa.

Per semplificare il lavoro dei motori di ricerca, implementa tag canonici che puntano agli URL canonici selezionati. Ogni versione della pagina dovrebbe avere un solo URL canonico.

Puoi utilizzare gli strumenti di Google Search Console per determinare se Google rispetta questo URL come quello canonico o se ha selezionato un URL diverso.

Assicurati che i tag canonical puntino costantemente alle pagine canoniche corrette. Se puntano a pagine duplicate, l'URL principale potrebbe rimanere non indicizzato.

Segui le best practice di JavaScript SEO per scansionare e indicizzare più facilmente

Sebbene i motori di ricerca siano migliorati molto nel rendering e nell'indicizzazione di JavaScript, la loro gestione non è ancora perfetta.

In genere, i motori di ricerca potrebbero non eseguire il rendering di JavaScript su una pagina se ritengono che non apporterà modifiche significative al suo contenuto. Inoltre, se le tue pagine hanno un aspetto completamente diverso con e senza JavaScript, potresti avere difficoltà a indicizzarle.

Esistono strumenti che puoi utilizzare per analizzare la tua indicizzazione JavaScript.

Puoi facilmente controllare quali parti della tua pagina si basano su JavaScript utilizzando il nostro strumento Cosa farebbe JavaScript .

Utilizza il test in tempo reale nello strumento Controllo URL di Google per vedere uno screenshot di come Googlebot visualizzerebbe esattamente il contenuto JavaScript sulla tua pagina. Puoi quindi andare alla scheda Ulteriori informazioni per cercare errori JavaScript.

L'opzione Visualizza pagina scansionata nello strumento Controllo URL ti dirà cosa Google ha scansionato sulla tua pagina e se tutto il contenuto JavaScript è presente.

In caso di problemi con l'indicizzazione JavaScript, fare riferimento al nostro articolo su JavaScript SEO per ulteriori indicazioni.

Ottimizza il tuo budget di scansione

Il budget di scansione è il numero di pagine di un sito Web che i motori di ricerca possono e vogliono scansionare.

Il budget di scansione del tuo sito può essere influenzato da numerosi fattori.

Per consentire una scansione efficiente delle tue pagine , segui queste linee guida generali:

  • Migliora le tue prestazioni web,
  • Ottimizza i file JavaScript e CSS sul tuo sito,
  • Evita reindirizzamenti interni e catene di reindirizzamento,
  • Modifica l'architettura del tuo sito,
  • Pulisci i tuoi collegamenti interni: aggiorna tutti i collegamenti che puntano a 404 pagine e collega frequentemente ai tuoi contenuti più importanti,
  • Avere una mappa del sito adeguatamente strutturata: puoi analizzare la struttura della tua mappa del sito utilizzando uno dei crawler SEO, come Ryte o Sitebulb.

Asporto

I siti Web di grandi dimensioni potrebbero avere difficoltà a ottenere l'indicizzazione di molte delle loro pagine. Ma ciò non significa che l'indicizzazione di tutti i tuoi contenuti di valore sia impossibile.

L'analisi dell'indicizzazione di un sito Web di grandi dimensioni potrebbe richiedere del lavoro. Tuttavia, le funzioni disponibili in Google Search Console e Bing Webmaster Tools ti forniranno informazioni utili su cui puoi iniziare immediatamente ad agire.

Penso che puoi aspettarti che ZipTie cambierà il gioco nel campo dell'indicizzazione : ti incoraggio a metterti in contatto con il team di ZipTie per un'analisi dell'indicizzazione.

E, se hai a che fare con problemi di indicizzazione su larga scala che non puoi iniziare ad affrontare, abbiamo visto tutto e ti diremo su quali punti dolenti concentrarti. Contattaci!