Come ottimizzare i contenuti duplicati per la SEO
Pubblicato: 2022-08-03Il contenuto duplicato è lo stesso contenuto o simile che esiste su più pagine, su un dominio o su diversi siti web.
Il contenuto duplicato è problematico per i motori di ricerca perché, quando vedono lo stesso contenuto in più posizioni, non sanno quale URL dovrebbe essere:
- indicizzato,
- Segnali di ranking pertinenti assegnati e
- Elencato più in alto nei risultati di ricerca.
Ciò può portare a classifiche più basse, budget di scansione sprecato e problemi di indicizzazione per il tuo sito web, dissipando di conseguenza il potenziale commerciale delle tue pagine .
Per il bene della tua attività, devi capire cosa può causare contenuti duplicati e come ottimizzare gli aspetti del tuo sito per scongiurare eventuali problemi: esploriamolo.
In che modo i contenuti duplicati influiscono sulla SEO
I contenuti duplicati non sono sempre un problema: se usi la SEO tecnica per tenerlo sotto controllo, non danneggerà il tuo traffico organico. Ma se lasci contenuti duplicati non ottimizzati, possono avere conseguenze mortali.
Ecco i principali modi in cui i contenuti duplicati possono influire negativamente sul tuo sito web:
Graduatorie più basse
Più versioni dello stesso contenuto fanno fatica ai motori di ricerca per decidere quale pagina deve essere indicizzata e presentata nei risultati di ricerca .
Quando questo è il caso, nessuna delle tue pagine duplicate potrebbe mai raggiungere completamente il suo potenziale di posizionamento, se viene scansionata e indicizzata in primo luogo.
Trasferimento ridotto dell'autorità di collegamento
I motori di ricerca possono avere difficoltà ad assegnare accuratamente i segnali di ranking dai backlink alle pagine duplicate .
Se lo stesso contenuto esiste su poche pagine, più URL possono ricevere link da altri domini. Ma l'autorità di collegamento totale verrà quindi suddivisa tra le pagine, limitando il potenziale di posizionamento del tuo contenuto.
Problemi di indicizzazione e crawl budget sprecato
Se hai un sito Web di grandi dimensioni, il crawl budget è spesso una preoccupazione. E i motori di ricerca possono sprecare il budget di scansione per eseguire la scansione di pagine duplicate .
Vuoi sempre che il budget di scansione venga speso per eseguire la scansione di contenuti di valore. Quando lasci contenuti duplicati non ottimizzati sul tuo dominio, i bot dei motori di ricerca potrebbero sprecare alcune delle loro risorse scansionando inutilmente lo stesso contenuto più e più volte.
Questo non solo ritarderà la loro scoperta di altri contenuti sul tuo sito, ma potrebbe anche scoraggiarli dal tornare sul tuo sito più spesso.
In tal caso, rischi di affrontare problemi di indicizzazione . Tieni presente che, il più delle volte, Google esaminerà i diversi segnali, come mappe del sito, link interni ed esterni, reindirizzamenti e altri, e sceglierà un URL tra i tanti da indicizzare. Il problema è che potrebbe non essere la versione che desideri indicizzare.
Se Google non è in grado di eseguire la scansione di alcune delle tue pagine, potresti avere difficoltà a indicizzare le tue pagine essenziali e uniche.
Inoltre, vedere grandi quantità di pagine duplicate può far sì che i motori di ricerca percepiscano l'intero sito web come di bassa qualità , supponendo che altre pagine contengano contenuti simili. Potrebbero quindi essere riluttanti ad allocare risorse per eseguire la scansione del tuo sito in futuro.
I contenuti duplicati possono comportare una sanzione di Google?
Potresti aver sentito opinioni contrastanti sul fatto che i contenuti duplicati possano farti ottenere una sanzione Google.
Il contenuto duplicato non penalizzerà il tuo sito a meno che non derivi da attività dannose .
Lo scraping del contenuto è un esempio di pratica manipolativa correlata al contenuto duplicato. Si verifica quando qualcuno prende il contenuto dalle tue pagine per ripubblicarlo sul proprio sito.
Tali pratiche sono relativamente rare perché generalmente causano problemi solo se il sito di scraping è più autorevole e riesce a superare il sito Web che originariamente ha pubblicato il contenuto.
Puoi aggiungere una protezione per proteggere i tuoi contenuti da tali pratiche implementando tag canonici autoreferenziali che puntano alle tue pagine esistenti per dire ai motori di ricerca che il contenuto originale proviene da te.
Nei rari casi in cui Google percepisce che contenuti duplicati possono essere mostrati con l'intento di manipolare le nostre classifiche e ingannare i nostri utenti, apporteremo anche le opportune modifiche all'indicizzazione e alla classifica dei siti coinvolti. Di conseguenza, il posizionamento del sito potrebbe risentirne, oppure il sito potrebbe essere rimosso completamente dall'indice di Google, nel qual caso non apparirà più nei risultati di ricerca.fonte: documentazione di Google
Google può distinguere tra i tipi di contenuti duplicati e comprende quali contenuti duplicati non sembrano manipolare le classifiche di ricerca.
Esempi di contenuti duplicati non dannosi potrebbero includere:
- Forum di discussione in grado di generare pagine sia normali che ridotte destinate ai dispositivi mobili
- Articoli in un negozio online che sono mostrati o collegati da più URL distinti
- Versioni solo per stampante delle pagine Web
fonte: documentazione di Google
Se non stai rubando intenzionalmente contenuti da altri siti , non devi preoccuparti.
Quali sono le cause dei contenuti duplicati
Di solito non hai bisogno di più versioni dello stesso contenuto sul tuo sito web.
Pertanto il contenuto duplicato tende a esistere a causa di errori piuttosto che di decisioni consapevoli.
Molto spesso, il contenuto duplicato appare a causa di uno scarso sviluppo web e di implementazioni errate sul sito , come configurazioni errate del server o piattaforme CMS non ottimizzate.
Possiamo trovare duplicati su tutti i tipi di siti, ma alcuni sono più inclini, in particolare siti Web enormi con migliaia o milioni di pagine.
In particolare, i siti di eCommerce possono gestire quantità eccessive di pagine duplicate di cui è difficile tenere traccia.
I contenuti duplicati sui siti di eCommerce spesso si applicano ai seguenti aspetti:
- Le pagine dei prodotti hanno poco o nessun contenuto o includono solo descrizioni generiche di prodotti in molte pagine. Se una pagina contiene la descrizione del produttore di un determinato prodotto, queste potrebbero essere visualizzate anche in altri domini e Google potrebbe trattarla come contenuto duplicato.
- Le pagine delle categorie hanno filtri che visualizzano gli elenchi degli stessi prodotti su più pagine.
Il contenuto identico su più URL riguarda anche gli articoli del blog .
I siti possono includere articoli di confronto, elenchi di funzionalità di prodotti o strumenti, in cui molti contenuti possono descrivere gli stessi strumenti, prodotti o funzionalità su più pagine.
Le sezioni del blog possono contenere articoli che corrispondono a più categorie: di conseguenza, numerosi URL possono portare allo stesso articolo.
I siti di notizie spesso utilizzano tag che raccolgono contenuti su argomenti correlati, ma in alcune situazioni le pagine possono utilizzare più tag e apparire in più posizioni del sito.
Il rischio di contenuti duplicati riguarda anche i siti Web che mostrano elenchi provenienti da database utilizzati da altri domini , come mercati o siti immobiliari. Di conseguenza, annunci o post identici possono essere visualizzati su più domini.
Molti siti utilizzano contenuti generati dagli utenti . Sebbene potenzialmente vantaggioso, potrebbe essere un'altra fonte di contenuti duplicati: questo vale per qualsiasi sito che contenga post, annunci, pagine del profilo e così via, creati dagli utenti. Spesso, gli utenti possono scrivere solo poche parole, utilizzando testo copiato o spam, o solo aggiungere un collegamento al proprio sito Web nella pagina del profilo.
Questo non è affatto un elenco esaustivo di ciò che causa contenuti duplicati, ma dovrebbe darti un'idea del tipo di contenuto che mette a rischio il tuo sito e dovrebbe essere monitorato.
Modi per gestire i contenuti duplicati
A seconda della qualità e del ruolo delle tue pagine duplicate nella gerarchia del sito, potresti voler affrontarle con metodi diversi.
Ecco quali sono le tue opzioni e cosa dovresti sapere su ciascuna soluzione:
Usa tag canonici
I tag canonici indicano ai motori di ricerca quale pagina contiene la versione principale di un determinato contenuto e dovrebbe essere indicizzata.
Puoi informare i motori di ricerca attraverso la canonizzazione che una determinata pagina deve essere trattata come una copia di un URL specificato . I segnali di ranking, come l'autorità di collegamento applicata a questa pagina dai motori di ricerca, devono essere accreditati all'URL specificato.
L'implementazione dei tag canonici richiede meno tempo di sviluppo rispetto ad altre soluzioni, come i reindirizzamenti, perché vengono aggiunti a livello di pagina anziché a livello di server. Assicurati di aggiungere tag canonici alla sezione <head> dell'HTML: se lo inserisci nel <body>, non verrà rispettato.
Sebbene i bot dei motori di ricerca in genere seguano la direttiva canonica, in alcuni casi potrebbero ignorarla e scegliere una pagina canonica diversa. Ciò potrebbe accadere se i motori di ricerca vedono segnali più forti che puntano a un altro URL, come link più interni o backlink autorevoli.
Aggiungi reindirizzamenti
Un'altra soluzione per combattere i contenuti duplicati consiste nell'implementare i reindirizzamenti dagli URL non preferiti alle loro versioni preferite.
Se stai reindirizzando permanentemente un URL, utilizza un reindirizzamento 301, che in genere sarà l'opzione migliore quando si tratta di gestire contenuti duplicati.
I reindirizzamenti ti aiutano a consolidare i segnali di ranking sotto un URL , quindi Google dovrebbe indicizzare solo la pagina di destinazione.
Implementa un tag noindex
Puoi aggiungere un tag noindex alle pagine che sono duplicate e non dovrebbero essere indicizzabili dai motori di ricerca ma dovrebbero rimanere visibili agli utenti .
Assicurati di non bloccare la scansione di queste pagine, tuttavia, se lo fai, i bot non saranno in grado di vedere il tag noindex.
Rimuovi le pagine duplicate
Puoi rimuovere le pagine duplicate se non servono a nulla per i tuoi visitatori o per la tua attività e non prevedi di apportarvi miglioramenti.

Puoi rimuoverli modificando il loro codice di stato in 404 o 410 .
Entrambi i codici di stato hanno le stesse conseguenze a lungo termine. L'unica differenza è che 410 potrebbe rimuovere le pagine dall'indice e limitarne la scansione più rapidamente rispetto al 404.
Migliori pratiche per affrontare i contenuti duplicati
Esaminiamo gli aspetti che devi considerare con le pagine duplicate per risolvere potenziali problemi.
Decidi se eseguire la scansione delle pagine duplicate
Valuta se consentire ai motori di ricerca di eseguire la scansione delle pagine duplicate . Dipende in gran parte dal tipo di contenuto duplicato e da cosa intendi farne.
Google deve essere in grado di eseguire la scansione delle pagine se contengono reindirizzamenti , altrimenti non le vedrà. Il caso è simile se hai aggiunto tag noindex : Google deve eseguire la scansione di una pagina per scoprire un tag noindex e seguirlo.
Inoltre, se hai apportato miglioramenti ai tuoi duplicati , ad esempio aggiungendo contenuti esclusivi, Google dovrà eseguire la scansione della pagina per rivalutarne la qualità.
Se hai contenuti duplicati che non forniscono valore al tuo sito e non puoi apportarvi modifiche, limita la capacità dei motori di ricerca di scansionarlo implementando la direttiva appropriata in robots.txt .
Modifica la struttura dell'URL
Strutture URL incoerenti possono causare molti contenuti duplicati.
Ecco gli aspetti degli URL a cui dovresti prestare attenzione:
WWW e non www o HTTP e HTTPS
Potresti avere URL sul tuo sito a cui è possibile accedere senza www come esempio.com e tramite URL che includono www, come www.esempio.com .
Lo stesso problema riguarda il protocollo: gli URL possono includere http://example.com o https://example.com .
La maggior parte dei siti Web moderni utilizza HTTPS in quanto offre comunicazioni più sicure. Ma a volte, potresti avere ancora alcune pagine che sono ancora accessibili su HTTP. E, se sei passato a HTTPS e non hai reindirizzato il sito da HTTP, puoi persino crearne due versioni.
Indipendentemente dal fatto che tu aggiunga o meno www e qualunque protocollo utilizzi, assicurati che sia coerente .
Se trovi URL che non seguono il modello selezionato, implementa i reindirizzamenti 301 per modi non preferiti che portano alla versione preferita.
Caratteri minuscoli e maiuscoli
Google considera gli URL con distinzione tra maiuscole e minuscole . Quindi, per Google, example.com/page e example.com/PAGE saranno due pagine diverse.
È consuetudine utilizzare caratteri minuscoli negli URL, quindi è più facile per gli utenti digitarli senza errori.
Tuttavia, se utilizzi i casi in modo intercambiabile, puoi creare URL diversi con lo stesso contenuto.
Se trovi occorrenze del genere, scegli l'URL con la maiuscola preferita e reindirizza ad esso la versione errata .
Tagli finali
Anche gli URL identici con e senza una barra finale alla fine verranno visualizzati come pagine diverse, ad esempio example.com e example.com/ .
Ancora una volta, assicurati di attenerti allo stesso pattern URL e di reindirizzare le pagine sbagliate, se necessario.
Tracciamento o parametri di filtraggio
I parametri di filtraggio sui siti di eCommerce portano comunemente a pagine duplicate.
Se sono disponibili molti filtri, possono essere selezionati in diverse combinazioni, generando montagne di URL con lo stesso contenuto o quasi identico. Un esempio potrebbe essere https://www.example.com/clothes/dresses?size=medium .
I parametri tendono anche ad essere utilizzati per scopi di tracciamento , che è un'altra fonte di contenuti duplicati. Ad esempio, puoi aggiungere parametri UTM per tenere traccia delle visite da fonti specifiche, come Twitter o la newsletter. Ecco un esempio: https://example.com/page?utm_source=twitter .
Dovresti canonizzare i tuoi URL parametrizzati nelle versioni URL senza parametri di monitoraggio .
ID di sessione
Le sessioni possono memorizzare le informazioni sui visitatori per l'analisi web, in cui a ciascun utente che visita un sito Web viene assegnato un ID di sessione diverso memorizzato nell'URL. Potrebbe assomigliare a questo: https://example.com?sessionId=jsdfo74256sdfh .
Se a ogni URL richiesto da un visitatore viene aggiunto un ID sessione, ci saranno molte pagine duplicate perché il contenuto di questi URL è lo stesso.
Canonicalizza gli URL con gli ID di sessione aggiunti agli URL senza di essi.
URL di sola stampa
Avere una versione stampabile di una pagina su un URL separato significa che esistono due versioni dello stesso contenuto, ad esempio https://www.example.com/page/ e https://www.example.com/print /pagina/ .
Implementa un URL canonico dalla versione stampabile alla versione standard della pagina.
Ottimizza i tuoi contenuti
Puoi apportare ulteriori modifiche concentrandoti sul contenuto delle tue pagine.
La linea di fondo è che se disponi di pagine preziose che dovrebbero essere classificate e indirizzare il traffico, assicurati che contengano contenuti unici e di alta qualità che abbiano come target l'intento specifico dell'utente.
Sebbene richieda tempo e risorse, a lungo termine ne varrà la pena.
Ecco alcuni aspetti del contenuto da considerare nella tua ottimizzazione:
Migliora le pagine dei prodotti
Fornisci descrizioni univoche del prodotto invece di copiare la descrizione generica del produttore.
Una FAQ è un luogo eccellente per includere informazioni aggiuntive sui tuoi prodotti o servizi. Fai attenzione, però: se elenchi i dettagli esatti menzionati nella descrizione del prodotto, potrebbe trattarsi di una duplicazione parziale del contenuto.
Regola le pagine delle categorie
Ogni pagina di categoria dovrebbe essere unica e pertinente . Sfoglia le tue categorie e pensa se ognuna è necessaria: quanto sono utili per gli utenti?
Considera di rimuoverne alcuni o di combinarli in uno solo. Fai lo stesso per qualsiasi opzione di filtro o ordinamento disponibile nelle categorie.
Consolida i contenuti
Se hai alcuni articoli che discutono di argomenti correlati, considera la possibilità di consolidarli in un contenuto più ampio che può essere la sua versione più completa.
In questo modo, puoi creare contenuti utili che forniscono tutte le informazioni in un unico posto, invece di disperderle su pochi URL, riducendo al minimo il numero di pagine simili.
Potrebbe anche essere meglio classificare con un articolo di alta qualità rispetto a più articoli mediocri che hanno come target lo stesso argomento.
Crea contenuti supplementari
Prendi in considerazione la creazione di contenuti supplementari che possano rendere le pagine più uniche e preziose e aumentare le loro possibilità di essere indicizzate e classificate bene. Pensa a come migliorare l'esperienza dell'utente e cosa aiuterà di più i visitatori .
Ad esempio, supponiamo di avere un sito Web con offerte di lavoro.
In tal caso, puoi creare un calcolatore di stipendio. Puoi fornire ulteriori informazioni che i visitatori possono richiedere delineando i diversi tipi di contratto, spiegando ciascuna detrazione, fornendo pro e contro per varie forme di impiego e così via.
Sfoglia le pagine con poco contenuto e pensa se c'è qualcosa che puoi aggiungere.
Ma se non puoi migliorarli e offrono un valore limitato agli utenti e non possono indirizzare traffico organico al tuo sito, è meglio aggiungere un tag noindex per evitare che vengano indicizzati.
Utilizza i contenuti generati dagli utenti
Contenuti unici e completi creati dagli utenti possono essere utili per il tuo sito. Ad esempio, puoi incoraggiare i clienti a lasciare recensioni e visualizzarle sulle tue pagine.
Le recensioni possono fornire descrizioni reali di come i clienti utilizzano i tuoi prodotti o la loro esperienza con i tuoi servizi, arricchendo il tuo sito.
In particolare, le pagine dei prodotti possono beneficiare di recensioni approfondite e imparziali contenenti immagini e informazioni specifiche sul prodotto.
L'implementazione di meccanismi specifici, come un numero minimo di caratteri che un utente deve scrivere per pubblicare una recensione o un annuncio sul tuo sito, è un approccio eccellente per prevenire contenuti sottili o duplicati generati dagli utenti.
Ottimizza la pubblicazione di contenuti internazionali
Se disponi di alcune versioni linguistiche del tuo sito con lo stesso contenuto, le diverse versioni linguistiche non verranno considerate duplicati.
Tuttavia, potrebbe essere problematico se si dispone dello stesso contenuto e lo si utilizza per rivolgersi a persone in regioni diverse che parlano la stessa lingua . Ad esempio, potresti avere lo stesso contenuto su diverse versioni dei siti in lingua inglese: una per gli Stati Uniti, una per il Canada e una per il Regno Unito.
Se offri lo stesso contenuto a un pubblico diverso, implementa i tag hreflang per segnalare a Google la lingua e il paese che stai cercando di raggiungere.
A volte, anche quando sono presenti gli attributi hreflang, Google può classificare il contenuto come duplicato e semplicemente piegare due o più versioni insieme. Potrebbe non essere un problema grave in molti casi, ma può influire negativamente sull'esperienza dell'utente.
Ecco perché dovresti semplicemente evitare di mostrare lo stesso contenuto su più pagine.
Sforzati di localizzare i tuoi contenuti , specialmente per i mercati internazionali strategici . Localizzare non è solo tradurre: devi renderlo adatto al paese specifico a cui ti rivolgi, tenendo conto del vocabolario locale, delle abitudini, della valuta, ecc.
Gestisci i link interni
Dopo aver deciso la versione preferita dei tuoi URL, controlla i link interni del tuo sito e assicurati che ognuno di essi punti alla versione corretta dell'URL.
Sindacati correttamente i contenuti
Quando si distribuisce il contenuto, la fonte originale deve essere scelta come canonica.
Allo stesso modo, quando un altro sito distribuisce i tuoi contenuti, assicurati che includano un collegamento al tuo contenuto originale e puntino all'URL corretto.
Disabilita l'accesso agli ambienti di staging
Gli ambienti di staging o test contengono una copia del sito disponibile in produzione. Pertanto, non dovrebbero essere scansionabili o indicizzabili sui motori di ricerca. Per impedirne l'accesso da parte di bot e utenti, implementa l'autenticazione HTTP.
Rendi le pagine dei risultati di ricerca interne non indicizzabili
I visitatori che utilizzano i tuoi risultati di ricerca interni visualizzano diverse varianti delle tue pagine, generalmente mostrando URL identici o simili.
Assicurati di non collegarti a pagine dei risultati di ricerca interne in modo che i bot non possano seguire un percorso per trovarli ed eseguirne la scansione.
Dovresti aggiungere tag noindex a queste pagine, in modo che non vengano indicizzate. Tuttavia, se vedi che i bot scansionano queste pagine in modo eccessivo, puoi limitare il loro accesso nel file robots.txt.
Vale la pena notare che in alcuni casi potresti voler effettivamente indicizzare alcune delle tue pagine di ricerca interne, ma solo alcune di esse. Se analizzi il modo in cui i tuoi utenti cercano i tuoi contenuti su Google e vedi che una pagina di ricerca interna potrebbe rispondere perfettamente all'intento dell'utente, sentiti libero di rendere quella pagina indicizzabile.
Impedisci problemi di contenuti duplicati causati da CMS
Le piattaforme CMS causano la loro quota di problemi con contenuti duplicati.
Ad esempio, WordPress genera automaticamente pagine di tag e categorie . Tali pagine possono essere un grave spreco di risorse per i crawler.
WordPress crea anche l' impaginazione dei commenti , in cui le pagine impaginate mostrano il contenuto originale e visualizzano solo commenti diversi nella parte inferiore.
Potresti anche scoprire che il tuo CMS crea pagine separate per le immagini che non contengono altri contenuti.
Aggiungi tag noindex a pagine indesiderate o disabilita queste funzionalità nel tuo CMS.
Come trovare problemi di contenuti duplicati sul tuo sito
Esistono alcuni metodi rapidi per verificare se i tuoi contenuti potrebbero essere stati duplicati.
Puoi utilizzare uno strumento come Copyscape per vedere quale contenuto delle tue pagine appare sul Web.

Per scoprire i problemi relativi ai contenuti duplicati sul tuo sito, utilizza Siteliner , che scopre in che modo le pagine del tuo sito corrispondono ai contenuti dell'altro.

Rapporto sulla copertura dell'indice di Google
Per analizzare più in dettaglio i problemi relativi ai contenuti duplicati, visita il rapporto sulla copertura dell'indice di Google Search Console che ti mostrerà i problemi specifici e come risolverli.
È possibile trovare i seguenti errori che indicano problemi di indicizzazione relativi al contenuto duplicato:
Duplica senza canonico selezionato dall'utente
Google ha trovato URL duplicati che non sono canonizzati nella versione preferita. Puoi controllare quale URL è stato scelto come canonico accedendo allo strumento Controllo URL .
Per risolvere questo problema, ti consigliamo di selezionare tu stesso l'URL canonico .
Duplicato, Google ha scelto canonico diverso da utente
Google ha ignorato l'URL canonico specificato e ne ha selezionato uno diverso che ha ritenuto più adatto.
Questo problema indica che Google non ha trovato segnali sufficienti che puntano all'URL specificato che rappresenta la versione principale del contenuto specificato: scopri come risolvere Duplicato, Google ha scelto canonico diverso da utente .
URL inviato duplicato non selezionato come canonico
Questo stato indica che hai inviato URL senza un URL canonico e che Google considera gli URL inviati duplicati, quindi ha scelto un URL canonico diverso.
Sebbene questo stato sia simile a Duplicato, Google ha scelto canonico diverso da utente, la differenza è che hai richiesto esplicitamente a Google di indicizzare questi URL senza includere un URL canonico .
Ancora una volta, devi aggiungere tag canonici all'URL preferito.
Riepilogo
I contenuti duplicati non comporteranno sanzioni di Google, ma possono comunque rallentare efficacemente la crescita del tuo sito sul Web.
Ecco perché dovresti essere a conoscenza di eventuali pagine duplicate e monitorare le tue implementazioni per assicurarti che non ci sia alcun meccanismo che crei numerose pagine senza la tua supervisione.
La creazione di contenuti unici sulle pagine, la garanzia della coerenza degli URL e l'implementazione di tag canonici e reindirizzamenti ove appropriato sono ottimi modi per aiutare Google a indicizzare e classificare correttamente le tue pagine.
