Cum să optimizați conținutul duplicat pentru SEO

Publicat: 2022-08-03

Conținutul duplicat este același conținut sau similar care există pe mai multe pagini, pe un domeniu sau pe diferite site-uri web.

Conținutul duplicat este problematic pentru motoarele de căutare, deoarece, atunci când văd același conținut în mai multe locații, aceștia nu știu care URL ar trebui să fie:

Indexat,
Semnale relevante de clasare atribuite și
Listată mai sus în rezultatele căutării.

Acest lucru poate duce la clasări mai scăzute, risipă de buget de accesare cu crawlere și probleme de indexare pentru site-ul dvs. web, disipând, în consecință, potențialul de afaceri al paginilor dvs. .

De dragul afacerii dvs., trebuie să înțelegeți ce poate cauza conținut duplicat și cum să optimizați aspectele site-ului dvs. pentru a elimina orice problemă - să-l explorăm.

Conținutul ascunde

1 Cum influențează conținutul duplicat SEO

1.1 Clasamente inferioare

1.2 Transfer redus de autoritate de legătură

1.3 Probleme de indexare și buget irosit de accesare cu crawlere

1.4 Conținutul duplicat poate duce la o penalizare Google?

2 Care sunt cauzele conținutului duplicat

3 moduri de a gestiona conținutul duplicat

3.1 Utilizați etichete canonice

3.2 Adăugați redirecționări

3.3 Implementați o etichetă noindex

3.4 Eliminați paginile duplicate

4 Cele mai bune practici pentru abordarea conținutului duplicat

4.1 Decideți dacă paginile duplicate trebuie accesate cu crawlere

4.2 Ajustați-vă structura URL

4.2.1 Wwws și non-wwws sau HTTP și HTTPS

4.2.2 Litere mici și majuscule

4.2.3 Bare oblice în urmă

4.2.4 Parametrii de urmărire sau filtrare

4.2.5 ID-uri de sesiune

4.2.6 URL-uri numai pentru imprimare

4.3 Optimizați-vă conținutul

4.3.1 Îmbunătățiți paginile de produse

4.3.2 Ajustați paginile categoriei

4.3.3 Consolidarea conținutului

4.3.4 Creați conținut suplimentar

4.3.5 Utilizați conținutul generat de utilizatori

4.4 Optimizați difuzarea conținutului internațional

4.5 Gestionați legăturile interne

4.6 Sindicați corect conținutul

4.7 Dezactivați accesul la mediile de pregătire

4.8 Faceți paginile cu rezultatele căutării interne neindexabile

4.9 Preveniți problemele de conținut duplicat cauzate de CMS

5 Cum să găsiți probleme de conținut duplicat pe site-ul dvs

5.1 Raportul Google privind acoperirea indexului

5.1.1 Duplicați fără canonice selectate de utilizator

5.1.2 Duplicat, Google a ales diferit canonic decât utilizator

5.1.3 Duplicat, adresa URL trimisă nu este selectată ca canonică

6 Rezumat

Cum influențează conținutul duplicat SEO

Conținutul duplicat nu este întotdeauna o problemă – dacă utilizați SEO tehnic pentru a-l menține sub control, nu vă va afecta traficul organic. Dar dacă lăsați conținut duplicat neoptimizat, acesta poate avea consecințe mortale.

Iată principalele moduri prin care conținutul duplicat poate afecta negativ site-ul dvs.:

Clasamente inferioare

Versiunile multiple ale aceluiași conținut fac motoarele de căutare să se chinuie să decidă ce pagină ar trebui să fie indexată și prezentată în rezultatele căutării .

Atunci când acesta este cazul, nici una dintre paginile dvs. duplicate nu poate atinge pe deplin potențialul lor de clasare, dacă sunt accesate cu crawlere și indexate în primul rând.

Transfer redus de autoritate de link

Motoarele de căutare pot avea dificultăți în alocarea corectă a semnalelor de clasare de la backlink-uri către paginile duplicate .

Dacă același conținut există pe câteva pagini, mai multe adrese URL pot primi link-uri de la alte domenii. Dar autoritatea totală a link-ului va fi apoi împărțită între pagini, limitând potențialul de clasare al piesei dvs. de conținut.

Probleme de indexare și buget de accesare cu crawlere irosit

Dacă aveți un site web mare, bugetul de accesare cu crawlere este adesea o problemă. Iar motoarele de căutare pot risipi bugetul de accesare cu crawlere pentru accesarea cu crawlere a paginilor duplicate .

Întotdeauna doriți ca bugetul de accesare cu crawlere să fie cheltuit pentru accesarea cu crawlere a conținutului valoros. Atunci când lăsați conținut duplicat neoptimizat pe domeniul dvs., roboții motoarelor de căutare pot irosi o parte din resursele lor, accesând cu crawlere același conținut în mod repetat.

Acest lucru nu numai că va întârzia descoperirea altor conținuturi de pe site-ul dvs., dar îi poate descuraja să revină la fel de des pe site-ul dvs.

Dacă este cazul, riscați să vă ocupați de problemele de indexare . Rețineți că, de cele mai multe ori, Google va analiza diferitele semnale, cum ar fi hărți de site, link-uri interne și externe, redirecționări și altele și va alege o adresă URL dintre multe pentru a indexa. Problema este că este posibil să nu fie versiunea pe care doriți să o aveți indexată.

Dacă Google nu poate accesa cu crawlere unele dintre paginile dvs., este posibil să aveți dificultăți pentru a vă indexa paginile esențiale, unice.

Mai mult, vizualizarea unor cantități mari de pagini duplicat poate face ca motoarele de căutare să perceapă întregul site web ca fiind de calitate scăzută , presupunând că alte pagini conțin conținut similar. Apoi, aceștia pot ezita să aloce resurse pentru a vă accesa cu crawlere site-ul în viitor.

Conținutul duplicat poate duce la o penalizare Google?

Este posibil să fi auzit opinii contradictorii despre dacă conținutul duplicat vă poate aduce o penalizare Google.

Conținutul duplicat nu va fi penalizat site-ul dvs. decât dacă rezultă din activități rău intenționate .

Scraping content este un exemplu de practică manipulativă legată de conținut duplicat. Apare atunci când cineva preia conținutul din paginile tale pentru a-l republica pe site-ul său.

Astfel de practici sunt relativ rare, deoarece în general provoacă probleme numai dacă site-ul de scraping este mai autorizat și reușește să depășească site-ul care a publicat inițial conținutul.

Puteți adăuga o protecție pentru a vă proteja conținutul de astfel de practici prin implementarea etichetelor canonice autoreferențiale care indică paginile dvs. existente pentru a spune motoarele de căutare că conținutul original provine de la dvs.

În rarele cazuri în care Google percepe că conținutul duplicat poate fi afișat cu intenția de a manipula clasamentele noastre și de a înșela utilizatorii noștri, vom face, de asemenea, ajustările corespunzătoare în indexarea și clasarea site-urilor implicate. Ca urmare, clasarea site-ului poate avea de suferit sau site-ul ar putea fi eliminat în întregime din indexul Google, caz în care nu va mai apărea în rezultatele căutării.
sursa: documentatia Google

Google poate face diferența între tipurile de conținut duplicat și înțelege care conținut duplicat nu pare să manipuleze clasamentele de căutare.

Exemple de conținut duplicat non-răuțios ar putea include:
Forumuri de discuții care pot genera atât pagini obișnuite, cât și pagini reduse, care vizează dispozitivele mobile
Articole dintr-un magazin online care sunt afișate sau la care sunt legate prin mai multe adrese URL distincte
Versiuni numai pentru imprimantă ale paginilor web
sursa: documentatia Google

Dacă nu furați în mod intenționat conținut de pe alte site-uri , nu trebuie să vă faceți griji.

Care sunt cauzele conținutului duplicat

De obicei, nu aveți nevoie de mai multe versiuni ale aceluiași conținut pe site-ul dvs. web.

Prin urmare, conținutul duplicat tinde să existe mai degrabă din cauza erorilor decât a unor decizii conștiente.

Cel mai adesea, conținutul duplicat apare din cauza dezvoltării web proaste și a implementărilor defectuoase pe site , cum ar fi configurații greșite ale serverului sau platforme CMS neoptimizate.

Putem găsi duplicate pe toate tipurile de site-uri, dar unele sunt mai predispuse la aceasta, în special site-uri web uriașe cu mii sau milioane de pagini.

În special, site-urile de comerț electronic se pot ocupa de cantități excesive de pagini duplicat, care sunt greu de urmărit.

Conținutul duplicat de pe site-urile de comerț electronic se aplică adesea următoarelor aspecte:

Paginile de produse au puțin sau deloc conținut sau includ doar descrieri generice ale produselor în multe pagini. Dacă o pagină conține descrierea producătorului pentru un anumit produs, acestea pot apărea și în alte domenii, iar Google o poate trata ca conținut duplicat.
Paginile de categorii au filtre care afișează liste cu aceleași produse pe mai multe pagini.

Conținutul identic din mai multe adrese URL se referă și la articolele de blog .

Site-urile pot include articole de comparare, caracteristici de listare a produselor sau instrumentelor, unde multe părți de conținut pot descrie aceleași instrumente, produse sau funcționalități pe mai multe pagini.

Secțiunile de blog pot avea articole care se potrivesc cu mai multe categorii – ca urmare, numeroase adrese URL pot duce la același articol.

Site-urile de știri folosesc adesea etichete care colectează conținut pe subiecte conexe – dar, în unele situații, paginile pot folosi mai multe etichete și pot apărea în mai multe locații de pe site.

Riscul de conținut duplicat se referă și la site-urile web care afișează înregistrări provenite din baze de date utilizate de alte domenii , cum ar fi piețele sau site-urile imobiliare. În consecință, anunțuri sau postări identice pot apărea pe mai multe domenii.

Multe site-uri utilizează conținut generat de utilizatori . Deși este potențial benefic, poate fi o altă sursă de conținut duplicat - acest lucru se aplică oricărui site care conține postări, anunțuri, pagini de profil etc., create de utilizatori. Adesea, utilizatorii pot scrie doar câteva cuvinte, folosind text copiat sau spam, sau pot adăuga doar un link către site-ul lor pe pagina de profil.

Aceasta nu este în niciun caz o listă exhaustivă a cauzelor de conținut duplicat, dar ar trebui să vă ofere o idee despre tipul de conținut care vă pune în pericol site-ul și ar trebui monitorizat.

Modalități de a gestiona conținutul duplicat

În funcție de calitatea și rolul paginilor duplicate în ierarhia site-ului, poate doriți să le abordați prin diferite metode.

Iată care sunt opțiunile tale și ce ar trebui să știi despre fiecare soluție:

Folosiți etichete canonice

Etichetele canonice le spun motoarelor de căutare care pagină conține versiunea principală a conținutului dat și ar trebui să fie indexată.

Puteți informa motoarele de căutare prin canonizare că o anumită pagină ar trebui tratată ca o copie a unei adrese URL specificate . Semnalele de clasare, cum ar fi autoritatea de link aplicată acestei pagini de motoarele de căutare, ar trebui să fie creditate la adresa URL specificată.

Implementarea etichetelor canonice necesită mai puțin timp de dezvoltare decât alte soluții, cum ar fi redirecționările, deoarece acestea sunt adăugate mai degrabă la nivel de pagină decât la nivel de server. Asigurați-vă că adăugați etichete canonice în secțiunea <head> a HTML-ului – dacă o plasați în <body>, nu va fi respectată.

Deși roboții motoarelor de căutare urmează de obicei directiva canonică, în unele cazuri, ei o pot ignora și alege o altă pagină canonică. Acest lucru s-ar putea întâmpla dacă motoarele de căutare văd semnale mai puternice care indică către o altă adresă URL, cum ar fi mai multe link- uri interne sau backlink-uri autorizate.

Adăugați redirecționări

O altă soluție pentru combaterea conținutului duplicat este implementarea redirecționărilor de la adresele URL nepreferate către versiunile lor preferate.

Dacă redirecționați permanent o adresă URL, utilizați o redirecționare 301, care va fi de obicei cea mai bună opțiune când vine vorba de gestionarea conținutului duplicat.

Redirecționările vă ajută să consolidați semnalele de clasare sub o singură adresă URL , așa că Google ar trebui să indexeze numai pagina țintă.

Implementați o etichetă noindex

Puteți adăuga o etichetă noindex la paginile care sunt duplicate și care nu ar trebui să fie indexate de motoarele de căutare, dar ar trebui să rămână vizibile pentru utilizatori .

Asigurați-vă totuși că nu blocați accesarea cu crawlere a acestor pagini – dacă o faceți, roboții nu vor putea vedea eticheta noindex.

Eliminați paginile duplicat

Puteți elimina paginile duplicat dacă acestea nu servesc la niciun scop vizitatorilor sau afacerii dvs. și nu intenționați să le aduceți îmbunătățiri.

Le puteți elimina schimbându-le codul de stare la 404 sau 410 .

Ambele coduri de stare au aceleași consecințe pe termen lung. Singura diferență este că 410 ar putea elimina paginile din index și ar putea limita accesul cu crawlere mai rapid decât 404.

Cele mai bune practici pentru abordarea conținutului duplicat

Să trecem prin aspectele pe care trebuie să le luați în considerare cu paginile duplicat pentru a rezolva potențialele probleme.

Decideți dacă paginile duplicate trebuie accesate cu crawlere

Luați în considerare dacă ar trebui să permiteți motoarelor de căutare să acceseze cu crawlere paginile dvs. duplicate . Depinde în mare măsură de tipul de conținut duplicat și de ce intenționați să faceți cu acesta.

Google trebuie să poată accesa cu crawlere paginile dacă acestea conțin redirecționări – în caz contrar, nu le va vedea. Cazul este similar dacă ați adăugat etichete noindex - Google trebuie să acceseze cu crawlere o pagină pentru a descoperi o etichetă noindex și să o urmărească.

De asemenea, dacă ați adus îmbunătățiri la duplicatele dvs. , cum ar fi prin adăugarea de conținut unic, Google va trebui să acceseze cu crawlere pagina pentru a-i reevalua calitatea.

Dacă aveți conținut duplicat care nu oferă valoare pentru site-ul dvs. și nu îl puteți modifica, restricționați capacitatea motoarelor de căutare de a-l accesa cu crawlere prin implementarea directivei corespunzătoare în robots.txt .

Ajustați-vă structura URL

Structurile URL inconsecvente pot cauza o mulțime de conținut duplicat.

Iată aspectele URL-urilor cărora ar trebui să le acordați atenție:

Wwws și non-wwws sau HTTP și HTTPS

Este posibil să aveți adrese URL pe site-ul dvs. care pot fi accesate fără www.example.com și prin adrese URL care includ www.example.com .

Aceeași problemă se referă la protocol: adresele URL pot include http://example.com sau https://example.com .

Cele mai multe site-uri web moderne folosesc HTTPS, deoarece oferă o comunicare mai sigură. Dar, uneori, este posibil să aveți încă unele pagini care sunt încă accesibile la HTTP. Și, dacă ați trecut la HTTPS și nu ați redirecționat site-ul de pe HTTP, puteți chiar să creați două versiuni ale acestuia.

Indiferent dacă adăugați www sau nu și indiferent de protocolul pe care îl utilizați, asigurați-vă că este consecvent .

Dacă descoperiți URL-uri care nu urmează modelul selectat, implementați redirecționări 301 pentru căi nepreferate care duc la versiunea preferată.

Caractere cu litere mici și majuscule

Google tratează adresele URL ca fiind sensibile la majuscule . Deci, pentru Google, example.com/page și example.com/PAGE vor fi două pagini diferite.

Se obișnuiește să se utilizeze caractere minuscule în adresele URL, astfel încât este mai ușor pentru utilizatori să le introducă fără erori.

Cu toate acestea, dacă utilizați cazurile în mod interschimbabil, puteți crea adrese URL diferite cu același conținut.

Dacă găsiți o astfel de apariție, alegeți adresa URL cu majusculele preferate și redirecționați versiunea incorectă către aceasta .

Slashuri în urmă

Adresele URL identice cu și fără o bară oblică finală vor fi, de asemenea, vizualizate ca pagini diferite, cum ar fi example.com și example.com/ .

Încă o dată, asigurați-vă că respectați același model URL și redirecționați paginile greșite dacă este necesar.

Parametrii de urmărire sau filtrare

Parametrii de filtrare pe site-urile de comerț electronic conduc de obicei la pagini duplicate.

Dacă sunt disponibile multe filtre, acestea pot fi selectate în combinații diferite, generând munți de adrese URL cu același conținut sau aproape identic. Un exemplu în acest sens ar putea fi https://www.example.com/clothes/dresses?size=medium .

Parametrii tind să fie utilizați și în scopuri de urmărire , care este o altă sursă de conținut duplicat. De exemplu, puteți adăuga parametri UTM pentru a urmări vizitele din surse specifice, cum ar fi Twitter sau buletinul informativ. Iată un exemplu: https://example.com/page?utm_source=twitter .

Ar trebui să canonizezi adresele URL parametrizate la versiunile URL fără parametri de urmărire .

ID-uri de sesiune

Sesiunile pot stoca informații despre vizitatori pentru analiza web, în care fiecărui utilizator care vizitează un site i se atribuie un ID de sesiune diferit stocat în adresa URL. Ar putea arăta astfel: https://example.com?sessionId=jsdfo74256sdfh .

Dacă fiecărei adrese URL solicitate de un vizitator i se atașează un ID de sesiune, atunci vor exista o mulțime de pagini duplicat, deoarece conținutul acestor adrese URL este același.

Canonicalizați adresele URL cu ID-uri de sesiune adăugate la adresele URL fără acestea.

URL-uri numai pentru imprimare

Având o versiune de tipărire a unei pagini la o adresă URL separată înseamnă că există două versiuni ale aceluiași conținut, de exemplu, https://www.example.com/page/ și https://www.example.com/print /pagina/ .

Implementați o adresă URL canonică de la versiunea de tipărire la versiunea standard a paginii.

Optimizați-vă conținutul

Puteți face ajustări suplimentare concentrându-vă pe conținutul paginilor dvs.

Concluzia este că, dacă aveți pagini valoroase care ar trebui să clasifice și să genereze trafic, asigurați-vă că acestea conțin conținut unic, de înaltă calitate, care vizează intențiile specifice ale utilizatorului.

Deși consumă timp și resurse, va fi util pe termen lung.

Iată câteva aspecte de conținut de luat în considerare în optimizarea dvs.:

Îmbunătățiți paginile de produse

Furnizați descrieri unice de produs în loc să copiați descrierea generică de la producător.

Întrebări frecvente este un loc excelent pentru a include informații suplimentare despre produsele sau serviciile dvs. Fiți atenți, totuși – dacă enumerați detaliile exacte menționate în descrierea produsului, poate fi o duplicare parțială a conținutului.

Ajustați paginile categoriei

Fiecare pagină de categorie ar trebui să fie unică și relevantă . Răsfoiți prin categoriile dvs. și gândiți-vă dacă fiecare este necesară - cât de utile sunt pentru utilizatori?

Luați în considerare eliminarea unora sau combinarea lor într-una singură. Faceți același lucru pentru orice opțiuni de filtrare sau sortare disponibile în categorii.

Consolidați conținutul

Dacă aveți câteva articole care discută subiecte conexe, luați în considerare consolidarea acestora într-o singură bucată de conținut mai mare, care poate fi versiunea sa cea mai cuprinzătoare.

În acest fel, puteți crea conținut util care oferă toate informațiile într-un singur loc, în loc să le dispersați pe câteva adrese URL, minimizând numărul de pagini similare.

De asemenea, poate fi mai bine să vă clasați cu un articol de înaltă calitate decât cu mai multe mediocre care vizează același subiect.

Creați conținut suplimentar

Luați în considerare crearea de conținut suplimentar care să facă paginile mai unice și mai valoroase și să le mărească șansele de a fi indexate și de a se clasa bine. Gândiți-vă la îmbunătățirea experienței utilizatorului și la ce va ajuta cel mai mult vizitatorii .

De exemplu, să presupunem că aveți un site web cu oferte de muncă.

În acest caz, puteți crea un calculator de salariu. Puteți furniza informații suplimentare pe care vizitatorii le pot căuta subliniind diferitele tipuri de contracte, explicând fiecare deducere, oferind argumente pro și contra pentru diferite forme de angajare și așa mai departe.

Răsfoiți paginile cu puțin conținut și gândiți-vă dacă puteți adăuga ceva.

Dar dacă nu le puteți îmbunătăți și oferă o valoare limitată utilizatorilor și nu puteți genera trafic organic către site-ul dvs., cel mai bine este să adăugați o etichetă noindex pentru a preveni indexarea acestora.

Utilizați conținut generat de utilizatori

Conținutul unic și cuprinzător creat de utilizatori poate fi benefic pentru site-ul dvs. De exemplu, puteți încuraja clienții să lase recenzii și să le afișeze în paginile dvs.

Recenziile pot oferi descrieri reale ale modului în care clienții vă folosesc produsele sau experiența lor cu serviciile dvs., îmbogățindu-vă site-ul.

În special, paginile de produse pot beneficia de recenzii aprofundate, fără părtinire, care conțin imagini și informații specifice despre produs.

Implementarea unor mecanisme specifice, cum ar fi un număr minim de caractere pe care un utilizator trebuie să le scrie pentru a posta o recenzie sau un anunț pe site-ul dvs. este o abordare excelentă pentru a preveni conținutul subțire sau duplicat generat de utilizatori.

Optimizați difuzarea conținutului internațional

Dacă aveți câteva versiuni lingvistice ale site-ului dvs. cu același conținut, versiunile lingvistice diferite nu vor fi considerate duplicate.

Cu toate acestea, ar putea fi problematic dacă aveți același conținut și îl utilizați pentru a viza persoane din regiuni diferite care vorbesc aceeași limbă . De exemplu, puteți avea același conținut pe diferite versiuni de site-uri în limba engleză – una pentru SUA, una pentru Canada și una pentru Marea Britanie.

Dacă difuzați același conținut unor segmente de public diferite, implementați etichete hreflang pentru a semnala Google în ce limbă și țara încercați să ajungeți.

Uneori, chiar și atunci când sunt aplicate atributele hreflang, Google poate clasifica conținutul ca duplicat și pur și simplu să plieze două sau mai multe versiuni împreună. Este posibil să nu fie o problemă gravă în multe cazuri, dar poate afecta negativ experiența utilizatorului.

De aceea ar trebui să evitați pur și simplu să afișați același conținut pe mai multe pagini.

Faceți un efort pentru a vă localiza conținutul , în special pentru piețele internaționale strategice . Localizarea nu înseamnă doar traducere – trebuie să o faceți potrivită pentru țara pe care o vizați, ținând cont de vocabularul local, obiceiurile, moneda etc.

Gestionați legăturile interne

După ce vă decideți asupra versiunii preferate a adreselor URL, verificați linkurile interne ale site-ului și asigurați-vă că fiecare dintre ele indică versiunea corectă a adresei URL.

Sindicați corect conținutul

La sindicarea conținutului, sursa originală trebuie aleasă drept canonică.

În mod similar, atunci când un alt site îți distribuie conținutul, asigură-te că include un link către conținutul original și indică adresa URL corectă.

Dezactivați accesul la mediile de pregătire

Mediile de pregătire sau de testare conțin o copie a site-ului disponibilă în producție. Prin urmare, acestea nu ar trebui să poată fi accesate cu crawlere sau indexate pentru motoarele de căutare. Pentru a preveni accesul lor de către roboți și utilizatori, implementați autentificarea HTTP.

Faceți paginile cu rezultatele căutării interne neindexabile

Vizitatorii care folosesc rezultatele căutării interne văd diferite variante ale paginilor dvs., afișând în general adrese URL identice sau similare.

Asigurați-vă că nu conectați la paginile interne cu rezultatele căutării, astfel încât roboții să nu poată urma o cale pentru a le găsi și accesa cu crawlere.

Ar trebui să adăugați etichete noindex la aceste pagini, astfel încât să nu fie indexate. Cu toate acestea, dacă observați că roboții accesează cu crawlere aceste pagini excesiv, le puteți restricționa accesul în fișierul robots.txt.

Merită remarcat faptul că, în unele cazuri, este posibil să doriți ca unele dintre paginile dvs. interne de căutare să fie indexate, dar doar câteva dintre ele. Dacă analizați modul în care utilizatorii dvs. caută conținutul dvs. pe Google și vedeți că o pagină de căutare internă ar putea răspunde perfect intenției utilizatorului, nu ezitați să faceți pagina respectivă indexabilă.

Preveniți problemele de conținut duplicat cauzate de CMS

Platformele CMS provoacă ponderea lor de probleme cu conținutul duplicat.

De exemplu, WordPress generează automat pagini de etichete și categorii . Astfel de pagini pot reprezenta o risipă gravă a resurselor crawlerelor.

WordPress creează, de asemenea , paginarea comentariilor , în care paginile paginate arată conținutul original și afișează doar comentarii diferite în partea de jos.

De asemenea, este posibil să descoperiți că CMS-ul dvs. creează pagini separate pentru imagini care nu conțin niciun alt conținut.

Adăugați etichete noindex la paginile nedorite sau dezactivați aceste funcții în CMS.

Cum să găsiți probleme de conținut duplicat pe site-ul dvs

Există câteva metode rapide de a verifica dacă conținutul dvs. poate fi duplicat.

Puteți folosi un instrument precum Copyscape pentru a vedea ce conținut din paginile dvs. apare pe web.

how-to-optimize-duplicate-content-for-seo - 1 cum să optimizați conținutul duplicat pentru SEO

Pentru a afla despre problemele de conținut duplicat de pe site-ul dvs., utilizați Siteliner , care descoperă modul în care paginile de pe site-ul dvs. se potrivesc cu conținutul celuilalt.

how-to-optimize-duplicate-content-for-seo - 2 cum să optimizați conținutul duplicat pentru SEO

Raportul Google privind acoperirea indexului

Pentru a analiza problemele de conținut duplicat mai detaliat, vizitați raportul Acoperire index al Google Search Console, care vă va arăta problemele specifice și cum le puteți rezolva.

Puteți găsi acolo următoarele erori care indică probleme de indexare legate de conținut duplicat:

Duplicați fără canonice selectate de utilizator

Google a găsit adrese URL duplicat care nu sunt canonizate la versiunea preferată. Puteți verifica ce adresă URL a fost aleasă drept canonică navigând la instrumentul de inspecție URL .

Pentru a rezolva această problemă, se recomandă să selectați singur adresa URL canonică .

Dublat, Google a ales diferit canonic decât utilizator

Google a ignorat adresa URL canonică specificată și a selectat una diferită pe care a găsit-o mai potrivită.

Această problemă indică faptul că Google nu a găsit suficiente semnale care să indice adresa URL specificată care reprezintă versiunea principală a conținutului dat – aflați cum să remediați Duplicate, Google a ales un alt canonic decât utilizatorul .

Duplicat, adresa URL trimisă nu a fost selectată ca canonică

Această stare indică faptul că ați trimis adrese URL fără o adresă URL canonică și că Google consideră că adresele URL trimise sunt duplicate, așa că a ales o altă adresă URL canonică.

Deși această stare este similară cu Duplicat, Google a ales un alt canon canonic decât utilizator, diferența este că ați solicitat în mod explicit Google să indexeze aceste adrese URL fără a include o adresă URL canonică .

Încă o dată, trebuie să adăugați etichete canonice la adresa URL preferată.

rezumat

Conținutul duplicat nu va duce la penalități Google, dar poate încetini în mod eficient creșterea site-ului dvs. pe web.

De aceea, ar trebui să fiți conștienți de orice pagini duplicate și să vă monitorizați implementările pentru a vă asigura că nu există niciun mecanism care să creeze numeroase pagini fără supravegherea dvs.

Crearea de conținut unic pe pagini, asigurarea coerenței adreselor URL și implementarea etichetelor și redirecționărilor canonice, acolo unde este cazul, sunt modalități excelente de a ajuta Google să indexeze și să indice corect paginile.