Cum să remediați „Duplicat, Google a ales un alt canonic decât utilizatorul” în Google Search Console

Publicat: 2022-02-11

Multe site-uri web nu reușesc să-și optimizeze conținutul duplicat într-un mod prietenos cu SEO. De fapt, conform cercetării lui Tomek Rudzki, stările legate de conținutul duplicat sunt a doua problemă ca frecventă în Google Search Console pentru site-urile web de toate dimensiunile.

O problemă predominantă de SEO cu conținut duplicat este atunci când Google nu este de acord cu utilizatorii cu privire la versiunea paginii care este cea principală. În acest caz, este posibil să vedeți starea „Duplicat, Google a ales alt canon decât utilizatorul” în Google Search Console.

Iată ce spune documentația Google despre „Duplicat, Google a ales diferit canonic decât utilizatorul”:

Această pagină este marcată ca canonică pentru un set de pagini, dar Google crede că o altă adresă URL face un canonic mai bun. Google a indexat pagina pe care o considerăm canonică mai degrabă decât aceasta. Vă recomandăm să marcați în mod explicit această pagină ca duplicat al adresei URL canonice. Această pagină a fost descoperită fără o solicitare explicită de accesare cu crawlere. Inspectarea acestei adrese URL ar trebui să arate adresa URL canonică selectată de Google.
sursa: Google

Consecințele indexării de către Google a unui conținut diferit de cel dorit de dvs. variază în funcție de cazurile individuale. Cea mai severă este descurajarea utilizatorilor să viziteze sau să rămână pe pagina dvs., arătându-le rezultate care, de exemplu, lipsesc informații esențiale care sunt prezente în versiunea dvs. preferată.

Acest articol arată cauzele și soluțiile posibile pentru starea „Duplicat, Google a ales un alt canon decât utilizator”.

Conținutul ascunde
1 Unde puteți găsi starea „Duplicat, Google a ales diferit canonic decât utilizatorul”?
1.1 Cum se verifică ce pagină a ales Google ca fiind cea canonică?
2 Cum alege Google pagina canonică?
2.1 Etichete canonice
2.2 Hărți de site
2.3 Legături interne
2.4 HTTPS peste HTTP
2.5 URL-uri cu aspect mai bun
2.6 Redirecționări
3 Cauze și soluții pentru starea „Duplicat, Google a ales diferit canonic decât utilizator”.
3.1 Semnale inconsistente
3.2 Etichetă canonică cu auto-referință, fără conținut unic
3.3 Problemă de randare
3.4 Vizarea diferitelor țări cu aceeași limbă/similară
4 „Duplicat, Google a ales un alt canon canonic decât utilizatorul” vs. „Duplicat, adresa URL trimisă neselectată ca canonică” vs. „Duplicat fără canonică selectată de utilizator”
5 Încheierea

Unde puteți găsi starea „Duplicat, Google a ales diferit canonic decât utilizatorul”?

Puteți verifica starea paginii dvs. în raportul Acoperirea indexului din Google Search Console.

Raportul Acoperirea indicelui include patru grupuri de probleme:

  • Eroare,
  • Valabil cu avertismente,
  • Valabil,
  • Exclus.

„Duplicat, Google a ales diferit canonic decât utilizatorul” aparține categoriei Exclus . Adresele URL excluse nu sunt indexate, iar Google nu crede că este o greșeală.  

Puteți vedea o listă de adrese URL care raportează „Duplicat, Google a ales diferit canonic decât utilizatorul” după ce faceți clic pe stare din secțiunea Detalii.

Matrice

Lista este disponibilă pentru export, dar există o limită de 1000 de adrese URL. Cu toate acestea, dacă aveți mai multe hărți de site, puteți descărca raportul pentru fiecare hartă de site separat și puteți crește numărul de adrese URL exportate.

Cum să verific ce pagină a ales Google ca fiind cea canonică?

Starea „Duplicat, Google a ales diferit canonic decât utilizatorul” nu vă arată ce pagină a ales Google. Tot ce poți vedea este că este una diferită de pagina pe care ai vrut să fie indexată.

Pentru a vedea ce pagină a ales Google, trebuie să navigați la instrumentul de inspecție URL.  

După ce ați introdus adresa URL pe care doriți să o verificați, veți vedea multe informații diferite, inclusiv starea Acoperirii. Puteți extinde această opțiune pentru a vedea canonicul selectat de Google și canonicul declarat de utilizator.

Datorită API-ului de inspecție URL, acum puteți verifica în bloc până la 2000 de adrese URL pe zi, folosind instrumentul de inspecție URL și puteți obține informații despre canonica selectată de Google într-un fișier JSON.

Accesul API adăugat este foarte util pentru oricine se luptă cu Google să aleagă un alt canonic decât cel selectat de utilizator. Fără API, este extrem de consumator de timp să verifici canonicul selectat de Google pe un eșantion mare de adrese URL.

Cum alege Google pagina canonică?

Înainte de a trece la metodele pe care le folosește Google pentru a alege pagina canonică, permiteți-mi să vă explic de ce este esențial ca Google să determine care pagini sunt cele originale:

În primul rând, ghidurile Google afirmă că motorul de căutare „ încearcă din greu să indexeze și să afișeze pagini cu informații distincte. ” De aceea, după ce întâlnește conținut duplicat, îl alege pe cel canonic pe care îl identifică ca fiind cel mai util utilizatorilor săi. În caz contrar, utilizatorii ar vedea multe rezultate diferite care conduc la conținut identic.

În al doilea rând, conform documentației Google, dublurile sunt accesate cu crawlere mai rar” decât paginile canonice. Acesta permite Google să -și salveze resursele pentru accesarea cu crawlere a paginilor mai importante și să reducă sarcina de accesare cu crawlere pe serverul dvs.

Acum, să vedem cum alege Google pagina canonică.

Încercăm să alegem adresa URL canonică urmând două linii directoare generale: În primul rând, ce adresă URL arată ca site-ul dorește să folosim ; Deci, care este preferința site-ului? Și în al doilea rând, care URL ar fi mai utilă pentru utilizator?
sursa: John Mueller

Unele dintre semnalele la care Google se uită atunci când determină versiunea canonică includ:

  • Etichete canonice,
  • Sitemaps,
  • Structura internă de legătură,
  • HTTPS peste protocolul HTTP,
  • URL mai bine aspectat,
  • Redirecționări.

Acești factori sunt indicii pe care le puteți folosi pentru a ajuta Google să înțeleagă ce pagină doriți să fiți indexată. Cu toate acestea, motorul de căutare nu este obligat să le respecte.

Etichete canonice

 <link rel="canonical" href="https://example.com/original-page">

O etichetă canonică este o bucată de cod HTML plasată în secțiunea <head>. Atributul său href include un link către versiunea canonică a unei pagini. Dacă pagina în cauză este o versiune duplicată, necanonică a conținutului dvs., ar trebui să plasați un link către versiunea canonică în atributul href.

Dar puteți adăuga și o etichetă canonică cu auto-referință. O pagină de auto-referință conține o etichetă canonică cu atributul href indicând spre sine. În timpul programului de lucru SEO al Google, John Mueller a recomandat utilizarea etichetelor canonice cu auto-referință, chiar dacă există o singură versiune a paginii.

Recomand să faceți acest canonic autoreferențial, deoarece ne arată cu adevărat ce pagină doriți să fie indexată sau care ar trebui să fie adresa URL atunci când este indexată.

Chiar dacă aveți o singură pagină, uneori există diferite variații ale adresei URL care pot ridica pagina respectivă. De exemplu, cu parametrii la sfârșit, poate cu litere mici mari sau www și non-www, și toate aceste lucruri pot fi oarecum curățate cu o etichetă canonică rel.

sursa: John Mueller

Sitemaps

Sitemap-urile sunt simple fișiere text care listează adrese URL pe care dvs., în calitate de proprietar de site, doriți să fie indexate. Acesta servește ca o foaie de parcurs pentru roboții motoarelor de căutare, permițându-le să găsească rapid adrese URL valoroase, fără a accesa mai întâi întregul site web.

Sitemapurile ar trebui să includă numai adrese URL canonice. Introducerea paginilor duplicat într-un hartă site poate irosi bugetul de accesare cu crawlere (numărul de adrese URL pe care Google le poate accesa și dorește să le acceseze cu crawlere pe site-ul dvs. web) și să încurce motoarele de căutare.

Cu toate acestea, introducerea unei adrese URL într-un sitemap nu garantează că motoarele de căutare vor indexa acea adresă URL. Este doar un indiciu care îi ajută să înțeleagă ce pagini vă pasă cel mai mult. În Ghidul nostru final pentru sitemapurile XML, puteți afla mai multe despre crearea și optimizarea sitemap-ului dvs.

Legătura internă

Modul în care paginile sunt legate între ele ajută motoarele de căutare să găsească toate paginile valoroase și să le determine importanța.

Cu cât pagina este mai valoroasă, cu atât mai multe link-uri ar trebui să indice către ea.

Să ne imaginăm că există două pagini la fel de valoroase. Unul dintre ele este legat doar de pe harta site-ului. Celălalt se găsește cu ușurință în navigare și are link-uri care indică către el din alte pagini de pe site. În acest caz, Google presupune că pagina cu linkuri este mai valoroasă decât cea care se găsește doar în harta site-ului.

Structura internă de legături face parte dintr-o problemă mai complexă numită arhitectura site-ului web. Dacă doriți să aflați mai multe despre el, vă recomand să citiți ghidul nostru amplu despre arhitectura site-ului, care explică în detaliu ce este și cum să proiectați unul perfect pentru site-ul dvs.

HTTPS peste HTTP

HTTP este un protocol care definește transferul de date între un server și un client. HTTPS este versiunea criptată a protocolului. Datorită stratului adăugat de securitate, transmiterea datelor este mai sigură, iar riscul de manipulare a datelor este mai mic.

HTTPS influențează clasarea paginilor dvs.  

Dacă aveți o pagină accesibilă atât în ​​versiunea HTTP, cât și în versiunea HTTPS, Google va alege să indexeze versiunea HTTPS.

URL-uri cu aspect mai bun

URL-urile ajută atât utilizatorii, cât și motoarele de căutare să vadă ce conține o pagină. În calitate de proprietar al site-ului web, aveți control asupra modului în care arată adresele URL. După cum a spus John Mueller, dacă mai multe adrese URL duc la aceeași pagină, Google le poate alege „pe cele mai frumoase”.

Ce înseamnă exact o adresă URL cu aspect mai frumos? Google spune că „Structura URL a unui site ar trebui să fie cât mai simplă posibil”.

Să ne uităm la exemplele a două adrese URL:

  1. https://www.example.com/index.php?id_sezione=360&sid=sdr3bc
  2. https://www.example.com/summer/rochie

A doua adresă URL este cu siguranță „mai frumos”. Acest lucru se datorează faptului că este mai scurt și indică clar ce conține această pagină. Dacă sunteți interesat să aflați mai multe despre structura URL, vă recomand să citiți articolul nostru despre Cum să creați o adresă URL prietenoasă cu SEO.

Redirecționări

Utilizarea redirecționării 301 este una dintre modalitățile prin care puteți consolida conținutul duplicat pe site-ul dvs. Dacă un utilizator sau un robot robot de motor de căutare accesează o pagină, acesta îl va redirecționa automat către una nouă.

Îl puteți folosi atunci când doriți ca o singură versiune a paginii dvs. să rămână disponibilă pe site-ul dvs. web. De exemplu, dacă aveți o versiune www și non-www, puteți utiliza redirecționarea 301 pentru a specifica care dintre acestea ar trebui să rămâneți disponibil și să fiți indexat.

Cauze și soluții pentru starea „Duplicat, Google a ales diferit canonic decât utilizator”.

În unele cazuri, alegerea unui alt URL canonic decât cel al utilizatorului ar putea să nu aducă consecințe. Dacă două pagini sunt identice, cea aleasă de Google s-ar putea clasa la fel de bine ca și cea pe care ați ales-o.

Dar sunt șanse să ai ales o pagină canonică dintr-un motiv. Dacă paginile nu sunt identice, pe cea aleasă de Google s-ar putea să lipsească câteva detalii esențiale, care pot descuraja utilizatorii să vă viziteze site-ul.

Deci, să ne uităm la posibilele cauze pentru care Google ar putea să nu fie de acord cu dvs. cu privire la versiunea canonică și la modalitățile de remediere a problemei.

Google ar putea alege o altă pagină canonică decât cea a utilizatorului din diverse motive, inclusiv:

  • Semnale inconsistente,
  • Etichetă canonică de auto-referință, fără conținut unic,
  • Probleme de randare,
  • Vizează diferite țări cu aceeași limbă/similară.

Semnale inconsistente

După cum se menționează în „Cum alege Google pagina canonică?” capitol, există mai multe semnale pe care le puteți folosi pentru a indica care pagină este cea originală. Cu toate acestea, dacă le utilizați în mod inconsecvent, este posibil să deruteze Google și să-l determine să aleagă adresa URL greșită pentru indexare.

Să ne imaginăm o situație în care aveți trei pagini duplicat:

  • Toate paginile au etichete canonice care indică pagina A,
  • Pagina B este în harta site-ului,
  • Pagina C are cele mai multe link-uri interne care indică către ea.

În cazul unor semnale conflictuale, Google trebuie să ghicească care dintre pagini este cea canonică reală.

Soluţie

Există o soluție la această cauză a statutului „Duplicat, Google a ales un alt canonic decât utilizatorul”: fii consecvent!

Iată câteva sfaturi de care trebuie să țineți cont atunci când configurați semnalele canonice:

  • Evitați să adăugați pagini non-canonice sau pagini cu redirecționări în harta dvs. de site,
  • Asigurați-vă că linkurile dvs. interne sunt consecvente și fiecare link indică versiunea canonică,
  • Etichetele canonice ar trebui să indice versiunea finală, să nu includă o pagină care redirecționează către o altă pagină,
  • Evitați buclele canonice (pagina A are o etichetă canonică care indică pagina B, iar pagina B are o etichetă canonică care indică pagina A) și lanțurile canonice (pagina A are o etichetă canonică care indică către pagina B, iar pagina B are o etichetă canonică arătând spre pagina C).

Etichetă canonică de auto-referință, fără conținut unic

Dacă aveți mai multe pagini cu etichete canonice care se auto-referențează, dar Google decide că nu conțin o valoare unică, ar putea alege o singură pagină de indexat.

Se întâmplă de obicei pe site-urile de comerț electronic când mai multe produse au aceeași descriere.

Dacă vindeți același model de pat în dimensiuni diferite, este posibil să doriți ca toate paginile cu dimensiuni diferite să fie indexate, astfel încât utilizatorii să poată găsi cu ușurință ceea ce caută. La urma urmei, dacă caută un pat king-size și văd doar paturi mici destinate copiilor în rezultatele căutării, s-ar putea să-ți ignore pagina și să viziteze site-ul concurenței.

Dacă cineva caută o bucată de text care se află în această descriere duplicată pe paginile dvs., atunci am recunoaște că această bucată de text se găsește pe o mulțime de pagini de pe site-ul dvs. și am încerca să alegem poate una sau două pagini de pe site-ul dvs. pentru a fi afișat.
sursa: John Mueller

Soluţie

Adăugați conținut unic paginilor dvs.

Nu vă bazați doar pe etichetele canonice cu auto-referință. În schimb, asigurați-vă că fiecare pagină are o valoare unică.

John Mueller a abordat problema descrierilor duplicate în timpul programului de lucru SEO al Google. El a declarat că ar trebui să aveți cel puțin câteva informații text suplimentare care să indice că produsele sunt diferite.

[…]dacă nu aveți nimic în conținutul textual care să acopere elementul vizual al produselor dvs., atunci ne este foarte greu să le arătăm corect în rezultatele căutării. […]

Deci, acesta este unghiul pe care l-aș lua aici: este bine să aveți părți din descriere duplicate. Dar cu siguranță m-aș asigura că aveți cel puțin ceva acolo care să conțină cu adevărat text despre elementele vizuale care sunt unice pentru acele produse individuale pe care le vindeți.

sursa: John Mueller

Problemă de randare

Motoarele de căutare încă nu sunt perfecte în redarea JavaScript. Deci, dacă vă bazați foarte mult pe acesta pentru a vă afișa conținutul, Google ar putea avea probleme în a vedea fiecare element de pe pagina dvs.

Redarea este esențială pentru ca Google și alte motoare de căutare să vadă și să înțeleagă conținutul și aspectul site-ului nostru. Fără randare, conținutul tău nu există online. Am depășit cu mult vremurile în care îți puteai vedea conținutul prin simpla căutare în codul HTML al site-ului web.
sursa: Redarea manifestului SEO – de ce JavaScript SEO nu este suficient

Google ar putea crede că unele pagini sunt duplicate, deoarece nu poate reda conținutul care le face unice.

Să presupunem că aveți trei pagini unice. Fiecare are o etichetă canonică de auto-referință. JavaScript generează conținutul lor principal și, din anumite motive, Google nu îl redă. În schimb, vede doar un spațiu gol și câteva elemente suplimentare, cum ar fi o bară de navigare, care sunt aceleași pentru fiecare pagină. Pentru Google, aceste pagini par duplicate și de aceea alege doar una dintre ele pentru a indexa.

Puteți verifica modul în care Google redă pagina dvs. în instrumentul de inspecție URL din Google Search Console. Instrumentul oferă capturi de ecran ale paginii dvs. redate care vă permit să obțineți informații despre modul în care Google vă vede pagina. Dacă conținutul dvs. lipsește din capturi de ecran, înseamnă că ar putea exista unele probleme cu randarea.

Soluţie

În primul rând, ar trebui să vă asigurați că Google are acces la toate scripturile necesare. Asigurați-vă că resursele JavaScript nu sunt blocate de robots.txt (un fișier pe care îl puteți crea pentru a specifica ce pagini pot fi accesate cu crawlere).

Dacă resursele dvs. sunt accesibile pentru Google, va trebui să evaluați scripturile. Ar trebui să luați în considerare aspecte precum dimensiunea scriptului și dacă aveți nevoie de toate pentru a genera pagina.

Subiectul Rendering SEO este amplu și, dacă nu aveți experiență de codare, este posibil să aveți nevoie de ajutorul dezvoltatorilor dvs. pentru a rezolva unele dintre problemele mai complexe. Pentru mai multe informații, vizitați manifestul nostru Rendering SEO, unde am explicat subiectul în detaliu.

Vizează diferite țări cu aceeași limbă/similară

Dacă aveți pagini care vizează anumite țări care vorbesc aceeași limbă sau o limbă similară (de exemplu, SUA și Marea Britanie), se poate întâmpla ca Google să aleagă doar una dintre ele pentru a indexa.

Să presupunem că singura soluție pe care o utilizați pentru a indica că vizați diferite țări cu aceeași limbă este ca etichetă canonică care face referire la elfi. În acest caz, Google ar putea să nu înțeleagă scopul și să creadă că toate acestea sunt pagini duplicat. Ca urmare, va alege doar unul dintre ele pentru a indexa, iar utilizatorii dvs. ar putea găsi pagini dedicate diferitelor țări în rezultatele căutării lor.

Ar putea fi o problemă deosebit de mare pentru site-urile de comerț electronic, deoarece ar putea duce la incapacitatea clienților de a face o achiziție.

Soluţie

Ar trebui să vă asigurați întotdeauna că aveți etichete hreflang la locul lor.

O etichetă hreflang este o bucată de cod HTML care vă ajută să specificați limba și țara pe care o vizează pagina.

 <link rel="alternate" hreflang=" en-gb " href="https://en-gb.example.com/item">
<link rel="alternate" hreflang=" en-us " href="https://en-us.example.com/item">

Eticheta hreflang vă permite să specificați nu numai limba (en – engleză), ci și țara (gb – Marea Britanie, noi – Statele Unite).

Un alt lucru pe care îl puteți face este să vă asigurați că conținutul dvs. nu este doar tradus, ci și localizat. Chiar dacă limba este aceeași, diferite țări au culturi diferite. Asigurați-vă că vă ajustați paginile pentru utilizatorii dintr-o anumită țară. Această practică nu numai că oferă o experiență de utilizator mai bună pentru clienții dvs., dar ar putea convinge și Google că aceste pagini sunt unice.

Nu în ultimul rând, ar trebui să aveți un plan de rezervă în cazul în care tehnicile menționate mai sus eșuează. Creați un banner JavaScript care să apară în funcție de locația utilizatorului. Dacă detectează că, de exemplu, un utilizator din Marea Britanie intră într-o versiune pentru SUA, va sugera o versiune mai potrivită și va lăsa clientul să decidă dacă dorește să rămână sau să viziteze o pagină desemnată pentru regiunea sa.

„Duplicat, Google a ales un alt canon canonic decât utilizator” vs. „Duplicat, adresa URL trimisă neselectată ca canonică” vs. „Duplicat fără canonică selectată de utilizator”

„Duplicat, Google a ales un alt canonic decât utilizator” poate fi ușor confundat cu două stări diferite în raportul Acoperirea indexului:

  • „Duplicat, adresa URL trimisă nu este selectată ca canonică” și
  • „Duplicați fără canonice selectate de utilizator.”

Aceste stări indică același lucru: pagina nu este indexată pentru că Google crede că nu este canonică.

Diferența constă în modul în care Google a aflat despre pagină și dacă utilizatorul a declarat sau nu o etichetă canonică.

Principala diferență dintre ele este că „Duplicat, Google a ales diferit canonic decât utilizator” a specificat deja o etichetă canonică pe care Google nu a preluat-o. În schimb, celelalte două stări nu aveau nicio etichetă canonică definită de utilizator.

În plus, ați solicitat în mod explicit ca adresa URL de raportare „Duplicat, adresa URL trimisă nu este selectată ca canonică” să fie indexată prin trimiterea acesteia în harta site-ului dvs.

Încheierea

Dacă vedeți starea „Duplicat, Google a ales diferit canonic decât utilizatorul” și credeți că Google nu a ales pagina potrivită pentru indexare, există câteva lucruri pe care le puteți face pentru a oferi paginii dvs. preferate cele mai bune șanse de a fi indexată:

  • Fiți consecvenți în trimiterea de semnale canonice: asigurați-vă că numai pagina canonică este în harta site-ului dvs. și că linkurile interne indică către aceasta,
  • Asigurați-vă că fiecare pagină are o valoare unică. Dacă paginile dvs. de produse au aceeași descriere, adăugați conținut textual care indică faptul că produsele sunt diferite,
  • Asigurați-vă că conținutul dvs. este redat corect în instrumentul de inspecție URL,
  • Nu traduceți doar conținutul în diferite limbi, ci și localizați -l pentru țara pe care o vizați,
  • Nu uitați întotdeauna să adăugați etichete hreflang pentru conținutul care vizează mai multe țări.