Ce este conținutul duplicat?

Publicat: 2022-04-22

Conținutul duplicat se referă la conținut web identic sau foarte asemănător găsit în mai multe locuri – sau la mai multe adrese URL diferite.

Atât Google, cât și Raven Tools estimează conținut duplicat pentru a constitui o cantitate suficientă de internet – 25-30% și , respectiv, 29% . Astfel, există anumite lucruri pe care trebuie să le știți despre conținutul duplicat și relația acestuia cu clasamentul site-ului dvs. în motoarele de căutare.

În acest articol, vom vorbi despre semnificația conținutului duplicat, despre cum apar problemele SEO cu conținut duplicat și despre cum le puteți remedia.

Cuprins

  • Ce înseamnă conținut duplicat în SEO?
  • Cum apar problemele de conținut duplicat și SEO?
  • De ce este a avea conținut duplicat o problemă pentru SEO?
  • Cum să verificați conținutul duplicat
  • Actualizare Panda pentru conținut duplicat
  • Întrebări frecvente despre conținutul duplicat

Ce înseamnă conținut duplicat în SEO?

Înainte de a vorbi despre problemele legate de conținutul duplicat SEO, trebuie să lămurim ce înseamnă acesta în ceea ce privește SEO. Când se vorbește despre conținut duplicat Google, acesta îl definește ca fiind blocuri substanțiale de conținut care sunt identice sau semnificativ similare și care se găsesc în sau între domenii.

După cum sa menționat deja, mai multe surse apreciază că aproximativ un sfert din internet este conținut repetitiv.

Aceasta poate părea a fi o mare problemă, totuși, când este vorba de duplicat conținut online, lucrurile nu sunt atât de îngrozitoare pe cât ați putea crede.

Deși un procent echitabil de conținut este repetat pe adrese URL, acest lucru nu înseamnă întotdeauna că a fost copiat sau furat. De cele mai multe ori, conținutul duplicat este un produs secundar perfect inocent al multor factori.

Cum apar problemele de conținut duplicat și SEO?

Uneori, conținutul duplicat este intenționat, iar alteori, este accidental. Deși ați putea crede că sunteți în clar, deoarece textele dvs. sunt toate originale, poate apărea totuși o problemă de conținut duplicat .

De fapt, majoritatea cazurilor de conținut duplicat nu sunt rău intenționate, înșelătoare și, de multe ori, nici măcar nu sunt intenționate. Să trecem peste motivul principal pentru care conținutul tău poate apărea în mai multe locuri.

WWW vs Non-WWW și HTTP vs HTTPS

Adesea, problemele de conținut duplicat sunt cauzate de greșeli simple în configurarea site-ului dvs. Unul dintre aspectele trecute cu vederea este dacă site-ul dvs. este disponibil atât ca versiune www, cât și ca versiune non-www.
Același lucru se poate întâmpla cu site-urile HTTP și HTTPS.

În esență, site-ul dvs. va fi accesibil într-una dintre următoarele locații:

  • https://www.example.com
  • https://example.com
  • http://www.example.com
  • http://example.com

Dacă site-ul dvs. este disponibil la mai multe dintre acestea și nu reușiți să îl luați în considerare în mod corespunzător, acesta poate fi considerat conținut duplicat, când, de fapt, este doar o pagină.

Slashuri în urmă

O altă problemă similară apare în cazul barelor oblice. În mod convențional, o bară oblică finală denotă un director, în timp ce lipsa unuia denotă un fișier. Indiferent spre care indicați, puteți avea:

  • http://example.com/foo/
  • http://example.com/foo

Google le tratează ca adrese URL separate, ceea ce înseamnă că puteți avea conținut diferit pe ambele pagini. Acest lucru este în regulă în ceea ce privește Google, cu toate acestea, este rău pentru experiența utilizatorului. Oamenii vor găsi această configurație confuză, așa că cel mai bine este ca ambele adrese URL să conducă la aceeași pagină.

Acest lucru ne aduce la problema dublării. Dacă ambele adrese URL sunt disponibile cu același conținut, ați copiat pagina. Din perspectiva Google, acesta este exact același conținut în două locații separate, ceea ce vă poate afecta clasamentul SEO dacă este lăsat nerezolvat.

Parametri URL și navigare cu fațete

Sistemele de căutare fațete sunt o modalitate bună de filtrare a produselor. Cu toate acestea, atunci când nu sunt gestionate, pot crea adrese URL diferite ca urmare a numeroaselor combinații, toate cu același conținut. Acest lucru afectează bugetul de accesare cu crawlere și capitalul de link.

O problemă similară apare cu parametrii URL, cum ar fi ID-urile de sesiune sau ID-urile de urmărire, unde aceeași pagină este accesibilă prin mai multe adrese URL.

Versiuni alternative ale paginii

Urmând tendința de conținut duplicat accidental, ajungem la o altă neglijență comună pentru webmasteri – pagini alternative. Un site, cum ar fi „example.com/page” poate apărea sub o adresă URL diferită ca:

  • Pagina compatibilă cu dispozitivele mobile – m.example.com/page
  • Pagina de tipărire – example.com/print/page
  • Pagina mobilă accelerată (AMP) – example.com/amp/page

Toate aceste versiuni dublează conținutul paginii și provoacă probleme dacă sunt lăsate neremediate.

Paginare

Când vine vorba de pagini de categorii, titluri de postări de blog, recenzii ale utilizatorilor sau comentarii, conținutul poate fi împărțit pe pagini folosind paginarea.

Din nou, dacă nu este gestionat corect, acest lucru poate duce la duplicarea conținutului între adrese URL.

Raclete

Dacă cineva vă fură conținutul și îl publică pe un alt site web, aveți o problemă de conținut duplicat. De obicei, Google poate afla care site este originalul, cu toate acestea, poate doriți să vă adresați scrapers pentru o măsură bună.

Sindicații

Dacă permiteți unui alt site web să vă republice munca, creați conținut duplicat pe mai multe domenii. Deși conținutul sindicalizat nu ar trebui să se claseze peste site-ul original, puteți lua măsuri de precauție pentru a vă asigura că nu se întâmplă.

De ce este a avea conținut duplicat o problemă pentru SEO?

În timp ce mulți au perpetuat ideea unei penalități Google pentru conținut duplicat , acesta nu este ceva de care trebuie să vă faceți griji în general.

Conținutul duplicat nu este o problemă în sine. Cu toate acestea, dacă un text este duplicat pe domenii pentru a manipula clasarea motorului de căutare, devine o problemă.

Conținut duplicat inocent și SEO

Google își asigură utilizatorii că conținutul duplicat nu le va reduce clasamentul în motoarele de căutare, atâta timp cât conținutul este sincer și nu manipulator. Deși acest lucru poate fi adevărat, conținutul duplicat poate duce la o performanță SEO mai slabă.

Deși Google are încredere în pagina pe care alege să o afișeze în rezultatele căutării, uneori, motorul de căutare înțelege greșit.

Să presupunem că aceeași pagină este disponibilă la mai multe adrese URL. Într-un astfel de eveniment, Google va grupa adresele URL duplicate într-un cluster. Acest lucru vă poate afecta în câteva moduri:

  1. Google va selecta „cea mai bună” adresă URL ca reprezentant al clusterului. Uneori, dvs. și Google puteți să nu fiți de acord cu privire la „cea mai bună” adresă URL, provocându-vă probleme de branding și UX;
  2. Deși popularitatea legăturilor ar trebui consolidată pentru toți membrii unui cluster, este posibil ca unele duplicate să nu fie detectate de Google. Acest lucru poate duce la diluarea legăturilor și vă poate afecta eforturile de clasificare a conținutului;

De asemenea, luați în considerare faptul că acest fenomen poate duce la accesarea cu crawlere ineficientă, lăsând Google mai puțin timp pentru a parcurge conținutul dvs. mai nou și actualizat.

Conținut răzuit și sindicalizat

Indiferent dacă ați permis unui alt site să vă republice lucrarea sau dacă ați fost eliminat conținutul, acel conținut apare acum pe mai multe domenii.

În general, acest lucru nu ar trebui să cauzeze probleme, dar uneori, oricât de rar ar fi, conținutul răzuit sau republicat poate depăși originalul.

Din fericire, problemele de conținut duplicat pot fi rezolvate în câteva moduri diferite, care vă ajută să vă optimizați performanța SEO.

Cum să verificați conținutul duplicat

Înainte de a putea rezolva orice problemă, trebuie să știți că acestea există în primul rând. Acest lucru va necesita să căutați conținut duplicat pe site-ul dvs. Puteți face acest lucru în câteva moduri:

1. Google Search Console

Google Search Console poate oferi informații despre performanța paginii dvs. web în rezultatele căutării. Acest serviciu vă poate ajuta, de asemenea, să identificați problemele de conținut duplicat , de exemplu, prin găsirea de adrese URL diferite cu același rang de pagină în rezultatele căutării.

2. Căutare de conținut duplicat

O modalitate rapidă de a verifica dacă există conținut duplicat este prin căutarea în blocuri de text din pagina dvs. - atunci când le căutați, plasați cuvintele între ghilimele.

În mod ideal, ar trebui să apară doar pagina dvs. Dacă există alte rezultate, este posibil să aveți o problemă, deși nu întotdeauna. Puteți încerca acest lucru cu mai multe propoziții.

De asemenea, puteți utiliza bara de căutare Google pentru a căuta site-ul dvs. Tastați „site:” urmat de adresa URL, totul între ghilimele. Aceasta vă va arăta paginile pe care Google le-a indexat și care pot fi clasate.

3. Verificatoare de conținut duplicat

Există diverse verificatoare de plagiat, precum și verificatoare de conținut duplicat Google , care vă pot ajuta să aflați dacă conținutul dvs. nu este original, are o problemă internă de conținut duplicat sau a fost republicat.

Cum să abordați conținutul duplicat

Deși Google se descurcă destul de bine cu conținutul duplicat, puteți oricând să fiți mai implicat și să abordați posibile probleme direct pentru a obține cele mai bune rezultate.

Câteva sfaturi despre ce trebuie făcut includ:

  • Utilizați o redirecționare 301, o adresă URL canonică sau o redirecționare noindex;
  • Fii consecvent în legătura internă;
  • Utilizați domenii de nivel superior – TLD-uri – pentru a trata conținut specific țării;
  • Asigurați-vă că site-urile care conțin conținut sindicalizat conțin un link înapoi către pagina dvs. sau utilizează eticheta noindex;
  • Consolidați pagini cu conținut similar;
  • Trimiteți o solicitare DMCA în cazul conținutului scraped;

Actualizare Panda pentru conținut duplicat

Actualizarea Google Panda a fost lansată în 2011 și a reprezentat o schimbare incredibil de importantă a algoritmului Google. Deși Panda nu a fost menit să abordeze în mod specific conținutul duplicat de pe site-uri web, actualizarea încurajează textul unic și informativ, care include evitarea conținutului repetitiv.

Întrebări frecvente despre conținutul duplicat

Ce înseamnă conținut duplicat în SEO?

Conținutul duplicat reprezintă blocuri substanțiale de text care sunt fie o potrivire completă, fie similare semnificativ cu alte conținuturi online. Conținutul repetitiv reprezintă aproximativ un sfert din internet și de cele mai multe ori nu este de natură înșelătoare sau rău intenționată.

Există o penalizare Google pentru conținut duplicat?

Penalizarea Google pentru conținut duplicat a fost denaturată în măsura în care a devenit în mare parte un mit. Conținutul duplicat nu este penalizat decât dacă încalcă Regulile Google pentru webmasteri și intenționează să manipuleze rezultatele motorului de căutare.

Conținutul duplicat afectează clasamentele SEO?

Conținutul duplicat poate avea un impact negativ asupra strategiei dvs. SEO. Google încearcă să consolideze mai multe adrese URL care duc la aceeași pagină și să arate rezultate originale mai mari decât conținutul republicat. Cu toate acestea, nu este un sistem perfect, deoarece o adresă URL nefavorabilă sau o republicare pe mai multe domenii se poate clasa mai sus decât articolul original. Acesta este motivul pentru care conținutul duplicat trebuie, de asemenea, abordat în mod proactiv.

Cât de mult conținut duplicat este acceptabil?

Nu există nicio măsură definitivă care să sugereze cât de mult din conținutul pe care îl aveți poate fi duplicat. Cu toate acestea, ca regulă generală, nu mai mult de 5% din conținutul duplicat ar trebui să găsească drumul către site-ul dvs. Pentru a gestiona acest procent, apelează la verificatoare de plagiat online.