Ce se întâmplă cu accesarea cu crawlere și cu clasamentele în căutarea Google când 67% din adresele URL indexate ale unui site sunt paginate? [Studiu de caz SEO]
Publicat: 2021-10-07
A existat o mulțime de confuzii și dezbateri de-a lungul anilor despre cum să gestionați cel mai bine paginarea din perspectiva SEO. Nu ajută cu nimic faptul că Google s-a schimbat pe acest front, ceea ce a dus la și mai multă confuzie cu privire la cea mai bună cale de urmat. De exemplu, Google a anunțat în martie 2019 că a încetat să accepte rel next/prev pentru consolidarea proprietăților de indexare dintr-un set paginat (și... și-a dat seama că așa a fost de ani de zile - doar că nimeni nu știa).
Acest lucru i-a șocat pe mulți din comunitatea SEO și i-a făcut pe proprietarii de site-uri și SEO să se întrebe care este cea mai bună modalitate de a gestiona paginarea în avans (dacă sunt necesare modificări!) De exemplu, dacă paginarea poate fi indexată, dacă proprietarii de site-uri folosesc „noindex, follow” în schimb, sau ar trebui doar să canonizeze paginarea la prima pagină din serie? Deoarece paginarea este prezentă pe atât de multe tipuri diferite de site-uri și poate duce la un număr mare de pagini suplimentare pe un site, proprietarii de site-uri și SEO au dorit să abordeze situația cât au putut de bine.
Dar este asta important? Alegerea unei căi greșite va cauza probleme serioase din punct de vedere SEO? Și ce se întâmplă dacă majoritatea paginilor tale indexate sunt paginate? Toate acestea sunt întrebări bune și sper că acest studiu de caz va oferi cel puțin câteva răspunsuri bazate pe un client pe care îl ajut cu multă paginare (cuprinzând 67% din paginile indexate). Da, 67%.
Deci, a cauzat acest lucru probleme mari în ceea ce privește SEO, își petrece Google prea mult din timpul său accesând paginarea cu crawlere, deoarece îi lipsește conținut mai proaspăt, mai important și sunt afectate clasamentele (GASP)? Sa incepem.
Poziția Google cu privire la gestionarea paginației de-a lungul anilor:
Deoarece am ajutat multe site-uri la scară largă de-a lungul timpului cu multă paginare, am putut să văd (și să experimentez) evoluția modului în care Google gestionează paginarea respectivă. Acea experiență m-a determinat să scriu o postare pe blog despre cum să configurez paginarea pentru SEO, care conține toate cele mai recente actualizări și anunțuri de la Google. Și sunt câteva actualizări pe care am avut de acoperit...
În 2012, Maile Ohye de la Google a publicat un videoclip remarcabil care acoperă cele mai bune practici SEO atunci când furnizează paginarea. În acel videoclip, Maile a explicat diferitele moduri în care puteți configura paginarea în funcție de tipul de conținut, inclusiv articolele împărțite în mai multe pagini și paginarea categoriei (cum ar fi pentru comerțul electronic). În acel videoclip, ea a explicat și cum să folosești rel next/prev pentru a consolida proprietățile de indexare dintr-un set paginat. Planul pe care l-a trasat Maile în acel videoclip a devenit fundația pentru configurarea paginației din punct de vedere SEO și am făcut referire adesea la acel videoclip în auditurile, postările și prezentările mele.
Iată o captură de ecran din videoclipul lui Maile Ohye din 2012 care explică mai multe despre rel next/prev pentru paginare. Rețineți, rel next/prev nu mai este acceptat pentru consolidarea proprietăților de indexare în paginare. Mai multe despre asta în continuare:

Google Nukes rel next/prev (și nimeni nu a observat):
După cum am menționat mai devreme, în 2019, Google a aruncat o bombă asupra SEO și a explicat că nu mai acceptă utilizarea rel next/prev pentru a consolida proprietățile de indexare dintr-un set paginat. Și pentru a adăuga insultă la vătămare, ei au explicat, de asemenea, că acest lucru a fost cazul de ani de zile ! Este demn de remarcat faptul că este încă bine să utilizați rel next/prev în scopuri de accesibilitate, dar nu va avea niciun efect SEO.
După cum puteți ghici, SEO au devenit balistic (deși cred că este corect să spunem că suntem fericiți că ne-au spus!) Google și-a dat seama de asta după ce a verificat unele dintre sistemele sale și a observat că rel next/prev nu era folosit pentru indexare și scopuri de clasare. Hopa.

Fiind cineva care a ajutat multe companii să înființeze rel next/prev atunci când folosesc paginarea, ultimul punct m-a făcut să mă gândesc... Dacă rel next/prev nu ar fi fost folosit de ani de zile de Google, iar companiile pe care le-am ajutat nu ar fi fost Observați chiar că Google a încetat să-l mai susțină (clasamentele nu au fost afectate), atunci poate că Google a fost destul de bun la gestionarea paginației.
Cu alte cuvinte, poate că ne îndoim cu toții din formă fără niciun motiv. Din nou, clienții pe care i-am ajutat și care aveau multă paginare nu au văzut nicio mișcare sau scădere majoră pe baza că Google a eliminat suportul pentru rel next/prev. Și asta se potrivește și cu ceea ce John Mueller de la Google a explicat de ceva vreme. La naiba, chiar a explicat asta în firul de tweet din 2019. De exemplu, el a spus „cei mai mulți par să facă paginarea în moduri rezonabile care funcționează...” Voi acoperi mai multe despre recomandările lui John în continuare.

John Mueller de la Google a fost plin de întrebări despre paginare:
De când Google a încetat să mai folosească rel next/prev pentru a consolida proprietățile de indexare, lui John Mueller de la Google i-au fost adresate multe întrebări despre cel mai bun mod de a configura paginarea. Și John a oferit câteva sfaturi grozave în videoclipurile sale din Hangoutul Căutare Centrală.
John a explicat că Google are multă experiență în a se ocupa de paginare (atâta timp cât poate identifica paginarea cu ușurință). Și din moment ce are multă experiență în a se ocupa de paginare, nu ar trebui să aibă un impact mare asupra unui site din punct de vedere SEO. Poate doar „funcționează”.
De asemenea, John explică adesea diferențele dintre împărțirea conținutului articolului în mai multe pagini și a avea pagini de categorie care conțin paginare (afișarea paginilor care duc la alte adrese URL). Acestea sunt două scenarii foarte diferite și pot fi tratate diferit din punct de vedere al paginației, dacă este necesar.
El a explicat, de asemenea, că pentru paginarea categoriei (cum ar fi o pagină de categorie de comerț electronic), puteți avea toate paginile indexabile (ceea ce este de preferat), puteți folosi „noindex, follow” sau puteți chiar canoniza la prima pagină din paginarea. Depinde într-adevăr de cât de bine este reticulat conținutul tău, cât de importantă este paginarea pentru descoperire, pentru transmiterea de semnale etc. Puteți citi postarea mea despre paginare pentru a vedea cele mai recente actualizări de la Google despre asta.
Iată unul dintre cele mai recente videoclipuri ale lui John despre configurarea paginației, care acoperă cea mai mare parte a ceea ce tocmai am explicat (la 13:16 în videoclip):
De asemenea, merită remarcat faptul că Google tocmai a publicat câteva bune practici remarcabile pentru SEO pentru comerțul electronic (unde acoperă și modul în care se gestionează paginarea). În acel document, ei explică să furnizeze etichete canonice cu auto-referință pentru fiecare pagină din paginare (și să evite canonizarea la prima pagină din serie). Asta înseamnă că toată paginarea ar trebui să fie indexabilă.

Avertisment: Nuance Ahead! - Două puncte importante pentru SEO și proprietarii de site-uri despre gestionarea paginației:
Ca și în majoritatea lucrurilor în SEO, există o nuanță implicată în gestionarea paginației. În primul rând, dimensiunea site-ului dvs. este importantă, deoarece nu doriți o paginare prea mare pentru a împiedica bugetul de accesare cu crawlere. După cum a explicat John, dacă nu aveți sute de mii de pagini (sau mai multe), atunci nu ar trebui să vă faceți griji că paginarea va afecta bugetul de accesare cu crawlere. Dar dacă aveți atât de multe pagini, atunci este important să vă asigurați că Google se concentrează pe accesarea cu crawlere pe paginile dvs. cele mai importante. Și asta ar putea duce la gestionarea diferită a paginației pe un site. Mai multe despre bugetul de accesare cu crawlere în curând, în studiul de caz de mai jos.
Celălalt lucru pe care voiam să-l subliniez este că sunt ferm convins că nu ar trebui să ai o paginare excesivă pe secvență. De exemplu, aș evita furnizarea de mii de pagini de paginare per set paginat (ca o categorie cu mii de pagini de paginare). Cred că este bine să ai multe seturi paginate (dacă este necesar), dar aș oferi doar un număr rezonabil de pagini per set (care s-ar baza pe site-ul, conținutul tău etc.) Acest număr poate varia de la un site la altul, dar n-aș Nu vă supraîncărcați paginarea cu mii de pagini pe secvență. Aș face ceea ce este mai bine pentru utilizatori și motoarele de căutare.
De exemplu, iată un site cu aproape 3.700 de pagini de paginare într-o singură categorie...

Studiul de caz: informații de fundal, configurarea paginii și niveluri de indexare.
Site-ul pe care îl acopăr în acest studiu de caz are o amprentă de accesare cu crawlere de aproximativ 200.000 de pagini (între adresele URL indexate și cele excluse). Nu pot intra în prea multe detalii despre ceea ce se concentrează clientul, dar vă puteți gândi la ele ca pe un site care oferă o mulțime de informații despre categorii, organizații, produse și recenzii ale acelor produse. Există și un blog pe site care conține conținut aprofundat concentrat pe nișa lor.
Din punct de vedere al paginației, există destul de mult pe site. Aceasta se întâmplă în principal pe paginile de categorie, organizare și recenzii. Deoarece există multe produse și recenzii care nu sunt bine reticulate pe site (pe baza modului în care funcționează afacerea), paginarea este importantă pentru descoperire (pentru Googlebot și pentru utilizatori). Din acest motiv, ne-am dorit cu siguranță să ne asigurăm că paginarea este indexabilă și că Google poate urmări linkurile de pe URL-urile paginate către paginile de produse, paginile de recenzii etc.
Ajut această companie de mult timp și i-am ajutat să-și elaboreze strategia de paginare încă din 2012. Au folosit abordarea descrisă de Maile Ohye în videoclipul pe care l-am abordat mai devreme. Acolo, fiecare pagină din paginare conține etichete canonice care se auto-referențează, conținea rel next/prev (acum depreciat) și oferă o navigare puternică în text către seria paginată din partea de jos a fiecărei pagini. Amintiți-vă, aceasta a fost configurația recomandată pentru o lungă perioadă de timp. Site-ul are această configurație de ani de zile... și puteți afla mai multe despre această configurație în postarea mea despre configurarea paginației.


Niveluri de indexare: paginare sfântă Batman!
Pe baza cât de multă paginare este pe site, în prezent este un procent mare de adrese URL indexate. Pentru a fi mai precis, paginarea reprezintă 67% din totalul paginilor indexate. Da, mai mult de două treimi din adresele URL indexate sunt paginate! Horror-ul!! :)


Acestea nu sunt neapărat pagini pe care vrem să le clasăm în SERP-uri (altele decât prima pagină din set), dar ne dorim ca Google să descopere toate paginile de destinație din paginare. Și amintiți-vă, rel next/prev trebuia să se ocupe de asta pentru noi, consolidând proprietățile de indexare de pe întregul set paginat și (de obicei) afișând prima pagină din set în SERP-uri. Nu mai este acceptat așa cum am descris mai devreme. Mai multe despre clasamente în curând.
Bugetul de accesare cu crawlere și Statisticile de accesare cu crawlere
Cu atâtea pagini paginate de pe site indexate, cum arată statisticile de accesare cu crawlere? Googlebot trece prin multe pagini paginate și lipsește pagini importante și mai proaspete?
În primul rând, bugetul de accesare cu crawlere este într-adevăr doar ceva pentru care site-urile la scară mai mare trebuie să își facă griji. De exemplu, Google afirmă că site-urile cu peste 1 milion de adrese URL unice sau site-uri de dimensiuni medii cu 10.000 de adrese URL unice cu „conținut care se schimbă rapid” trebuie să-și facă griji cu privire la bugetul de accesare cu crawlere. Acest site are 18,6 mii de adrese URL indexate și o amprentă totală de accesare cu crawlere de sub 200 de mii de adrese URL. Deci, nu este un site mic, dar nici imens.
În plus, este important să înțelegeți că toate paginile nu sunt accesate cu crawlere cu aceeași frecvență (pe baza importanței). John Mueller de la Google a explicat acest punct de multe ori de-a lungul anilor. Deci, deși ar putea exista multă paginare pe site, asta nu înseamnă că Google va accesa cu crawlere în mod continuu toată paginarea în loc de conținutul tău mai proaspăt (sau mai important).
Iată John explicând acest lucru (la 12:42 în videoclip):
Noul conținut al site-ului este accesat cu crawlere relativ rapid. În plus, verificând raportarea statisticilor de accesare cu crawlere, puteți vedea că conținutul mai proaspăt a fost accesat cu crawlere recent și paginarea nu copleșește raportarea. Deci, în ciuda faptului că site-ul are 67% din paginile indexate fiind paginate, este bine din perspectiva bugetului de accesare cu crawlere și a statisticilor de accesare cu crawlere (în opinia mea). Acest lucru are sens pe baza a ceea ce Google a explicat de-a lungul anilor despre bugetul de accesare cu crawlere.
Performanță în timp. Cum arată tendințele?
OK, aici este locul în care cauciucul lovește drumul. A avea atât de multă paginare indexată afectează deloc clasamentele sau performanța căutării organice?
Într-un cuvânt, nu .
Performanța site-ului a fost extrem de stabilă de-a lungul anilor (și printr-o serie de actualizări de bază ample). Au înregistrat o creștere puternică și pe termen lung (mai ales din 2012, când am început să-i ajut).
Iată ultimele 16 luni de tendințe de la GSC:

Iată tendințele privind vizibilitatea căutării în ultimii doi ani:

Și iată tendințele privind vizibilitatea căutării din 2012:

Ce zici de clasarea în paginare în rezultatele căutării (dincolo de pagina unu)? Paginile paginate apar în SERP-uri și generează trafic?
Nu, nu chiar. Reprezintă un procent foarte mic din traficul din Căutarea Google. De exemplu, în ultimele trei luni, s-au înregistrat 1,62 milioane de clicuri din căutarea pe web pe Google. Paginarea a reprezentat doar cinci mii dintre aceste clicuri.
Paginarea reprezintă doar 0,3% din totalul clicurilor din Căutarea Google în ultimele 3 luni:

Cred că cel mai important lucru de reținut pentru acest site este că diversele pagini de „produs” nu sunt legate suficient de la alte zone ale site-ului (pe baza modelului de afaceri al companiei și a modului în care site-ul trebuie configurat). Deci, paginarea este importantă pentru a vă asigura că Googlebot poate ajunge la multe dintre acele adrese URL de destinație. Și de aceea este important să vă asigurați că paginarea este indexabilă, că folosește canonice cu auto-referință etc.
Sfaturi și recomandări finale pentru site-uri cu multă paginare:
Deci iată-l. Un site cu 67% din adresele URL indexate fiind paginate și merge bine în SERP-uri. Nu spun că această abordare ar trebui să folosească fiecare site, dar așa cum a explicat John Mueller de la Google de multe ori, Google are multă experiență în manipularea paginației. De multe ori funcționează... Pentru a încheia această postare, am oferit câteva sfaturi și recomandări finale pentru site-urile care se confruntă cu multă paginare.
- Configurare paginare: Din punct de vedere al configurației, aveți la dispoziție mai multe metode pentru a gestiona paginarea. Calea pe care o alegeți depinde de tipul de conținut cu care aveți de-a face și de structura dvs. internă de legături. Vedeți recomandările mele de mai sus despre conținutul împărțit pe mai multe pagini față de paginile de listare (cum ar fi categoriile) și cât de bine sunt legate paginile de destinație pe site.
- Indexabil versus neindexabil: este important să înțelegeți că, dacă nu aveți paginarea indexată, atunci linkurile de pe acele pagini pot fi eliminate de Google în timp. Deci, dacă doriți să vă asigurați că Google găsește acele adrese URL de destinație prin paginare (și semnale de trecere), aș avea paginarea indexabilă. După cum a arătat acest studiu de caz, poate funcționa foarte bine.
- Canonicalizarea paginației: dacă canonizați toată paginarea la prima pagină a seriei, este important să înțelegeți că rel canonical este doar un indiciu pentru Google. Poate alege în continuare să indexeze anumite pagini dacă consideră că este ceea ce trebuie făcut. Am tratat acest lucru în mai multe postări pe blog de-a lungul anilor. Nu presupuneți că paginile canonizate sunt de fapt canonizate. Acesta este unul dintre motivele pentru care nu sunt un mare fan al canonizării paginii la pagina rădăcină din set.
- Statistici de accesare cu crawlere și fișiere jurnal: nu verificați doar nivelurile de indexare. Aș verifica și raportarea statisticilor de accesare cu crawlere în GSC (și fișierele jurnal dacă le puteți obține). După cum am descris mai devreme în această postare, nu toate paginile sunt accesate cu crawlere cu aceeași frecvență. Google poate accesa cu crawlere anumite adrese URL de pe site-ul dvs. mai frecvent, pe baza cererii de accesare cu crawlere. Aceasta înseamnă că paginarea ar putea să nu fie accesată cu crawlere la fel de mult ca pagina dvs. de pornire, paginile de categorii importante, paginile de produse etc. Nu presupuneți că nivelurile ridicate de indexare pentru paginare înseamnă că există o problemă. Ar putea fi absolut bine.
- Urmărirea performanței: asigurați-vă că urmăriți toate acestea de-a lungul timpului și stabiliți dacă paginarea cauzează probleme din punct de vedere SEO (ceea ce mă îndoiesc în majoritatea cazurilor). Din nou, Google poate gestiona paginarea foarte bine și are multă experiență în acest sens (atâta timp cât poate identifica paginarea cu ușurință). Folosirea paginarii atunci când este necesar este bine (și poate fi bună). Mi-aș face mai multe griji cu privire la numărul de pagini paginate per set decât numărul total de pagini paginate care sunt indexate pe site. După cum am spus mai devreme, asigurați-vă că paginarea dvs. are sens atât pentru utilizatori, cât și pentru motoarele de căutare.
- Recomandările Google: În sfârșit, ascultați John Mueller de la Google și citiți documentația Google. Google are multă experiență în gestionarea paginației pe site-uri și adesea poate „funcționa”. Vă recomand să implementați o soluție de paginare bazată pe propria situație, să analizați acea configurare în timp și să vă asigurați că funcționează pentru dvs.
Rezumat – Da, site-ul dvs. poate fi bine din punct de vedere SEO, cu multe paginații indexate.
Dacă aveți de-a face cu multă paginare pe site-ul dvs., sper că acest studiu de caz a fost util. Știu că a existat o mulțime de confuzii de-a lungul anilor cu privire la paginare și SEO, și mai ales de când Google nuked rel next/prev în 2019. După cum am explicat în această postare, Google are o istorie lungă de a gestiona paginarea și, de obicei, nu va cauza multe probleme în clasamentul unui site (atâta timp cât este configurat corect). Abordarea pe care o luați se reduce cu adevărat la propriul site, la tipul de conținut și la structura internă a legăturilor. Și dacă ajungi să ai o mulțime de paginații indexate, atunci așa să fie. După cum a demonstrat acest studiu de caz, vă poate funcționa foarte bine.
GG
