Cum să verificați starea de indexare a unui site web mare

Publicat: 2022-02-04

Înainte ca paginile dvs. să apară în rezultatele căutării și să genereze trafic către site-ul dvs., acestea trebuie să fie indexate.

Din păcate, indexarea este o provocare, mai ales dacă aveți un site web mare. Conform cercetării noastre, 16% dintre paginile valoroase de pe site-uri web nu sunt indexate.  

Înainte de a lua măsuri pentru a îmbunătăți performanța de indexare și de căutare a site-ului dvs., este esențial să verificați acoperirea indexului site-ului dvs. și să identificați care dintre paginile dvs. sunt indexate corect și care nu.

O provocare cu care vă confruntați este să găsiți metode fiabile de a verifica starea de indexare a site-ului dvs., care vă permit să analizați adresele URL în bloc. Dacă acesta este cazul, ați ajuns la locul potrivit.

Există câteva instrumente utile care vă pot ajuta să determinați acoperirea indexului site-ului dvs., dar vă pot ajuta și la o analiză mai amănunțită a fiecărei adrese URL pentru a identifica de ce nu este indexată.

Urmați sfatul meu din acest articol pentru a afla cum să verificați starea de indexare a unui site web mare, să analizați problemele care împiedică indexarea paginilor și să găsiți soluțiile potrivite pentru acestea.

Conținutul ascunde
1 Ce trebuie să faceți înainte de a verifica starea de indexare a site-ului dvs. web
2 Metode pentru a vă verifica starea de indexare și a diagnostica problemele de indexare
2.1 Comanda „site:”.
2.2 Instrumente în Google Search Console
2.2.1 Raportul Acoperirea indicelui
2.2.2 Instrument de inspecție URL
2.2.3 API-ul de inspecție URL
2.2.4 Limitări ale instrumentelor Google Search Console
2.2.5 Raportați o problemă de indexare
2.3 ZipTie
2.3.1 Analizați acoperirea indicelui
2.3.2 Monitorizarea întârzierilor de indexare
2.3.3 Alerte privind conținutul deindexat
2.3.4 Indexarea JavaScript
2.3.5 Informații suplimentare despre paginile neindexate
2.4 Instrumentele Bing pentru webmasteri
2.4.1 Site Explorer
2.4.2 Instrumentul Bing de inspecție URL
3 Probleme comune de indexare pentru site-urile web mari
4 Cum să abordați problemele de indexare
4.1 Asigurați-vă că paginile dvs. sunt indexabile
4.1.1 Directivele specificate în fișierul robots.txt
4.1.2 Dacă paginile conțin etichete noindex
4.2 Asigurați-vă că toate paginile valoroase sunt trimise într-o hartă a site-ului
4.3 Ajustați legătura internă
4.4 Remediați problemele de conținut duplicat
4.5 Urmați cele mai bune practici de SEO JavaScript pentru accesarea cu crawlere și indexare mai ușoară
4.6 Optimizați-vă bugetul de accesare cu crawlere
5 produse la pachet

Ce trebuie să faceți înainte de a verifica starea de indexare a site-ului dvs. web

Înainte de a vă verifica starea de indexare și de a vă aborda problemele, trebuie să aveți o strategie de indexare adecvată.

Prin crearea acestuia, puteți determina care pagini sunt esențiale și care trebuie indexate și care ar trebui excluse de la indexare.

Unele dintre paginile dvs. pot avea o calitate scăzută sau pot conține conținut duplicat, iar utilizatorii nu ar trebui să le găsească în rezultatele căutării. De regulă, acestea sunt tipurile de pagini care ar trebui păstrate în afara indexului.

Iată câteva exemple de pagini care nu ar trebui indexate:

  • Conținut arhivat,
  • pagini protejate cu autentificare și parolă,
  • Adrese URL cu parametri adăugați, create ca rezultat al sortării sau filtrării,
  • Rezultatele căutării interne,
  • Va multumesc pagini.

Dacă nu doriți ca o pagină să fie indexată, puteți:

  • Includeți directive adecvate pentru roboți în fișierul robots.txt pentru a le împiedica să acceseze cu crawlere o anumită pagină,
  • Implementați eticheta noindex pentru a împiedica roboții motoarelor de căutare să indexeze o pagină.

Adresele URL care nu au fost indexate și care ar trebui să rămână astfel nu necesită atenția dvs. În schimb, concentrează-te pe paginile care nu sunt indexate, dar ar trebui să fie.

Ca regulă generală, ar trebui să urmăriți ca versiunile canonice ale paginilor dvs. să fie indexate și ar trebui să fie trimise în harta site -ului dvs.  

Deci, cum poți afla exact ce pagini sunt indexate și care nu?

Metode de verificare a stării de indexare și de diagnosticare a problemelor de indexare

Există câteva instrumente utile pentru a verifica acoperirea indexului site-ului dvs.

Dar rețineți că majoritatea dintre ele au limitări pentru numărul de adrese URL pe care le puteți verifica. Când căutați online, puteți întâlni multe instrumente care nu sunt de încredere.

Vă voi arăta care instrumente afișează cele mai precise informații și soluții alternative pentru a le extinde limitele.  

De asemenea, vă voi prezenta un nou instrument de analiză de indexare dezvoltat de compania noastră soră, ZipTie.

Comanda „site:”.

O metodă populară de a verifica numărul de pagini indexate al unui site este să introduceți comanda „site:” în Căutarea Google, urmată de numele domeniului, cum ar fi „site:onely.com”.

Deși vă permite să verificați starea de indexare a unui site web, datele pe care le veți vedea pot fi înșelătoare sau inexacte, deoarece cifrele sunt doar estimări.

Această metodă va fi deosebit de inexactă pentru site-urile web mari cu conținut care se schimbă dinamic.

Se poate întâmpla ca de fiecare dată când îl utilizați, rezultatele să arate un număr complet diferit de pagini indexate pentru domeniul dvs.

Cu toate acestea, deși comanda „site:domain” este departe de a fi optimă, puteți utiliza comanda „site:URL”, în care introduceți o anumită adresă URL în loc de un nume de domeniu. Puteți afla apoi dacă adresa URL anume a fost indexată.

John Mueller a recomandat această soluție:

Instrumente în Google Search Console

Google Search Console oferă instrumente mult mai bune pentru verificarea acoperirii indexului.

Dacă nu le utilizați deja în mod regulat, începeți chiar acum – ar trebui să devină instrumentele dumneavoastră standard de monitorizare SEO.

Permiteți-mi să le descriu mai detaliat și să vă sfătuiesc cum să profitați la maximum de ele pe un site web mare.

Raportul de acoperire a indicelui

Raportul Acoperire indexată din Google Search Console vă oferă date de la Google despre paginile indexate.

În plus, vă oferă o perspectivă asupra stărilor specifice ale adreselor URL cu privire la descoperirea, accesarea cu crawlere și indexarea acestora și, dacă este cazul, despre ce problemă a găsit Google care le împiedică să fie indexate.

stările raportului de acoperire a indexului

Raportul Acoperire index arată patru stări:

  • Eroare – pagina nu este indexată ca urmare a unei erori.
  • Avertisment – ​​pagina este indexată, dar Google a găsit o problemă de care ar trebui să știți,
  • Exclus – pagina nu este indexată, dar Google crede că intenționați să o păstrați neindexată.
  • Valabil – pagina este indexată fără probleme.

În colțul din stânga sus, puteți alege între afișarea „Toate paginile cunoscute” – adică toate adresele URL pe care Google le-a descoperit în vreun fel – sau „Toate paginile trimise” – paginile găsite de Google în harta dvs. de site.

Vizualizarea „Toate paginile trimise” ar trebui să conțină toate paginile pe care doriți să le indexați. Ar trebui să comparați această vizualizare cu „Toate paginile cunoscute”.

Dacă unele pagini apar în „Toate paginile cunoscute”, dar nu în „Toate paginile trimise” și ar trebui să fie indexate, plasați-le în harta site-ului. Dacă nu ar trebui să fie indexate, înseamnă că Google le găsește în altă parte, poate prin link-uri.

Principala limitare a raportului este că fiecare raport care afișează probleme specifice arată doar 1000 de pagini. Din fericire, există modalități de ocolire.

O soluție este să creați proprietăți de domeniu separate pentru diferite secțiuni ale site-ului dvs.

O alternativă ar fi să vă împărțiți paginile prin crearea mai multor sitemap-uri și restrângerea raportului la un sitemap separat.

filtrați pe sitemap-uri

Se recomandă ca fiecare sitemap să conțină maximum 50000 de adrese URL.

Există multe unghiuri de împărțire a paginilor între sitemap-uri. Luați în considerare aranjarea acestora într-un mod care vă va ajuta să grupați tipuri similare de conținut pentru o analiză mai ușoară.

Iată câteva sugestii:

  • Sitemap-uri separate pentru diferite tipuri de conținut, de exemplu, categorii, produse, postări de blog,
  • Sitemap-uri separate pentru o cantitate sau un tip de produse selectate,
  • Sitemap-uri separate pentru versiuni în diferite limbi ale site-ului.

Acum, alegeți unul dintre hărțile site-ului și navigați la secțiunea Excluse a raportului.

Parcurgeți problemele pe care le afișează – în partea dreaptă, puteți vedea numărul de pagini afectate și puteți afla care probleme sunt cele mai frecvente.

probleme în raportul de acoperire a indexului Google

Stările raportului descriu cauzele fiecărei probleme în mod destul de descriptiv și, în majoritatea cazurilor, indică acțiunile pe care trebuie să le întreprindeți pentru a le remedia.

Examinați cum să abordez fiecare stare în ghidul meu complet pentru raportul Acoperire index al Google Search Console.

Căutați modele în paginile dvs. excluse. Dacă multe pagini au conținut sau aspect similar, examinarea doar a unei părți a adreselor URL vă poate oferi o idee despre cu ce se confruntă paginile rămase.

Instrument de inspecție URL

O altă funcție utilă disponibilă în Google Search Console este instrumentul de inspecție URL.  

Vă permite să verificați dacă o anumită adresă URL este în indexul Google și să vedeți o mulțime de informații suplimentare. Puteți folosi acest instrument pentru a completa datele pe care le primiți din raportul de acoperire a indexului.

instrument de inspecție URL

Iată o prezentare generală a celor mai importante caracteristici ale instrumentului de inspecție URL:

  • Starea prezenței – dacă adresa URL este sau nu eligibilă pentru a apărea în rezultatele căutării Google și în orice avertismente sau erori detectate de Google.
  • Vizualizați pagina accesată cu crawlere – detalii tehnice, cum ar fi răspunsul HTML și HTTP primit de Google.
  • Solicitați indexare – utilizați-l pentru a cere Google să acceseze din nou cu crawlere și să reindexeze adresa URL. Există o limită zilnică pentru această funcție. Deși nu este specificat în mod explicit în documentația Google, este menționat ca o metodă de a trimite „doar câteva adrese URL”. Vă poate permite să trimiteți până la 50 de adrese URL .
  • Detalii despre starea de acoperire a unei pagini, și anume:
  1. Dacă orice sitemap cunoscut indică adresa URL,
  2. Pagina de referință – o pagină pe care Google ar fi putut-o folosi pentru a descoperi adresa URL,
  3. Când pagina a fost accesată ultima dată cu crawlere,
  4. Indiferent dacă o pagină poate fi accesată cu crawlere,
  5. Dacă o pagină poate fi preluată de pe server,
  6. Dacă o pagină este indexabilă,
  7. URL-ul canonic declarat de utilizator,
  8. Adresa URL canonică pe care Google a selectat-o ​​în schimb.
  • Îmbunătățiri – această secțiune arată dacă Google a găsit date structurate valide pe o pagină, precum și detalii despre capacitatea de utilizare a paginii pentru dispozitive mobile și AMP.
  • Testare URL live – puteți rula un test live pe o adresă URL, de exemplu dacă doriți să validați remedieri sau modificări.

Instrumentul de inspecție URL vă solicită să vă verificați starea de indexare pe adresă URL, ceea ce poate consuma mult timp dacă aveți un site web mare.

Cu toate acestea, analiza unui eșantion de pagini vă poate indica deja problemele cu care se confruntă site-ul dvs.

În loc să inspectați toate adresele URL, puteți selecta și verifica o parte din adresele URL care au fost excluse din indexul Google. De asemenea, puteți colecta adrese URL care ar trebui indexate, dar care nu primesc trafic organic.

Mai mult, site-ul dvs. poate avea următoarele secțiuni:

  • exemplu.com/shop
  • example.com/blog
  • exemplu.com/galerie.

Puteți alege un număr de adrese URL de analizat din fiecare secțiune distinctă. Dar nu selectați doar câteva adrese URL - utilizați un eșantion reprezentativ pentru fiecare secțiune.

API-ul de inspecție URL

În 2022, Google a anunțat lansarea API-ului de inspecție URL, care vă permite să trimiteți până la 2000 de solicitări pe zi pentru o singură proprietate Google Search Console.

Aceasta este o veste grozavă pentru oricine a considerat că datele Instrumentului de inspecție URL sunt utile, dar s-au luptat să verifice o singură adresă URL la un moment dat. Accesând datele de inspecție URL printr-un API, puteți automatiza procesul, ceea ce deschide mai multe posibilități noi de utilizare a acestor informații.

Limitări ale instrumentelor Google Search Console

Instrumentele Google Search Console nu sunt lipsite de defecte.

În octombrie 2021, utilizatorii au raportat că au văzut adrese URL în raportul Acoperirea indexului marcate ca „ Accesate cu crawlere – momentan neindexate ”. Cu toate acestea, atunci când au fost inspectate cu instrumentul de inspecție URL, aceste adrese URL au fost listate ca „Trimise și indexate” sau altă stare.

Google a răspuns că această situație nu este o eroare, ci mai degrabă o limitare a raportului de acoperire a indexului:

Raportați o problemă de indexare

Google a anunțat în aprilie 2021 că va introduce o funcție numită Raportați o problemă de indexare pentru a ajuta utilizatorii să-l informeze pe Google cu privire la o problemă de indexare. Funcția este disponibilă în prezent în SUA.

Utilizatorii pot accesa un formular și pot selecta dacă site-ul sau paginile lor nu sunt indexate sau sunt indexate, dar nu se clasifică corect. Ei vor fi apoi ghidați prin opțiunile de depanare legate de problema raportată.

Dacă aceste soluții eșuează, pot raporta problema direct la Google.

Cu toate acestea, această funcție ar trebui tratată ca o ultimă soluție și nu este garantat că Google vă va urma solicitarea și vă va indexa conținutul.

Google își propune să indexeze doar conținutul cel mai relevant și de înaltă calitate. Prin urmare, respectarea celor mai bune practici și optimizarea paginilor dvs. pentru a le face accesabile cu crawlere, indexabile și demne de atenția Google poate oferi site-ului dvs. rezultate de lungă durată.

ZipTie

ZipTie oferă un sortiment de funcții extinse pentru analiza stării de indexare a oricărui site web, indiferent de dimensiunea acestuia. Instrumentul este benefic în special pentru site-urile web mari, de tip enterprise.

Iată exact ce oferă ZipTie:

Analizați acoperirea indicelui

Caracteristica de bază a ZipTie este că vă spune ce pagini nu au fost indexate de Google.  

Și, ceea ce este esențial, nu există limită pentru numărul de adrese URL pe care ZipTie le poate analiza. Acest lucru este important pentru site-urile web mari cu mii sau milioane de adrese URL care nu pot fi evaluate cu succes folosind alte instrumente.

În mod esențial, puteți verifica acoperirea indexului oricărui domeniu - nu numai al dvs., ci și al concurenților dvs. Apoi, comparați starea dvs. de indexare cu domeniile concurente și vedeți ce domenii ar trebui să îmbunătățiți pentru a merge mai departe.

Monitorizați întârzierile de indexare

ZipTie vă permite să monitorizați întârzierile de indexare și să estimați când conținutul dvs. nou publicat va fi indexat și când vă puteți aștepta ca acesta să genereze trafic.

Acest lucru se realizează prin analizarea noilor URL-uri adăugate în hărțile dvs. de site și investigarea intervalului de timp dintre publicarea conținutului și momentul în care acesta apare în rezultatele căutării.

Alerte privind conținutul deindexat

ZipTie vă va actualiza cu privire la cantitatea de conținut care a fost deindexat. Paginile care au fost deja indexate pot fi eliminate din indexul Google după ceva timp – această caracteristică vă permite să reacționați rapid atunci când se întâmplă.

Indexare JavaScript

Indexarea paginilor bazate pe JavaScript este dificilă – dar ZipTie oferă o mână de ajutor.

Mai exact, ZipTie poate determina dacă Google a indexat anumite fragmente de pagină generate cu JavaScript.

Este vital să înțelegeți dacă Google are probleme la redarea și indexarea conținutului dvs. bazat pe JavaScript. Dacă acesta este cazul, ZipTie vă poate anunța exact care elemente ale paginii sunt problematice.

Informații suplimentare despre paginile neindexate

Ca bonus, ZipTie oferă informații suplimentare despre adresele URL neindexate , cum ar fi numărul de cuvinte, titlurile, anteturile, numărul de imagini, metadescrierea și multe altele. Acest lucru este semnificativ atunci când se investighează posibilele cauze ale problemelor de indexare și se identifică modele între paginile neindexate.

Puteți exporta datele din ZipTie ca fișier CSV și le puteți combina cu ușurință cu datele din alte instrumente, cum ar fi Google Analytics sau Google Search Console.

ZipTie nu este încă disponibil în mod deschis. Mai multe detalii despre acesta vor fi lansate pe măsură ce dezvoltarea instrumentului avansează. Puteți rămâne la curent cu lansarea oficială înregistrându-vă la lista de corespondență a ZipTie.  

Dar nu trebuie să așteptați.

Luați legătura cu echipa ZipTie chiar acum pentru a efectua o analiză aprofundată a stării de indexare a site-ului dvs. web.

Instrumente Bing pentru webmasteri

Chiar dacă apariția în Bing nu este prioritatea dvs., Bing Webmaster Tools vă poate ajuta să obțineți o perspectivă asupra tuturor tipurilor de probleme de indexare, dintre care unele s-ar putea să vă confruntați și în alte motoare de căutare.

Site Explorer

În primul rând, să ne uităm la Site Explorer.  

Instrumentul Site Explorer vă permite să navigați prin structura site-ului dvs. și detalii despre starea de indexare a paginilor, printre alte date:

bing site explorer

Un aspect care face ca Site Explorer să iasă în evidență este opțiunea de a grupa adrese URL pe folder, unde fiecare folder poate reprezenta un subdomeniu sau o parte din calea URL-ului. Drept urmare, aveți acces la date pentru un număr semnificativ de pagini.

Informațiile de accesare cu crawlere la care aveți acces includ:

  • Indexat – numărul de adrese URL indexate dintr-un folder dat,
  • Eroare – erori critice de accesare cu crawlere care au dus la neindexarea adreselor URL specificate,
  • Avertisment – ​​s-a constatat că aceste adrese URL au probleme cu liniile directoare, probleme temporare de accesare cu crawlere, interzise în robots.txt etc. Monitorizați această secțiune în mod regulat pentru a identifica eventualele creșteri sau scăderi ale adreselor URL afectate,
  • Excluse – URL-uri care au fost excluse din index, de exemplu, din cauza încălcărilor de spam sau a unui rang scăzut.

Aveți opțiunea de a filtra în continuare adresele URL pentru a afișa pagini în funcție de caracteristici specifice.

Bing filter by

Aceste filtre vă permit să identificați adresele URL care necesită atenția dvs. și să vă îndrepte în direcția corectă atunci când abordați problemele de indexare.

Instrumentul Bing de inspecție URL

O altă caracteristică excelentă este instrumentul de inspecție URL Bing care completează Site Explorer. Vă permite să verificați dacă o anumită adresă URL se află în indexul Bing și dacă au fost recunoscute erori de indexare sau de accesare cu crawlere.

Lipiți o adresă URL în instrument - veți vedea apoi o mulțime de informații suplimentare.

În secțiunea Fișă de index , puteți vedea starea de indexare a unei adrese URL și detalii despre aceasta, cum ar fi când a fost descoperită adresa URL și cum a fost accesată cu crawlere.

De asemenea, puteți vizualiza codul HTML al paginii și răspunsul HTTP pe care l-a primit sistemul.

instrument de inspecție a adreselor URL bing

Dacă adresa URL nu a fost indexată din cauza unor erori, veți putea lua măsuri suplimentare, cum ar fi solicitarea de indexare a unei adrese URL, contactați asistența, efectuați ajustări la fișierul robots.txt etc.

Bing oferă îndrumări despre motivul pentru care o pagină poate să nu fie indexată - iată câteva motive:

  • Nu există linkuri către pagina ta,
  • Pagina nu îndeplinește pragurile de calitate,
  • Directivele Robots.txt blochează accesarea cu crawlere a paginii,
  • Există și alte probleme de accesare cu crawlere a paginii – funcția Live URL vă va ajuta să o examinați mai detaliat,
  • Pagina are o etichetă noindex care împiedică indexarea acesteia,
  • Adresa URL nu a fost descoperită și accesată cu crawlere încă și pur și simplu are nevoie de mai mult timp,
  • Pagina încalcă regulile de calitate și a fost penalizată și eliminată din index.

Puteți utiliza acest lucru ca punct de referință atunci când diagnosticați problemele de indexare în alte motoare de căutare, cum ar fi Google.

Dacă adresele URL nu sunt indexate și ar trebui să fie, Bing vă permite să trimiteți adrese URL pentru indexare .

Ceea ce este important este că limita este relativ mare – puteți trimite până la 10.000 de adrese URL pe zi. Aceasta depășește cu mult limita raportată de Google de până la 50 de adrese URL.

Probleme comune de indexare pentru site-urile web mari

Problemele de indexare apar pe majoritatea site-urilor și pot avea un efect dezastruos asupra performanței de căutare organică a site-ului dvs.

Tomek Rudzki a analizat cele mai frecvente probleme de indexare pentru diferite dimensiuni de site-uri web.

Prin cercetările sale, știm acum că site-urile web mari suferă de obicei de următoarele probleme:

  • Accesat cu crawlere – momentan nu este indexat,
  • Descoperit – momentan neindexat,
  • Conținut duplicat,
  • Soft 404,
  • Probleme de crawler.

O altă problemă tipică se referă la conectarea internă. Googlebot trebuie să urmeze o cale pentru a găsi o pagină – dacă nu este conectată cu alte pagini, poate fi păstrată în afara indexului.

Cum să rezolvi problemele de indexare

Puteți lua măsuri pentru a maximiza șansele de a vă indexa paginile.

Aceste soluții sunt utile și atunci când găsiți adrese URL neindexate și nu puteți identifica de ce nu sunt indexate.

Asigurați-vă că paginile dvs. sunt indexabile

A afla dacă paginile tale sunt indexabile constă în a analiza două aspecte:

Directivele specificate în fișierul robots.txt

Robots.txt conține instrucțiuni pentru crawlerele web despre ceea ce ar trebui accesat cu crawlere pe un site. Asigurați-vă că nu există nicio directivă „Disallow” care să împiedice accesarea cu crawlere a paginilor dvs. valoroase.  

Dacă paginile conțin etichete noindex

Etichetele Noindex permit roboților motoarelor de căutare să viziteze paginile, dar le împiedică să fie indexate.

Pentru a verifica în bloc dacă paginile dvs. sunt indexabile, utilizați un crawler SEO - de exemplu, Screaming Frog.  

Puteți lipi o listă cu adresele URL în instrument și puteți începe accesarea cu crawlere. Când ați terminat, uitați-vă la coloana Indexabilitate, care vă va spune dacă o pagină este indexabilă sau neindexabilă.

indexabilitatea broaștei țipătoare

Asigurați-vă că toate paginile valoroase sunt trimise într-o hartă a site-ului

Verificați dacă paginile neindexate au fost trimise într-un hartă site - dacă nu, adăugați-le în consecință.

În plus, asigurați-vă că sitemapurile dvs. nu conțin adrese URL care nu ar trebui să fie indexate în primul rând. Permiterea motoarelor de căutare să descopere și să acceseze cu crawlere pagini irelevante poate duce la accesarea cu crawlere ineficientă și poate prelungi timpul necesar roboților pentru a găsi conținutul dvs. de cea mai bună calitate.

Dacă nu aveți un sitemap, îl puteți crea cu ușurință sau utiliza instrumente dedicate care îl vor menține la zi, precum Yoast SEO sau Screaming Frog's SEO Spider . De asemenea, puteți utiliza unul dintre instrumentele generatoare de harți site.  

Ghidul nostru final pentru hărți de site va fi resursa dvs. numărul unu pentru crearea unui sitemap optimizat.

Ajustați legătura internă

Legăturile interne sunt un aspect crucial al site-ului dvs. din perspectiva SEO.

Pur și simplu includerea unei adrese URL într-o hartă a site-ului nu este suficientă pentru Google. Googlebot trebuie să se asigure că o adresă URL merită atenția sa - din acest motiv, trebuie să găsească semnale care să-i sublinieze importanța.

Asigurați-vă că nu aveți pagini orfane, adică pagini fără linkuri de intrare. Vă puteți accesa cu crawlere site-ul web pentru a găsi pagini orfane – de exemplu, faceți-o folosind raportul Pagini orfane de la Screaming Frog.

Câteva idei pentru îmbunătățirea legăturilor interne includ crearea de secțiuni pentru produse similare sau scrierea de postări de blog pentru a trimite către alte pagini de pe site-ul dvs.

De asemenea, trebuie să aveți o arhitectură a site-ului web curată . Înseamnă organizarea conținutului de pe site, astfel încât utilizatorii și roboții să poată naviga intuitiv și rapid la fiecare secțiune a site-ului dvs.

Remediați problemele de conținut duplicat

Atunci când pe site-ul dvs. există mai multe versiuni ale aceluiași conținut sau foarte asemănător, motoarele de căutare pot avea dificultăți să decidă care pagină este cea mai reprezentativă versiune.

Pentru a ușura munca motoarelor de căutare, implementați etichete canonice care să trimită către adresele URL canonice selectate de dvs. Fiecare versiune de pagină ar trebui să aibă o singură adresă URL canonică.

Puteți utiliza instrumentele Google Search Console pentru a determina dacă Google respectă această adresă URL ca fiind cea canonică sau dacă a selectat o adresă URL diferită.

Asigurați-vă că etichetele canonice indică în mod constant paginile canonice potrivite. Dacă indică pagini duplicate, adresa URL principală poate rămâne neindexată.

Urmați cele mai bune practici de SEO JavaScript pentru accesarea cu crawlere și indexare mai ușoară

Deși motoarele de căutare s-au îmbunătățit mult la randarea și indexarea JavaScript, gestionarea lor încă nu este perfectă.

În general, motoarele de căutare nu pot reda JavaScript pe o pagină dacă cred că nu va aduce modificări semnificative conținutului acesteia. De asemenea, dacă paginile tale arată complet diferit cu și fără JavaScript, s-ar putea să te străduiești să le indexezi.

Există instrumente pe care le puteți utiliza pentru a analiza indexarea JavaScript.

Puteți verifica cu ușurință ce părți ale paginii dvs. se bazează pe JavaScript folosind instrumentul Ce ar face JavaScript .

Utilizați Testul în timp real din instrumentul de inspecție URL al Google pentru a vedea o captură de ecran a modului în care Googlebot ar reda conținutul JavaScript pe pagina dvs. Puteți accesa apoi fila Mai multe informații pentru a căuta erori JavaScript.

Opțiunea Vizualizați pagina accesată cu crawlere din instrumentul de inspecție URL vă va spune ce a accesat cu crawlere Google pe pagina dvs. și dacă tot conținutul JavaScript este acolo.

În cazul problemelor legate de indexarea JavaScript, consultați articolul nostru despre SEO JavaScript pentru îndrumări suplimentare.

Optimizați-vă bugetul de accesare cu crawlere

Bugetul de accesare cu crawlere este numărul de pagini de pe un site pe care motoarele de căutare le pot și doresc să le acceseze cu crawlere.

Bugetul de accesare cu crawlere al site-ului dvs. poate fi afectat de numeroși factori.

Pentru a vă ajuta paginile să fie accesate cu crawlere eficient , urmați aceste instrucțiuni generale:

  • Îmbunătățiți-vă performanța web,
  • Optimizați fișierele JavaScript și CSS de pe site-ul dvs.,
  • Evitați redirecționările interne și lanțurile de redirecționare,
  • Ajustați arhitectura site-ului dvs.,
  • Curățați-vă linkurile interne – actualizați orice link-uri care indică 404 pagini și link-uri frecvent către conținutul dvs. cel mai important,
  • Aveți un sitemap structurat corespunzător - puteți analiza structura sitemap-ului dvs. folosind unul dintre crawlerele SEO, cum ar fi Ryte sau Sitebulb.

Concluzii

Site-urile web mari ar putea avea dificultăți pentru a obține multe dintre paginile lor indexate. Dar nu înseamnă că indexarea întregului conținut valoros este imposibilă.

Analizarea indexării unui site web mare poate necesita ceva muncă. Cu toate acestea, funcțiile disponibile în Google Search Console și Bing Webmaster Tools vă vor oferi informații utile pe care le puteți începe imediat să acționați.

Cred că vă puteți aștepta ca ZipTie să schimbe jocul în domeniul indexării – vă încurajez să luați legătura cu echipa ZipTie pentru o analiză de indexare.

Și, dacă aveți de-a face cu probleme de indexare la scară largă pe care nu puteți începe să le abordați - am văzut totul și vă vom spune pe ce puncte să vă concentrați. Contactează-ne!