Ce sunt Soft 404s în SEO?
Publicat: 2022-02-17Soft 404 nu este un cod oficial de stare HTTP, ci un algoritm avansat care ajută Google să detecteze dacă o pagină nu există (sau are puțin sau deloc conținut), chiar dacă codul de stare HTTP nu o indică.
Cu toate acestea, algoritmul nu este perfect, iar Google ar putea face o greșeală în timp ce clasifică o pagină.
Indiferent de motivul softului 404, acestea au un impact negativ pe site-ul dvs. și vă scad vizibilitatea în căutarea organică.
Din acest articol, veți afla cât de soft 404 vă afectează site-ul, ce le poate cauza și ce puteți face pentru a le remedia.
Ce este un soft 404?
Serverele comunică cu clienții (de exemplu, browsere sau roboți pentru motoarele de căutare) prin intermediul codurilor de stare HTTP.
Dacă cererea pentru o pagină are succes, serverul returnează un cod de stare HTTP 200. Dacă pagina lipsește, serverul răspunde cu starea 404 (Negăsit).
Când utilizatorii solicită o pagină care nu există, ei văd un mesaj în browser care indică că ceva a mers prost. Cu toate acestea, mesajul afișat de browser nu corespunde întotdeauna cu codul de stare HTTP.
Acolo intră în joc softul 404.
Soft 404 este o etichetă pe care Google o dă unei pagini atunci când pare că pagina nu există și, în același timp, returnează un cod de stare HTTP de succes 200.
Dacă Google decide că o pagină este un soft 404, încetinește accesul cu crawlere.
Dacă o vedem [o pagină] ca un soft 404, ar fi ca un 404 și am încetini accesarea cu crawlere a acelei adrese URL pentru că nu există nimic aici – de ce trebuie să o accesăm cu crawlere în fiecare zi?sursa: John Mueller
Detectarea softului 404 este esențială din perspectiva motorului de căutare din două motive:
- Google are resurse limitate. Web-ul este infinit de mare și este pur și simplu imposibil să accesezi cu crawlere toate paginile. De aceea, Google trebuie să prioritizeze și să aleagă ce pagini merită accesate cu crawlere. Omiterea softului 404 îi permite să se concentreze pe pagini mai valoroase, crescând astfel eficiența accesării cu crawlere.
- Google vrea să prezinte pagini de calitate utilizatorilor săi. Dacă Google suspectează că o pagină nu există, este evident că nimeni nu vrea să o găsească și nu ar trebui să apară pe pagina cu rezultatele căutării.
Cum vă afectează Soft 404s site-ul web
Consecințele pentru site-ul dvs. web pot varia în funcție de tipul de pagini clasificate de Google drept soft 404s.
Dacă Google a fost corect și pagina într-adevăr nu există, principala consecință este irosirea bugetului de accesare cu crawlere .
Bugetul dvs. de accesare cu crawlere indică numărul de pagini pe care Google poate și dorește să le acceseze cu crawlere pe site-ul dvs. Dacă aveți, de exemplu, 100.000 de pagini, iar bugetul dvs. de accesare cu crawlere permite accesarea cu crawlere a 50.000, este esențial să vă asigurați că bugetul este cheltuit pe pagini valoroase. Dacă Google irosește bugetul de accesare cu crawlere pentru accesarea cu crawlere 404 soft, este posibil să nu fie suficient pentru paginile care contează cel mai mult pentru dvs. și vă aduc trafic.
Cealaltă parte a monedei este atunci când Google face o greșeală în timp ce atribuie statutul și crede că o pagină valoroasă este un soft 404. În acest caz, pagina nu va fi indexată și nu va aduce trafic organic.
Cum poți detecta soft 404s?
Puteți verifica ce pagini Google raportează ca soft 404 în Google Search Console în raportul Acoperire index.
Accesați raportul făcând clic pe opțiunea „Acoperire” din bara laterală.

Dacă Google consideră că o pagină este un soft 404, îi poate atribui una dintre aceste două stări:
- Soft 404 (categoria exclusă) sau
- Adresa URL trimisă pare să fie un Soft 404 (categoria de eroare).
Singura diferență dintre aceste stări este modul în care Google a descoperit adresa URL.
În cazul stării „Adresa URL trimisă pare să fie un Soft 404”, Google l-a găsit în sitemap -ul dvs. (fișier text creat de proprietarii site-ului web care ar trebui să enumere numai paginile pe care doriți să le indexați). Între timp, în cazul stării „Soft 404”, Google a găsit această adresă URL pe cont propriu.
Puteți vedea o listă de adrese URL individuale care raportează soft 404 făcând clic pe oricare dintre aceste stări. Aceste date sunt disponibile pentru export, dar există o limită de 1.000 de adrese URL. Dacă doriți să exportați mai multe și să aveți mai multe sitemap, puteți descărca adrese URL pentru fiecare sitemap separat.
Raportul Acoperire index nu este singurul loc în care puteți vedea starea unei adrese URL.
În instrumentul de inspecție URL din Google Search Console, puteți verifica de două ori adresele URL individuale. Dacă doriți să inspectați mai multe adrese URL, puteți utiliza API-ul de inspecție URL și puteți verifica până la 2.000 de adrese URL simultan.
Dacă observați o diferență între stări în raportul Acoperirea indexului și instrumentul de inspecție URL, ar putea fi doar o întârziere în raportul Acoperirea indexului. În acest caz, aveți încredere în instrumentul de inspecție URL, deoarece arată date mai recente.
Acest lucru se datorează faptului că datele din raportul Acoperirea indexului sunt reîmprospătate cu o rată diferită (și mai lent) decât cea a inspecției URL. Rezultatele afișate în Inspecția URL sunt mai recente și ar trebui să fie considerate autorizate atunci când sunt în conflict cu raportul Acoperirea indexului. (2/4)
— Google Search Central (@googlesearchc) 11 octombrie 2021
Detectare soft 404 pe mobil vs desktop
În 2021, Google a oferit o actualizare cu privire la modul în care detectează soft 404 pe telefoanele mobile și dispozitivele desktop.
S-a dovedit că starea ar putea fi atribuită diferit versiunilor mobile și desktop. Cu toate acestea, deoarece Google Search Console raportează stările pe baza versiunii mobile, nu vă va afișa dacă numai versiunea dvs. pentru desktop este etichetată ca soft 404.

În esență, ceea ce se întâmplă este că uneori vedem pagini care pe desktop-uri arată ca o pagină 404, așa că spunem că acesta este un soft 404 pe desktop, nu trebuie să-l indexăm. Și pe mobil, arată ca o pagină normală, așa că o vom indexa acolo.[…] în Search Console, afișăm 404 soft, dar îl arătăm pentru versiunea mobilă. Deci, dacă pe versiunea mobilă totul este în regulă din partea ta, atunci în Search Console, va arăta ca și cum ar fi indexat în mod normal […], în timp ce pentru desktop, dacă îl vedem ca un soft 404 acolo, nu vei putea vedeți asta direct în Search Console.
sursa: John Mueller
Ce poate provoca un soft 404 și cum să îl remediați
Există câteva motive diferite pentru care Google ar putea clasifica o pagină ca un soft 404, inclusiv:
- Pagina 404 care răspunde cu un cod de stare HTTP 200,
- redirecționări irelevante,
- Pagini cu conținut redus sau deloc,
- Pagini care conțin cuvinte asemănătoare 404,
- Probleme de randare.
Pagina 404 care răspunde cu un cod de stare HTTP 200
Dacă o pagină este, de fapt, o pagină 404, dar returnează un cod de stare HTTP 200, Google o va clasifica ca un soft 404.
Acesta este ceva de care trebuie să fiți atenți în special dacă aveți o pagină 404 personalizată.
O pagină personalizată 404 poate fi de ajutor utilizatorilor dvs. și le poate permite să exploreze site-ul web, chiar dacă pagina la care încercau să ajungă nu există. Cu toate acestea, nu este neobișnuit ca aceste pagini să returneze un cod de stare HTTP 200.
Ar trebui să evitați această situație, deoarece Google continuă să acceseze cu crawlere aceste pagini, ceea ce vă irosește bugetul de accesare cu crawlere.
Soluția la această problemă este să configurați serverul să returneze codul de stare corect pentru paginile care nu există (404 Not Found).
Redirecționări irelevante
Redirecționarea către o pagină irelevantă este o practică proastă care ar putea deruta utilizatorii. De aceea, dacă Google detectează că o redirecționare indică către o pagină fără legătură, motorul de căutare ar putea să nu o urmărească și să trateze pagina ca pe un soft 404.
Da, nu este o practică grozavă (derutează utilizatorii) și oricum îi tratăm în mare parte ca 404 (sunt soft-404), așa că nu există niciun avantaj. Nu este stricat/proastă în mod critic, ci are o complexitate suplimentară fără un motiv întemeiat – faceți în schimb o pagină 404 mai bună.
— John (@JohnMu) 8 ianuarie 2019
Pentru a rezolva problema, redirecționați întotdeauna către paginile relevante.
Priviți conținutul din perspectiva utilizatorilor. De exemplu, dacă un utilizator a căutat ceva anume, ar avea sens ca acesta să ajungă pe pagina către care redirecționați? Este relevant tematic? Dacă nu, poate că există o pagină mai bună care ar putea răspunde intenției lor, sau poate ar trebui să configurați o pagină 404 în loc de o redirecționare.
Pagini cu conținut redus sau deloc
Puțin conținut sau deloc pe o pagină ar putea face Google să creadă că pagina este goală și să o clasifice ca un soft 404.
Un exemplu poate fi un site de comerț electronic cu produse care intră și se epuizează frecvent, ceea ce duce la categorii de produse goale.
Soluția la această problemă nu este la fel de simplă ca în cele două cazuri anterioare.
O modalitate de a rezolva această problemă este de a bloca indexarea paginilor goale. La urma urmei, dacă este o pagină goală, nu este de ajutor utilizatorilor tăi și nu ar trebui să fie indexată. Puteți face acest lucru adăugând o metaetichetă noindex (o etichetă HTML care spune motoarelor de căutare că nu doriți ca această pagină să fie indexată).
În plus, merită să regândiți structura întregului site web.
Aveți o mulțime de categorii de produse care au, de exemplu, un singur produs? Dacă este cazul, ar trebui să vă reconsiderați dacă aceste categorii sunt chiar necesare pe site-ul dvs. Paginile de acest fel pot fi considerate conținut subțire și pot afecta negativ site-ul dvs. în două moduri:
- Îți pot irosi bugetul de accesare cu crawlere și
- Dacă aveți o mulțime de pagini indexabile de calitate scăzută, Google ar putea crede că întregul dvs. site web nu are calitate și să decidă să nu mai acceseze cu crawlere site-ul dvs. la fel de des.
Dacă doriți să aflați mai multe despre paginile care ar trebui și nu ar trebui să fie indexate, citiți articolul nostru despre crearea unei strategii de indexare pentru site-ul dvs.
Pagini care conțin 404 cuvinte asemănătoare
Uneori, algoritmii Google identifică greșit o pagină dacă aceasta conține cuvinte care apar de obicei pe o pagină 404. Se poate întâmpla, de exemplu, pe site-urile de comerț electronic, atunci când o pagină de produs folosește termeni precum „stoc epuizat”, „produs indisponibil” sau „nu livrăm în locația dvs.”.
Toate paginile categorie aveau „Ne pare rău, nu livrăm în această locație”. Acest lucru a fost afișat clienților care au introdus un cod PIN pe care nu îl livrăm, dar a făcut parte din pagină în mod implicit. A eliminat acest text din pagină și a remediat softul 404! #seo @JohnMu @methode @rustybrick https://t.co/j3UEsXXb3U
— Nikhil Raj. R (@nikhilrajr) 30 decembrie 2021
Autorul postării de mai sus a remediat problema prin simpla ștergere a cuvintelor care indică faptul că livrarea nu este disponibilă.
Problemă de randare
Redarea este un pas necesar pentru ca Google să vă vadă conținutul. Dacă motorul de căutare nu o poate vedea, ar putea crede că pagina este goală și o clasifică drept 404 soft.
Una dintre cauzele problemelor de randare este blocarea resurselor precum CSS sau JavaScript în robots.txt. Robots.txt este un fișier care vă permite să specificați ce pagini pot accesa cu crawlere roboții motoarelor de căutare și care nu. Dacă Google nu poate accesa resursele necesare pentru randare, nu va putea vedea conținutul.
Pentru a afla dacă Google redă corect conținutul dvs., utilizați instrumentul de inspecție URL din Google Search Console. Puteți inspecta adrese URL individuale și puteți vedea cum vă vede Google paginile dvs. Dacă conținutul lipsește, indică o problemă de redare.
Pentru a remedia problema, asigurați-vă că Google are acces la resursele necesare pentru redare. Examinați fișierul robots.txt și asigurați-vă că accesarea cu crawlere a CSS și JavaScript este permisă.
Dacă doriți să aflați mai multe despre modul în care funcționează randarea, consultați manifestul nostru Rendering SEO - de ce JavaScript SEO nu este suficient.
Încheierea
Monitorizarea softului 404 este importantă pentru a vă asigura că nu vă afectează site-ul web prin irosirea bugetului de accesare cu crawlere sau lăsând pagini valoroase în afara indexului.
Iată principalele concluzii din articol pentru a vă ajuta să evitați soft 404s:
- Dacă o pagină nu există, asigurați-vă că returnează un cod de stare HTTP 404,
- Când creați o redirecționare, asigurați-vă întotdeauna că redirecționați către conținut relevant,
- Nu blocați resursele esențiale pentru redarea fișierelor CSS sau JavaScript în robots.txt,
- Dacă aveți pagini goale, adăugați metaeticheta noindex sau eliminați aceste pagini de pe site-ul dvs.
- Fiți atenți la utilizarea expresiilor asemănătoare 404. Dacă observați că pagina dvs., cu, de exemplu, un produs epuizat, este marcată ca soft 404, încercați să eliminați cuvintele sau să utilizați termeni diferiți.
