Czym są miękkie 404 w SEO?
Opublikowany: 2022-02-17Soft 404 nie jest oficjalnym kodem stanu HTTP, ale zaawansowanym algorytmem, który pomaga Google wykryć, czy strona nie istnieje (lub ma niewielką lub żadną zawartość) , nawet jeśli kod stanu HTTP na to nie wskazuje.
Jednak algorytm nie jest doskonały i Google może popełnić błąd podczas klasyfikowania strony.
Bez względu na przyczynę miękkich błędów 404, negatywnie wpływają one na Twoją witrynę i zmniejszają Twoją widoczność w wynikach wyszukiwania organicznego.
Z tego artykułu dowiesz się, jak miękkie błędy 404 wpływają na Twoją witrynę, co może je powodować i co możesz zrobić, aby je naprawić.
Co to jest miękkie 404?
Serwery komunikują się z klientami (np. przeglądarkami lub botami wyszukiwarek) za pomocą kodów stanu HTTP.
Jeśli żądanie strony zakończy się powodzeniem, serwer zwróci kod stanu 200 HTTP. Jeśli brakuje strony, serwer odpowiada statusem 404 (Nie znaleziono).
Gdy użytkownicy żądają strony, która nie istnieje, widzą w przeglądarce komunikat informujący, że coś poszło nie tak. Jednak komunikat wyświetlany przez przeglądarkę nie zawsze odpowiada kodowi stanu HTTP.
W tym momencie do gry wchodzi miękki 404.
Soft 404 to etykieta, którą Google nadaje stronie, gdy wydaje się, że strona nie istnieje, a jednocześnie zwraca pomyślny kod stanu 200 HTTP.
Jeśli Google zdecyduje, że strona jest miękkim 404, spowalnia jej indeksowanie.
Jeśli zobaczymy to [stronę] jako miękkie 404, będzie to 404 i spowolnimy indeksowanie tego konkretnego adresu URL, ponieważ nic tu nie ma – dlaczego musimy indeksować go codziennie?źródło: John Mueller
Wykrywanie miękkich błędów 404 jest niezbędne z punktu widzenia wyszukiwarki z dwóch powodów:
- Google ma ograniczone zasoby. Sieć jest nieskończenie duża i po prostu niemożliwe jest zaindeksowanie wszystkich stron. Dlatego Google musi ustalić priorytety i wybrać strony, które warto zaindeksować. Pominięcie miękkich błędów 404 pozwala skupić się na bardziej wartościowych stronach, zwiększając w ten sposób wydajność indeksowania.
- Google chce prezentować swoim użytkownikom wysokiej jakości strony. Jeśli Google podejrzewa, że strona nie istnieje, oczywiste jest, że nikt nie chce jej znaleźć i nie powinna pojawiać się na stronie wyników wyszukiwania.
Jak Soft 404 wpływają na Twoją witrynę
Konsekwencje dla Twojej witryny mogą się różnić w zależności od rodzaju stron sklasyfikowanych przez Google jako miękkie błędy 404.
Jeśli Google miał rację, a strona naprawdę nie istnieje, główną konsekwencją jest marnowanie budżetu indeksowania .
Twój budżet indeksowania wskazuje liczbę stron, które Google może i chce zaindeksować w Twojej witrynie. Jeśli masz np. 100 000 stron, a Twój budżet indeksowania pozwala na zaindeksowanie 50 000, koniecznie zadbaj o to, by budżet był przeznaczany na wartościowe strony. Jeśli Google marnuje budżet indeksowania na indeksowanie miękkich błędów 404, strony, które są dla Ciebie najważniejsze i generują ruch, może nie wystarczyć.
Drugą stroną medalu jest to, że Google popełni błąd podczas przypisywania statusu i uzna, że wartościowa strona to miękki błąd 404. W takim przypadku strona nie zostanie zaindeksowana i nie przyniesie ruchu organicznego.
Jak wykryć miękkie błędy 404?
Możesz sprawdzić, które strony Google zgłasza jako miękkie błędy 404 w Google Search Console w raporcie Pokrycie indeksu.
Uzyskaj dostęp do raportu, klikając opcję „Pokrycie” na pasku bocznym.

Jeśli Google uzna, że strona jest miękkim 404, może przypisać jej jeden z tych dwóch stanów:
- Miękki 404 (kategoria wykluczona) lub
- Przesłany adres URL wydaje się być miękkim 404 (kategoria błędów).
Jedyną różnicą między tymi stanami jest sposób, w jaki Google odkrył adres URL.
W przypadku statusu „Przesłany adres URL wydaje się być miękkim 404”, Google znalazł go w Twojej mapie witryny (plik tekstowy utworzony przez właścicieli witryn, który powinien zawierać tylko te strony, które chcesz zindeksować). Tymczasem w przypadku statusu „Soft 404” Google sam znalazł ten adres URL.
Listę poszczególnych adresów URL zgłaszających miękkie błędy 404 można wyświetlić, klikając jeden z tych stanów. Te dane można wyeksportować, ale istnieje limit 1000 adresów URL. Jeśli chcesz wyeksportować więcej i mieć więcej niż jedną mapę witryny, możesz pobrać adresy URL dla każdej mapy witryny osobno.
Raport Pokrycie indeksu nie jest jedynym miejscem, w którym można zobaczyć stan adresu URL.
W narzędziu do sprawdzania adresów URL w Google Search Console możesz dokładnie sprawdzić poszczególne adresy URL. Jeśli chcesz sprawdzić więcej niż jeden adres URL, możesz użyć interfejsu API do sprawdzania adresów URL i jednocześnie sprawdzić do 2000 adresów URL.
Jeśli zauważysz różnicę między stanami w raporcie Pokrycie indeksu a narzędziem do sprawdzania adresów URL, może to oznaczać tylko opóźnienie w raporcie Pokrycie indeksu. W takim przypadku zaufaj narzędziu do sprawdzania adresów URL, ponieważ pokazuje ono nowsze dane.
Dzieje się tak, ponieważ dane raportu Pokrycie indeksu są odświeżane z inną (i wolniejszą) częstotliwością niż inspekcja adresów URL. Wyniki wyświetlane w funkcji Kontrola adresów URL są nowsze i należy je traktować jako autorytatywne, gdy są sprzeczne z raportem Pokrycie indeksu. (2/4)
— Centrum wyszukiwania Google (@googlesearchc) 11 października 2021 r.
Miękkie wykrywanie błędów 404 na urządzeniach mobilnych i stacjonarnych
W 2021 r. Google poinformowało, jak wykrywa miękkie błędy 404 na telefonach komórkowych i urządzeniach stacjonarnych.
Okazało się, że status może być różnie przypisany do wersji mobilnej i stacjonarnej. Ponieważ jednak Google Search Console raportuje stany na podstawie wersji mobilnej, nie pokaże Ci, czy tylko wersja na komputery jest oznaczona jako miękkie 404.

Zasadniczo dzieje się tak, że czasami widzimy strony, które na komputerach stacjonarnych wyglądają jak strona 404, więc mówimy, że jest to miękkie 404 na komputerze, nie musimy go indeksować. A na urządzeniach mobilnych wygląda jak normalna strona, więc faktycznie ją tam zindeksujemy.[…] w Search Console pokazujemy miękkie błędy 404, ale pokazujemy je dla wersji mobilnej. Jeśli więc na wersji mobilnej z Twojej strony wszystko jest w porządku, to w Search Console będzie to wyglądać tak, jakby było normalnie indeksowane […], podczas gdy na komputerze stacjonarnym, jeśli zobaczymy tam miękkie 404, nie będziesz w stanie zobacz to bezpośrednio w Search Console.
źródło: John Mueller
Co może powodować miękkie 404 i jak to naprawić
Istnieje kilka różnych powodów, dla których Google może sklasyfikować stronę jako miękkie 404, w tym:
- strona 404 odpowiadająca kodem statusu 200 HTTP,
- Nieistotne przekierowania,
- Strony z niewielką zawartością lub bez treści,
- Strony zawierające 404 podobne słowa,
- Problemy z renderowaniem.
Strona 404 odpowiadająca kodem statusu 200 HTTP
Jeśli strona jest w rzeczywistości stroną 404, ale zwraca kod stanu HTTP 200, Google zaklasyfikuje ją jako miękkie 404.
Jest to coś, o czym należy szczególnie pamiętać, jeśli masz niestandardową stronę 404.
Niestandardowa strona 404 może być pomocna dla użytkowników i umożliwić im przeglądanie witryny, nawet jeśli strona, do której próbowali dotrzeć, nie istnieje. Jednak często zdarza się, że te strony zwracają kod stanu 200 HTTP.
Należy unikać tej sytuacji, ponieważ Google nadal indeksuje te strony, co marnuje budżet na indeksowanie.
Rozwiązaniem tego problemu jest skonfigurowanie serwera tak, aby zwracał poprawny kod stanu dla stron, które nie istnieją (404 Not Found).
Nieistotne przekierowania
Przekierowywanie na nieodpowiednią stronę to zła praktyka, która może wprowadzać użytkowników w błąd. Dlatego jeśli Google wykryje, że przekierowanie wskazuje na niepowiązaną stronę, wyszukiwarka może nie podążać za nią i potraktować ją jako miękkie 404.
Tak, to nie jest świetna praktyka (dezorientuje użytkowników), a i tak traktujemy je głównie jako błędy 404 (są to miękkie błędy 404), więc nie ma żadnych zalet. Nie jest krytycznie uszkodzony/zły, ale dodatkowa złożoność bez powodu – zamiast tego stwórz lepszą stronę 404.
— John (@JohnMu) 8 stycznia 2019 r.
Aby rozwiązać problem, zawsze przekierowuj do odpowiednich stron.
Spójrz na treść z perspektywy użytkowników. Na przykład, jeśli użytkownik szukał czegoś konkretnego, czy miałoby sens trafienie na stronę, na którą przekierowujesz? Czy jest to tematycznie istotne? Jeśli nie, może istnieje lepsza strona, która mogłaby odpowiedzieć na ich intencje, a może powinieneś skonfigurować stronę 404 zamiast przekierowania.
Strony z niewielką zawartością lub bez treści
Mała zawartość lub brak treści na stronie może sprawić, że Google uzna, że strona jest pusta i zaklasyfikuje ją jako miękki błąd 404.
Przykładem może być witryna eCommerce, na której produkty często pojawiają się i wychodzą z magazynu, co prowadzi do pustych kategorii produktów.
Rozwiązanie tego problemu nie jest tak proste, jak w dwóch poprzednich przypadkach.
Jednym ze sposobów poradzenia sobie z tym problemem jest zablokowanie indeksowania pustych stron. W końcu, jeśli jest to pusta strona, nie jest pomocna dla użytkowników i nie powinna być indeksowana. Możesz to zrobić, dodając metatag noindex (znacznik HTML informujący wyszukiwarki, że nie chcesz, aby ta strona była indeksowana).
Dodatkowo warto przemyśleć strukturę całej witryny.
Masz wiele kategorii produktów, które mają np. tylko jeden produkt? Jeśli tak jest, powinieneś ponownie rozważyć, czy te kategorie są w ogóle potrzebne w Twojej witrynie. Takie strony mogą być uważane za cienkie treści i mogą negatywnie wpłynąć na Twoją witrynę na dwa sposoby:
- Mogą zmarnować budżet na indeksowanie i
- Jeśli masz dużo stron niskiej jakości, które można zindeksować, Google może pomyśleć, że cała Twoja witryna jest niskiej jakości i zdecyduje się przestać ją indeksować tak często.
Jeśli chcesz dowiedzieć się więcej o tym, które strony powinny, a które nie powinny być indeksowane, przeczytaj nasz artykuł na temat tworzenia strategii indeksowania dla Twojej witryny.
Strony zawierające 404 podobne słowa
Czasami algorytmy Google błędnie identyfikują stronę, jeśli zawiera ona słowa, które zwykle pojawiają się na stronie 404. Może się to zdarzyć na przykład w witrynach eCommerce, gdy strona produktu używa terminów takich jak „brak w magazynie”, „produkt niedostępny” lub „nie dostarczamy do Twojej lokalizacji”.
Wszystkie strony kategorii miały napis „Przepraszamy, nie dostarczamy do tej lokalizacji”. Zostało to pokazane klientom wprowadzającym kod PIN, którego nie dostarczamy, ale domyślnie był częścią strony. Usunięto ten tekst ze strony, a to naprawiło miękkie 404! #seo @JohnMu @methode @rustybrick https://t.co/j3UEsXXb3U
— Nikhil Raj. R (@nikhilrajr) 30 grudnia 2021
Autor powyższego posta rozwiązał problem, po prostu usuwając słowa wskazujące, że dostawa jest niedostępna.
Problem z renderowaniem
Renderowanie jest niezbędnym krokiem, aby Google mógł zobaczyć Twoje treści. Jeśli wyszukiwarka go nie widzi, może pomyśleć, że strona jest pusta i sklasyfikować ją jako miękkie 404.
Jedną z przyczyn problemów z renderowaniem jest blokowanie zasobów, takich jak CSS lub JavaScript, w pliku robots.txt. Robots.txt to plik, który pozwala określić, które strony roboty wyszukiwarek mogą indeksować, a których nie. Jeśli Google nie może uzyskać dostępu do zasobów niezbędnych do renderowania, nie będzie mógł zobaczyć treści.
Aby dowiedzieć się, czy Google poprawnie renderuje Twoje treści, użyj narzędzia do sprawdzania adresów URL w Google Search Console. Możesz sprawdzić poszczególne adresy URL i zobaczyć, jak Google widzi Twoje strony. Brak treści oznacza problem z renderowaniem.
Aby rozwiązać problem, upewnij się, że Google ma dostęp do zasobów niezbędnych do renderowania. Sprawdź plik robots.txt i upewnij się, że indeksowanie CSS i JavaScript jest dozwolone.
Jeśli chcesz dowiedzieć się więcej o tym, jak działa renderowanie, zapoznaj się z naszym manifestem Rendering SEO – dlaczego JavaScript SEO nie wystarczy.
Zawijanie
Monitorowanie miękkich błędów 404 jest ważne, aby upewnić się, że nie zaszkodzą one Twojej witrynie, marnując budżet na indeksowanie lub pozostawiając cenne strony poza indeksem.
Oto kluczowe wnioski z artykułu, które pomogą Ci uniknąć miękkich błędów 404:
- Jeśli strona nie istnieje, upewnij się, że zwraca kod stanu HTTP 404,
- Tworząc przekierowanie, zawsze upewnij się, że przekierowujesz do odpowiedniej treści,
- Nie blokuj zasobów niezbędnych do renderowania, takich jak pliki CSS lub JavaScript w pliku robots.txt,
- Jeśli masz puste strony, dodaj metatag noindex lub usuń te strony ze swojej witryny,
- Uważaj na używanie fraz podobnych do 404. Jeśli zauważysz, że Twoja strona, np. z produktem niedostępnym, jest oznaczona jako soft 404, spróbuj usunąć słowa lub użyć innych terminów.
