Google zapomina o adresach URL w kolejce indeksowania

Opublikowany: 2021-12-21

Błędy indeksowania nie są niespotykane. Google od dłuższego czasu ma problemy z indeksowaniem. Mogą przytrafić się każdemu bez winy właściciela serwisu, niezależnie od wielkości serwisu. Tylko w zeszłym roku miał miejsce przypadek błędów indeksowania obejmujących indeksowanie mobilne i kanonizację.  

Kilka miesięcy temu osobiście doświadczyłem błędu indeksowania, kiedy okazało się, że mój Ultimate Guide to Indexing SEO nie został zindeksowany.

Po dokładnym zbadaniu okazało się, że Google zindeksował niewłaściwą wersję adresu URL bez wyraźnego powodu. Możesz dowiedzieć się więcej o tym konkretnym błędzie w moim artykule My Ultimate Guide to Indexing SEO Isn Indexed.

Na początku tego roku znalazłem kolejny błąd indeksowania, wskazujący na to, że Google może tracić kontrolę nad adresami URL w kolejce indeksowania.  

Podzielmy to krok po kroku.

Ukryj zawartość
1 Zapomniany adres URL w kolejce indeksowania Google
2 Więcej witryn cierpi z powodu błędu indeksowania Google
3 Możliwe rozwiązanie błędu
4 Zawijanie

Zapomniany adres URL w kolejce indeksowania Google

6 października opublikowaliśmy artykuł: Rendering SEO: How Google Digests Your Content. Artykuł był zapisem rozmowy Bartosza Góralewicza z Onely, Martina Splitta z Google i Jasona Barnarda z Kalicube.

Niestety w ciągu trzech tygodni od daty publikacji artykuł nie przyniósł żadnego ruchu z Google.

zrzut ekranu Google Search Console pokazujący brak ruchu

Wydało mi się to dziwne — kolejny interesujący artykuł nieindeksowany przez Google? Czy Google cierpi na inny błąd indeksowania?

Ponieważ staram się zrozumieć tajniki procesu indeksowania Google, postanowiłem przeprowadzić małe dochodzenie.

Sprawdziłem, co Google Search Console ma do powiedzenia na temat tego adresu URL.

GSC stwierdził, że ten adres URL to „Wykryty – obecnie nieindeksowany”.  

Zrzut ekranu narzędzia do sprawdzania adresów URL pokazujący, że adres URL nie znajduje się w Google

Gdy zajrzysz do dokumentacji Google, znajdziesz następujące wyjaśnienie stanu:

Odnalezione – obecnie nieindeksowane: Strona została znaleziona przez Google, ale jeszcze nie została zindeksowana.
źródło: Google

Stan adresu URL wydawał się wysoce nieprawdopodobny. Nie mogłem uwierzyć, że Google nie zindeksowało tej strony w ciągu trzech tygodni od publikacji w stosunkowo niewielkiej witrynie.

Sprawdziłem więc nasze logi serwera.

Logi serwera pozwalają na zbadanie ruchu przychodzącego do Twojej witryny. Zawierają informacje o każdym żądaniu, w tym jego czas i datę, ciąg agenta użytkownika, adres IP itp. Dzięki tym informacjom mogłem sprawdzić, czy (i kiedy) Googlebot był na tej stronie.

Co zaskakujące, okazało się, że Googlebot odwiedził tę stronę w dniu, w którym opublikowaliśmy artykuł!

W tym momencie miałem dwie kluczowe informacje:

  1. Dane z Google Search Console, że Googlebot jeszcze nie odwiedził strony, nie były prawdziwe. Dzienniki serwera wykazały, że Googlebot odwiedził adres URL w dniu publikacji artykułu.
  2. Nie było to tylko zgłoszenie błędu z Google Search Console. Strona nie generowała żadnego ruchu organicznego, więc było wyraźnie więcej poważnych problemów niż tylko błędy w raporcie.

Więcej witryn cierpi z powodu błędu indeksowania Google

Chciałem dowiedzieć się więcej o tym błędzie i jego skali, więc zbadałem większą próbkę stron internetowych, aby wyciągnąć praktyczne wnioski.

Zebrałem logi serwera z czterech innych stron internetowych i zagłębiłem się w dane.

Okazało się, że 100% zbadanych przeze mnie witryn cierpi na ten właśnie problem. Googlebot odwiedził wiele adresów URL , które zostały błędnie sklasyfikowane przez Google Search Console jako:

  • Odnalezione – aktualnie nieindeksowane lub
  • Nieznany.

W przypadku statusu Nieznany wygląda na to, że Google twierdzi, że nigdy nie odwiedził strony i nie ma pamięci nawet o odkryciu adresu URL.

Mem z Gandalfem mówiącym „Nie pamiętam tego adresu URL”

Odkryłem, że problem występował na jednej z testowanych stron nawet 6 miesięcy po pierwszym odwiedzeniu go przez Google. Według logów serwera ostatnia wizyta miała miejsce 7 marca, ale 27 października status nadal był nieznany.

Wygląda na to, że Google czasami zapomina o adresach URL w pewnym momencie procesu indeksowania. Nie jest jasne, czy wyszukiwarka po prostu gubi niektóre adresy URL, czy celowo je pomija.

Tak czy inaczej konsekwencje są poważne. Zapomniane strony nie uzyskują żadnego ruchu organicznego.

Możliwe rozwiązanie błędu

Dan Shure podzielił się ciekawym przypadkiem związanym z błędem zapomnianego adresu URL.

Wygląda na to, że zmiana adresu URL wystarczyła do rozwiązania problemu.

Dan Shure nie był jedynym, który testował to rozwiązanie. Frank Olivo zindeksował prawie ⅓ swoich artykułów, zmieniając ich adresy URL!

Możliwe, że te adresy URL znalazły się we wzorcach adresów URL niskiej jakości, więc Google ich nie indeksował i dlatego sklasyfikował je jako „Odkryte – obecnie nieindeksowane” w Google Search Console.

Możesz przekonać Google do traktowania strony jako nowej i ponownego jej indeksowania, zmieniając adres URL. To rozwiązanie może pomóc w zindeksowaniu strony, ale jest to tylko obejście. Nie zapobiega to ponownemu wystąpieniu problemu. Google powinien rozwiązać problem, a błąd powinien zostać naprawiony na stałe.

Zawijanie

Jak opisano w artykule, istnieje poważny problem z indeksowaniem. Nie jest to tak oczywiste i spektakularne jak poprzednie błędy indeksowania (np. związane z kanonizacją), ale nadal może negatywnie wpłynąć na każdą stronę internetową.

Jeśli jesteś pracownikiem Google i chcesz zbadać problem, mogę udostępnić kilka przykładowych adresów URL, których dotyczy ten problem.

Czy zauważyłeś ten błąd lub podobny błąd indeksowania w swojej witrynie? Daj mi znać!