Co wyciek kodu źródłowego Yandex ujawnił na temat wyszukiwarek

Opublikowany: 2023-02-17

Czy zastanawiałeś się kiedyś, co dzieje się w gigantach wyszukiwarek, takich jak Google, Bing i Yahoo?

27 stycznia 2023 r. czwarta co do wielkości wyszukiwarka na świecie, Yandex, trafiła na pierwsze strony gazet po ogromnym (dokładnie 44 GB) wycieku danych.

„Tak więc najpopularniejsza wyszukiwarka w Rosji ucierpiała. W jaki sposób jest to dla mnie istotne?” możesz zapytać.

Wiele kanałów informacyjnych uważało to za złośliwe działanie przeciwko bezpieczeństwu danych firmy i klientów, eksperci cyfrowi ocenili to jako rzadki wgląd w działanie wyszukiwarek.

A co ważniejsze, jakie treści traktują priorytetowo i dlaczego.

Wyciek danych upublicznił to, co początkowo uważaliśmy za 1922 czynniki rankingowe, ale dzięki Benowi Willsowi liczba ta została poprawiona do 17 853. Masywne, prawda?

Mic King tweetuje na Yandex

Przejrzeliśmy wszystkie 1992.

Czytaj dalej, aby zobaczyć, co znaleźliśmy najbardziej interesujące.


Czy mogę wykorzystać wnioski z wycieku Yandex, aby uzyskać wyższą pozycję w Google?

Jest rzeczą oczywistą, że Yandex to nie Google.

Ale kilka znaczących czynników sprawia, że ​​ten wyciek jest istotny (i edukacyjny) poza Rosją i w twoich eksperymentach z rankingiem wyszukiwania:

  • Istnieje około 70% zgodności między wynikami wyszukiwania Yandex i Google
  • Yandex wykorzystuje PageRank (prawie identyczny jak w Google)
  • Yandex zatrudnia wielu byłych pracowników Google i wielu spekuluje, że został zaprojektowany w podobny sposób
  • Yandex stosuje podobne najlepsze praktyki wyszukiwania informacji jak Google, takie jak odwracanie indeksu lub osadzanie
  • Podobnie jak wyszukiwarki Google i Bing, Yandex wykorzystuje funkcję rankingu Okapi BM25 do oszacowania trafności dokumentów dla danego zapytania

Alex Buraks tweetuje na Yandex

To powiedziawszy, to, co ujawnia wyciek kodu źródłowego Yandex, pomaga nam po raz pierwszy lepiej rozróżnić między założeniem a wiedzą, jak działają rankingi wyszukiwania.

Wewnątrz wycieku kodu Yandex: 11 ustaleń dotyczących działania wyszukiwarek

Ogólnie czynniki rankingowe Yandex można podzielić na trzy kategorie:

  • Czynniki statyczne, takie jak przychodzące linki zwrotne, przychodzące linki wewnętrzne, nagłówki, współczynnik reklam itp. Odnoszą się one do Twojej witryny.
  • Czynniki dynamiczne, takie jak trafność tekstu, uwzględnienie słów kluczowych itp. Odnoszą się one zarówno do Twojej witryny, jak i wyszukiwanego hasła.
  • Czynniki związane z wyszukiwaniem użytkowników, takie jak lokalizacja użytkownika, język zapytań, modyfikatory intencji itp. Odnoszą się one bezpośrednio do zapytania użytkownika.

Największe współczynniki ważenia stosowane w modelach statystycznych to:

Współczynniki wagowe Yandex

1. Reklama na stronie

Reklama na stronie jest postrzegana jako czynnik negatywny. W rzeczywistości jest to czynnik o najwyższej ujemnej wadze rankingowej:

Mic King Tweet na temat wagi czynników rankingowych Yandex

Wiele czynników związanych z reklamami, takich jak liczba miejsc docelowych reklamy na stronie i czy tło jest klikalne, sugeruje, że Yandex nie lubi stron z wysokim stosunkiem reklam do widocznego ekranu.

2. Czynniki na poziomie adresu URL

Budowa adresu URL to kolejny czynnik brany pod uwagę przez Yandex. A dokładniej:

  • Obecność liczb w adresie URL.
  • Liczba końcowych ukośników („/”) w adresie URL
  • Liczba wielkich liter w adresie URL

Wracając do argumentu, że Yandex to nie Google, a ten wyciek nie będzie wartościowy, cóż, te czynniki URL bardzo przypominają te z wytycznych Google dotyczących struktury adresów URL.


3. Czynniki na poziomie strony

Jest tu wiele do odkrycia. Jak się okazuje, Yandex ma wiele czynników na poziomie strony, które odgrywają rolę w budowaniu SERP. Niektóre z najbardziej znaczących z nich to:

  • Świeżość strony - szczególnie w przypadku treści blogów i serwisów informacyjnych. Jest to negatywny czynnik rankingowy, jeśli strona z treścią jest starsza niż 10 lat. Dlatego często aktualizuj swoje treści.
  • Ostatni cel — Yandex nagradza strony, które kończą podróż użytkownika w poszukiwaniu, co oznacza, że ​​znalazł to, czego szukał.
  • Zdrowy współczynnik źródeł ruchu — Yandex nie lubi stron, które uzyskują ruch z jednego źródła (np. wyszukiwania organicznego). Aby strona miała wysoką pozycję w rankingu, musi pozyskiwać ruch ze wszystkich źródeł - organicznych, płatnych, bezpośrednich itp.
  • Jakość treści — bardzo ważne jest, aby tekst był oryginalny i nie był wypełniony słowami kluczowymi. To podniesienie pozycji w rankingu, jeśli Twój tekst był cytowany/linkowany w zewnętrznych domenach. Ponadto posiadanie treści niskiej jakości obniży rangę treści dobrej jakości.

4. Czynniki na poziomie strony internetowej

Opierając się na współczynniku świeżości strony, ostateczną kombinacją byłaby dobrze ugruntowana strona internetowa, która jest aktywna od dłuższego czasu i często aktualizuje swoją zawartość.

Ponadto Yandex ocenia ogólną jakość strony internetowej na podstawie jej klikalności. Innymi słowy, jak często użytkownicy klikają adres URL wyszukiwania?

Kolejnym pozytywnym czynnikiem rankingowym jest nazwa domeny. Yandex zwiększa ranking domen .COM.


5. Jakość strony

Omówiliśmy już jakość treści, ale co z ogólną jakością strony? Cóż, Yandex ocenia jakość strony na podstawie kilku czynników:

  • Liczba odwiedzin
  • Liczba unikalnych odwiedzających
  • Czas spędzony na stronie
  • Liczba akcji wykonanych na stronie

6. Zachowanie i zaangażowanie użytkowników

Było kilka interesujących wniosków dotyczących zachowania użytkowników z wycieku, które musimy omówić.

Kluczowym czynnikiem jest ogólna liczba kliknięć i wyświetleń hosta. Yandex bierze również pod uwagę, czy strona jest przyjazna dla urządzeń mobilnych i analizuje zachowanie użytkowników na urządzeniach mobilnych, w tym czas trwania sesji i czas spędzony na stronie. Ponadto, gdy odwiedzający wracają do witryny w ciągu tego samego miesiąca, jest to pozytywny czynnik rankingowy.

Ale chyba najbardziej fascynujące jest to, że:

Strony zawierające recenzje użytkowników mają pierwszeństwo w wynikach wyszukiwania.

7. Ranga i lokalizacja gospodarza

Yandex kładzie duży nacisk na priorytetowe traktowanie treści, które są geograficznie bliskie użytkownikowi. Kiedy więc dwie nazwy domen walczą o to samo zapytanie, ta, która jest bliżej użytkownika, uzyska wyższą pozycję w rankingu.

Jeśli chodzi o techniczne czynniki rankingowe, zmniejszenie liczby 400 błędów klienta i 500 błędów serwera zapewni Ci przewagę w SERP. Ponadto Yandex przywiązuje dużą wagę do głębokości indeksowania. Dlatego upewnij się, że żadna ważna strona nie znajduje się dalej niż dwa kliknięcia od strony głównej.


8. Jakość linków zwrotnych

Yandex stosuje różne środki, aby karać tworzenie łańcuchów poleceń, które sztucznie zawyżają popularność strony internetowej.

Jednym z takich środków jest analiza odsetka tekstu z hiperłączami, ponieważ nadmierne linkowanie może wskazywać na zachowanie manipulacyjne. Uwzględnia również jakość linków prowadzących do witryny i karze witryny z dużą liczbą płatnych lub niskiej jakości linków.

Mówiąc o jakości linków, czynnikami, które bezpośrednio wpływają na jakość linków, są liczba przekierowań i sposób budowy linków.


9. Wpływ na ruch związany z wyszukiwaniem

Podobnie jak Google, witryny, które zawierają dobre praktyki SEO, działają lepiej niż te, które tego nie robią. Łatwość odnalezienia to pewny sposób na osiągnięcie wyższej pozycji w rankingu Yandex.

Nic dziwnego, że strony, które mogą służyć intencji wyszukiwania, są liderami dla danego zapytania wyszukiwania. Strony z dokładnym zapytaniem w tagu tytułu i treści mają przewagę. Ponadto stosowanie synonimów jest kolejnym pozytywnym sygnałem, który może prowadzić do podwyższenia pozycji w rankingu.


10. Wzmocnienie Wikipedii

Innym silnym sygnałem wskazującym na wysoką jakość strony jest link z Wikipedii. Yandex faworyzuje strony, do których prowadzą linki z Wikipedii, i umieszcza je wyżej.

11. Treści wideo

Witryny zawierające treści wideo są traktowane priorytetowo. Ale jest pewien haczyk, Yandex zajmuje wyższą pozycję na stronach z filmami hostowanymi przez Yandex (duh).

Jeśli chodzi o ocenę treści wideo na stronie, zastosowanie mają standardowe miary — stosunek średniego czasu oglądania do całkowitej długości filmu.

I chociaż wszystkie z tych 11 odkryć dostarczyły świetnych spostrzeżeń, w świecie SEO toczyła się debata, czy dane, które wyciekły, są cenne, czy nie.

Reakcje na wycieki czynników rankingowych w świecie SEO

Od całkowitego odrzucenia po dogłębną analizę, SEO wyrażali mieszane opinie na temat wycieku Yandex.

Kevin Indig podsumował najczęstsze zastrzeżenia i wniósł cenny wkład w znaczenie czynników rankingowych.

Fragment artykułu Kevina Indiga na temat wycieku danych Yandex
Fragment artykułu „SEO niedoceniają wycieku Yandex” autorstwa Kevina Indiga

Znane nazwiska w dziedzinie SEO, takie jak Ben Wills, Alex Buraks i Mic King, zakasały rękawy i zanurkowały głęboko, aby odszyfrować wyciekające dane.

Ben Wills jest jednym z pierwszych ekspertów, którzy zrozumieli kod źródłowy i pomogli nam zrozumieć znaczenie wydarzenia (mimo że nieco później otworzył wątek na Twitterze).

Ben Willis Tweetuje na Yandex

Mniej więcej w tym samym czasie Rob Ousbey udostępnił wersję alfa narzędzia do eksploracji kodu Yandex:

Tweet Roba Ousbeya na Yandex

Mic King podzielił się swoimi pierwszymi wrażeniami na żywo podczas przeglądania kodu źródłowego, mówiąc nam: „Nie śpij z tym kodem”.

Mic King tweetuje na Yandex


Fora SEO w Rosji były nie mniej zatłoczone, a webmasterzy mieli podobne spostrzeżenia do podzielenia się, jak zachodni świat SEO. Jednak wiele mówiło się również o tym, że Yandex faworyzuje swoje produkty i usługi, jak opisał rosyjski ekspert SEO Dan Taylor.

Wniosek

Czy wyciek kodu źródłowego Yandex zmieni sposób, w jaki robisz SEO?

Prawdopodobnie nie.

Ale wielkim błędem byłoby oznaczyć to jako nieważne i przewinąć obok niego.

Najwyraźniej istnieje wiele podobieństw między Yandex i Google. W związku z tym ten wyciek może służyć jako świetny punkt wyjścia do dalszych eksperymentów i skłonić Cię do jeszcze większego skupienia się na doświadczeniach użytkowników i wysokiej jakości treści.

Więc oprzyj się i zacznij testować.