Что утечка исходного кода Яндекса показала о поисковых системах

Опубликовано: 2023-02-17

Вы когда-нибудь задумывались, что происходит внутри гигантов поисковых систем, таких как Google, Bing и Yahoo?

27 января 2023 года четвертая по величине поисковая система в мире, Яндекс, попала в первые заголовки после масштабной (44 ГБ, если быть точным) утечки данных.

«Итак, в самой популярной поисковой системе России произошел взлом. Насколько это актуально для меня?» Вы можете спросить.

То, что многие новостные каналы назвали злонамеренным действием против компании и безопасности данных клиентов, цифровые эксперты оценили как редкое понимание того, как работают поисковые системы.

И, что более важно, какой контент они отдают приоритет и почему.

Утечка данных обнародовала то, что мы изначально считали 1922 факторами ранжирования, но благодаря Бену Уиллсу это число было исправлено до 17 853. Массивно, да?

Твит Мика Кинга на Яндексе

Мы прошли все 1992.

Читайте дальше, чтобы увидеть, что мы нашли наиболее интересным.


Могу ли я использовать выводы из утечки Яндекса, чтобы подняться выше в Google?

Само собой разумеется, что Яндекс — это не Google.

Но несколько примечательных факторов делают эту утечку актуальной (и познавательной) за пределами России и внутри ваших экспериментов с поисковым ранжированием:

  • Результаты поиска Яндекса и Google примерно на 70% совпадают.
  • Яндекс использует PageRank (почти такой же, как в Google)
  • В Яндексе работает много бывших сотрудников Google, и многие предполагают, что он был спроектирован аналогичным образом.
  • Яндекс следует тем же передовым методам поиска информации, что и Google, таким как инвертирующий индекс или встраивание.
  • Так же, как поисковые системы Google и Bing, Яндекс использует функцию ранжирования Okapi BM25 для оценки релевантности документов заданному поисковому запросу.

твит Алекса Буракса на Яндексе

При этом то, что показывает утечка исходного кода Яндекса, впервые помогает нам лучше различать предположение и знание того, как работает ранжирование в поиске.

Внутри утечки кода Яндекса: 11 выводов о том, как работают поисковые системы

В целом факторы ранжирования Яндекса можно разделить на три категории:

  • Статические факторы , такие как входящие обратные ссылки, входящие внутренние ссылки, заголовки, коэффициент рекламы и т. д. Они относятся к вашему веб-сайту.
  • Динамические факторы, такие как релевантность текста, включение ключевых слов и т. д. Они относятся как к вашему веб-сайту, так и к поисковому запросу.
  • Факторы, связанные с поиском пользователя, такие как местоположение пользователя, язык запроса, модификаторы намерений и т. д. Они напрямую связаны с запросом пользователя.

Самые большие весовые коэффициенты, используемые в статистических моделях:

Весовые коэффициенты Яндекса

1. Реклама на странице

Реклама на странице рассматривается как негативный фактор. По сути, это фактор с наибольшим отрицательным ранговым весом:

Твит Мика Кинга о весе факторов ранжирования Яндекса

Несколько факторов, связанных с рекламой, таких как количество мест размещения рекламы на странице и кликабельность фона, позволяют предположить, что Яндекс не любит страницы с высоким соотношением рекламы к видимому экрану.

2. Факторы уровня URL

Построение URL — еще один фактор, который принимает во внимание Яндекс. И, более конкретно:

  • Наличие цифр в URL.
  • Количество завершающих слэшей («/») в URL-адресе.
  • Количество заглавных букв в URL

Возвращаясь к аргументу о том, что Яндекс — это не Google, и эта утечка не будет ценной, эти факторы URL очень напоминают те, что указаны в рекомендациях Google по структуре URL.


3. Факторы уровня страницы

Здесь есть что раскрыть. Как оказалось, у Яндекса есть множество факторов на уровне страницы, которые играют роль в построении поисковой выдачи. Некоторые из наиболее заметных из них включают в себя:

  • Свежесть страниц — особенно для контента блогов и новостных сайтов. Это отрицательный фактор ранжирования, если контентная страница старше 10 лет. Поэтому чаще обновляйте свой контент.
  • Последний пункт назначения — Яндекс вознаграждает страницы, которые заканчивают поисковый путь пользователя, то есть он нашел то, что искал.
  • Здоровое соотношение источников трафика — Яндекс не любит страницы, получающие трафик из одного источника (например, из органического поиска). Чтобы страница занимала высокие позиции, она должна получать трафик из всех источников — органических, платных, прямых и т. д.
  • Качество контента . Очень важно, чтобы ваш текст был оригинальным и не был перегружен ключевыми словами. Это повышение рейтинга, если ваш текст цитируется/ссылается на внешних доменах. Кроме того, некачественный контент снижает ранжирование качественного контента.

4. Факторы на уровне веб-сайта

Основываясь на факторе свежести страницы, окончательной комбинацией будет наличие хорошо зарекомендовавшего себя веб-сайта, который был активен в течение длительного времени и часто обновлял свой контент.

Кроме того, Яндекс оценивает общее качество веб-сайта по его кликабельности. Другими словами, как часто пользователи нажимают на URL для поиска?

Еще одним положительным фактором ранжирования является доменное имя. Яндекс повышает рейтинг доменов .COM.


5. Качество страницы

Мы уже обсуждали качество контента, но как насчет общего качества страницы? Итак, Яндекс оценивает качество страницы по нескольким факторам:

  • Количество посещений
  • Количество уникальных посетителей
  • Время, проведенное на странице
  • Количество действий на странице

6. Поведение и вовлеченность пользователей

Утечка сделала несколько интересных выводов о поведении пользователей, которые нам необходимо обсудить.

Ключевым фактором является количество кликов и показов, которые хост получает в целом. Яндекс также учитывает удобство страницы для мобильных устройств и анализирует поведение пользователей на мобильных устройствах, в том числе продолжительность сеанса и время, проведенное на странице. Кроме того, когда посетители возвращаются на веб-сайт в течение того же месяца, это является положительным фактором ранжирования.

Но, наверное, самое интересное это:

Страницы с отзывами пользователей имеют приоритет в результатах поиска.

7. Ранг и местоположение хоста

Яндекс уделяет большое внимание расстановке приоритетов контента, географически близкого к пользователю. Таким образом, когда два доменных имени борются за один и тот же поисковый запрос, тот, который ближе к пользователю, получит повышение рейтинга.

С точки зрения технических факторов ранжирования, сокращение количества ошибок клиента на 400 и ошибок сервера на 500 позволит вам опередить себя в поисковой выдаче. Кроме того, Яндекс уделяет большое внимание глубине сканирования. Вот почему убедитесь, что ни одна важная страница не находится дальше, чем в двух кликах от вашей домашней страницы.


8. Качество обратных ссылок

Яндекс применяет различные меры для наказания за создание реферальных цепочек, искусственно завышающих популярность сайта.

Одной из таких мер является анализ процентного содержания гиперссылок, поскольку чрезмерное количество ссылок может свидетельствовать о манипулятивном поведении. Он также учитывает качество ссылок, ведущих на сайт, и наказывает сайты с большим количеством платных или некачественных ссылок.

Говоря о качестве ссылок, факторы, которые напрямую влияют на качество ссылок, — это количество перенаправлений и то, как построены ссылки.


9. Влияние на поисковый трафик

Как и в случае с Google, веб-сайты, использующие передовые методы SEO, работают лучше, чем те, которые этого не делают. Быть легко обнаруживаемым — верный способ добиться более высокого рейтинга в Яндексе.

Неудивительно, что страницы, которые могут служить намерению поиска, являются лидерами для соответствующего поискового запроса. Страницы с точным поисковым запросом в теге заголовка и основном тексте имеют преимущество. Кроме того, использование синонимов — еще один положительный сигнал, который может привести к повышению рейтинга.


10. Повышение Википедии

Еще одним важным сигналом для качественной страницы является наличие ссылок из Википедии. Яндекс отдает предпочтение страницам, на которые есть ссылки из Википедии, и ранжирует их выше.

11. Видеоконтент

Веб-сайты, содержащие видеоконтент, имеют приоритет. Но есть одна загвоздка: Яндекс ранжирует выше страницы с видео, размещенными на Яндексе.

Что касается оценки видеоконтента страницы, применяются стандартные меры — среднее время просмотра по сравнению с общей продолжительностью видео.

И хотя все эти 11 результатов позволили сделать некоторые важные выводы, в мире SEO возникли споры о том, ценны ли утечка данных или нет.

Реакция на утечку факторов ранжирования в мире SEO

SEO-специалисты выразили неоднозначное мнение об утечке из Яндекса — от прямого увольнения до глубокого анализа.

Кевин Индиг обобщил наиболее распространенные возражения и внес большой вклад в значимость факторов ранжирования.

Отрывок из статьи Кевина Индига об утечке данных Яндекса
Отрывок из статьи Кевина Индига «Сеошники недооценивают утечку Яндекса»

Известные имена в области SEO, такие как Бен Уиллс, Алекс Буракс и Мик Кинг, засучили рукава и погрузились в расшифровку утекших данных.

Бен Уиллс — один из первых экспертов, который разобрался в исходном коде и помог нам понять значение события (хотя он открыл ветку в Твиттере чуть позже).

Твит Бена Уиллиса на Яндексе

Примерно в то же время Роб Усби поделился альфа-версией проводника для кода Яндекса:

Твит Роба Усби на Яндексе

Мик Кинг поделился своими первыми впечатлениями вживую, просматривая исходный код, сказав нам: «Не спите над этим кодом».

Твит Мика Кинга на Яндексе


SEO-форумы в России были не менее переполнены, и веб-мастера делились теми же идеями, что и западный мир SEO. Тем не менее, было также много разговоров о том, что Яндекс отдает предпочтение его продуктам и услугам, о чем рассказал российский SEO-эксперт Дэн Тейлор.

Заключение

Повлияет ли утечка исходного кода Яндекса на то, как вы занимаетесь SEO?

Возможно нет.

Но будет огромной ошибкой пометить это как неважное и прокрутить мимо него.

Судя по всему, между Яндексом и Гуглом много общего. Следовательно, эта утечка может послужить отличной отправной точкой для дальнейших экспериментов и подтолкнуть вас к тому, чтобы еще больше сосредоточиться на пользовательском опыте и качественном контенте.

Так что дерзайте и приступайте к испытаниям.