Что такое PageRank?

Опубликовано: 2022-07-01

PageRank — это алгоритм, разработанный основателями Google Ларри Пейджем и Сергеем Брином. Он измеряет важность веб-страницы в более широком наборе страниц, вычисляя количество и качество ссылок, ведущих на исследуемую страницу. PageRank — это один из многих факторов, которые Google использует для ранжирования веб-страниц в результатах поиска Google, что делает его показателем успеха в SEO.

Первоначальная цель PageRank заключалась в том, чтобы помочь Google генерировать высокорелевантные результаты поиска по сравнению с альтернативными поисковыми системами того времени, используя дополнительный инновационный фактор. Алгоритм до сих пор используется для ранжирования в поиске, хотя его первоначальная формула значительно изменилась за прошедшие годы и больше не доступна для общественности.

Содержимое скрыть
1 Почему PageRank имеет решающее значение для SEO?
2 История PageRank
2.1 Дилеммы поисковых систем перед PageRank
2.2 Исходная формула PageRank
2.3 Что такое панель инструментов PageRank и почему она была удалена?
2.4 Важные обновления PageRank
3 устаревших SEO-метода для повышения PageRank
3.1 Что такое схемы ссылок?
3.2 Что такое обновление Penguin и как оно борется с нечестным SEO?
4 PageRank в современном SEO
4.1 Использует ли Google PageRank по-прежнему?
4.2 Принципы здорового линкбилдинга
4.3 Как не нарушить рекомендации Google для веб-мастеров?
4.4 PageRank и редиректы
4.5 PageRank и ссылки в социальных сетях
5 Измерение PageRank
5.1 Авторитет страницы и авторитет домена
5.2 Поток доверия и поток цитирования
5.3 Рейтинг домена
6 основных выводов

Почему PageRank имеет решающее значение для SEO?

Первоначальная идея Ларри Пейджа и Сергея Брина заключалась в том, чтобы создать алгоритм, который рассматривал бы ссылки как голоса, которые страницы отдают друг другу, выражая доверие и одобрение. Согласно этой логике, чем больше ссылок на данную веб-страницу поступает с других веб-страниц, тем более важной она считается — страницы с более высоким показателем PageRank считаются более полезными для веб-пользователей и должны отображаться выше на странице результатов поиска Google.

Хотя это далеко не единственный фактор ранжирования, который использует Google, он определенно важен.

PageRank — это рекурсивный алгоритм — значение, присваиваемое ссылкам с данной страницы, зависит от количества и качества ссылок, полученных самой данной страницей. Поэтому ссылки с авторитетных сайтов передают большее значение PageRank.

Однако, если данная страница ссылается на множество других страниц, эти страницы получат лишь часть авторитета данной страницы из-за ослабления PageRank . Ссылки на странице делят между собой значение PageRank этой страницы. Чем больше ссылок на странице, тем меньшую ценность может передать каждая из них.

Эти особенности алгоритма имеют два следствия, когда дело доходит до SEO.

  1. Выгодно размещать ссылки на ваш контент на других авторитетных веб-сайтах.
  2. Количество ссылок на ваших страницах может быть стратегическим выбором.

В настоящее время гуглеры редко обсуждают PageRank, но Google трудно представить без него. PageRank помог Google завоевать Интернет и оказал огромное влияние на индустрию SEO.

История PageRank

За последние два десятилетия Google пожинал плоды использования PageRank, одновременно борясь с различными методами злоупотребления им со стороны владельцев веб-сайтов.

Изучение истории PageRank не только увлекательно, но и дает полезный контекст для планирования последовательной SEO-кампании.

Ларри Пейдж и Сергей Брин представили PageRank в 1998 году в своем патенте под названием «Анатомия крупномасштабной гипертекстовой поисковой системы в Интернете». В патенте описывалась их идея инновационной поисковой системы под названием Google и объяснялось, как она будет давать более релевантные результаты, чем конкурирующие системы. Авторы утверждали, что исключительная точность поиска Google будет результатом использования PageRank — возможности ранжировать страницы на основе ссылок, которыми они обмениваются.

Последующие годы показали, что PageRank действительно стал прорывом, и не только для   поисковые системы.

Джон Мюллер, советник Google по вопросам поиска, сообщил в Твиттере, что PageRank в настоящее время используется в биологии, неврологии, химии и физике.  

Дилеммы поисковых систем перед PageRank

Давайте совершим небольшое путешествие в прошлое, когда был впервые создан PageRank.

Сеть времени была меньше, чем сегодня, но с каждым днем ​​она становилась все более хаотичной. Первый сайт появился в 1991 году; три года спустя почти 2800 веб-сайтов работали. В 1998 году, когда появился PageRank, Интернет вырос до более чем 2 410 000 страниц.  

Если вы проголодались в 1998 году и захотели найти рецепт быстрого соуса для спагетти среди этих 2,4 миллиона страниц, вы могли бы воспользоваться помощью молодых поисковых систем, таких как AltaVista.

Тогда поисковые системы, пытающиеся найти самый быстрый и вкусный рецепт соуса для спагетти, в основном руководствовались ключевыми словами. Чем больше на данной странице упоминался соус для спагетти, тем выше они думали, что он должен занимать высокие позиции. Это побудило владельцев веб-сайтов наполнить свои страницы ключевыми словами, чтобы повысить рейтинг и привлечь больше поискового трафика. Таким образом, вместо самого удовлетворительного результата вы, скорее всего, получите результат с наибольшим количеством ключевых слов.

Альтернативным решением был поиск рецепта в созданном человеком веб-каталоге, таком как Yahoo Directory. Эти индексы были кураторскими, что означало, что люди вручную ранжировали результаты поиска. Голодный поисковик может рассчитывать на более точные, проверенные результаты, используя созданный человеком индекс. Но по мере роста сети стало ясно, что люди не поспевают за темпами. Веб-сайтов было слишком много, чтобы кто-то мог отслеживать их вручную.

Решение

Стало очевидным, что только полностью автоматизированные системы поиска информации могут достаточно быстро перемещаться по постоянно расширяющейся сети. Проблема заключалась в том, что компьютеры не могли понимать и оценивать веб-контент так же хорошо, как люди. Алгоритмы нуждались в новых метриках помимо ключевых слов.

Люди решили, что ссылки подходят для такой метрики, и начали экспериментировать с гипертекстовой природой Интернета. Они справедливо предположили, что страницы, ссылающиеся на данную страницу, предоставляют дополнительную информацию о содержании этой страницы. Некоторые подсказки, необходимые алгоритмам, содержались в якорном тексте. Кроме того, страницы по схожим темам будут более активно ссылаться друг на друга.

Авторы PageRank воспользовались этой идеей и пошли еще дальше. Они решили использовать ссылки для измерения важности страниц. Они думали, что авторитетные сайты могут передать свой авторитет страницам, на которые они ссылаются, и тогда поисковая система сможет не только определить наиболее подходящие результаты, но и ранжировать их с точки зрения удобства использования.

Оригинальная формула PageRank

Итак, как можно измерить важность данной веб-страницы? Вот где PageRank вступает в игру.

Познакомьтесь с Джо, случайным серфером

Самый простой способ понять, как работает PageRank, — представить посетителя, случайным образом переходящего по ссылкам между страницами. Назовем его Джо и предположим, что он очень любит спагетти.

Голод привел Джо к блогу об итальянской кухне, в котором есть ссылки на рецепт соуса болоньезе и рецепт соуса карбонара.

Страница карбонара относится к совершенно другому сайту пиццы.

Визуализация четырех страниц, ссылающихся друг на друга с наименьшим количеством ссылок

На странице пиццы есть ссылки на блог, с которого начал Джо, и уже знакомый рецепт карбонары.

Визуализация четырех страниц, ссылающихся друг на друга с еще несколькими ссылками

Начиная со страницы с болоньезе, Джо может перейти на страницу с пиццей или карбонарой.

Визуализация четырех страниц, ссылающихся друг на друга со всеми ссылками в данном примере

Джо очень нерешительный человек. Он бесконечно щелкает между этими четырьмя страницами.

Интересно, что это меняет вероятность посещения каждой из этих страниц.

Когда Джо читает блог (предположим, что это одностраничный блог), с вероятностью 50% он откроет рецепт болоньезе и с вероятностью 50% откроет рецепт карбонары. Однако, когда он находится на сайте спагетти карбонара, у него нет другого выбора, кроме как перейти на сайт пиццы. Затем он может вернуться к рецепту карбонары или к блогу и повторить цикл. Вероятность обоих этих вариантов составляет 50%.

Чтобы Джо попал на веб-сайт спагетти с болоньезе с первого клика, должны быть верны две вещи. Во-первых, есть вероятность 25%, что он начнет просмотр с блога, а затем есть вероятность 50%, что он нажмет на нужную ссылку.

Когда мы умножаем эти вероятности, мы обнаруживаем, что вероятность того, что Джо прочитает рецепт соуса болоньезе после первого щелчка, составляет 12,5%. Для сравнения, вероятность того, что Джо попадет на сайт о соусе карбонара после первого клика, составляет 37,5%.

Рекурсивность PageRank

Мы можем примерно предсказать, сколько времени Джо потратит на каждую из четырех страниц. При втором раунде кликов шансы Джо на запуск на разных сайтах уже не 25%, но они различаются. Многократно умножая числа, мы замечаем, что ссылки с часто рекомендуемых страниц увеличивают вероятность перехода на страницу, на которую они ссылаются.

Это называется рекурсивностью PageRank, и именно поэтому сайты с высоким рейтингом PageRank передают большую часть рейтинга PageRank другим сайтам, поэтому ссылки с них ценятся в SEO.

Разбавление PageRank

Модель Random Surfer также является отличной иллюстрацией ослабления PageRank. Страница с рецептом карбонары имела наибольший авторитет в приведенном выше примере. Он ссылался только на страницу рецепта пиццы, что позволяло странице рецепта пиццы получить полное значение PageRank, потому что у случайного посетителя не было другого выбора, кроме как перейти туда.

Однако, если бы страница карбонара содержала две дополнительные ссылки, страница с пиццей получила бы одну треть начального значения PageRank. В этом случае вероятность того, что случайный посетитель воспользуется ссылкой на страницу с пиццей, составит один к трем .

Коэффициент демпфирования

Конечно, случайный посетитель, описанный в патенте Google, не может застрять на четырех страницах, ссылающихся друг на друга, потому что их работа заключается в измерении важности веб-сайтов во всем Интернете.

Итак, давайте представим, что нерешительный Джо колеблется, предпочел бы он съесть китайское блюдо. Если он решит отложить поедание макарон на завтра, он полностью откажется от своего путешествия по интернету. Следование этому сценарию помогает нам понять фактор демпфирования: вероятность того, что Джо будет продолжать следовать структуре ссылок вместо того, чтобы отказаться от заданных четырех страниц и перейти к другому веб-уголку.

В первоначальном патенте Ларри Пейдж и Сергей Брин предложили использовать коэффициент демпфирования 0,85, что означает, что с каждой посещенной страницей существует вероятность 85%, что случайный посетитель будет продолжать нажимать ссылки на странице и не полностью прекратит процесс.

Математическая формула PageRank

Все описанное выше можно представить в виде единой математической формулы расчета PageRank. В простейшей форме, если бы сеть содержала только четыре страницы, это выглядело бы так:

PR(A) = [PR(B)]/L(B) + [PR(C)]/L(C) + [PR(D)]/L(D),

где PR(B) обозначает показатель PageRank страницы B , а L(B) обозначает общее количество ссылок на странице B.

Уравнение утверждает, что PageRank страницы A равен сумме показателей PageRank страниц B , C и D , разделенных на количество ссылок, исходящих с этих страниц.

Но чтобы получить полное представление о том, как работает алгоритм, нам также необходимо учитывать коэффициент затухания d .

PR(A) = [(1-d)/N] + d{ ([PR(B)]/L(B) + [PR(C)]/L(C) + [PR(D)]/L (Г) }

Буква N обозначает количество документов в данной коллекции. В этом сценарии N равно четырем.

Если вас интересуют более сложные преобразования формулы PageRank, ознакомьтесь со статьей в Википедии о PageRank.

Что такое панель инструментов PageRank и почему ее удалили?

PageRank стал всеобщей навязчивой идеей в 2000 году, когда Google представил панель инструментов, устанавливаемую в браузере. Одной из функций панели инструментов Google было отображение PageRank. Его разработчики описали это следующим образом: «Интересно, стоит ли новый сайт вашего времени? Используйте PageRank Панели инструментов, чтобы узнать, как Google оценивает важность страницы, которую вы просматриваете».

Максимальный PageRank, который страница могла получить на панели инструментов, равнялся 10. Ноль означал, что страница совершенно не заслуживает доверия и внимания.

По общему признанию, это число было легко понять и отследить, и многие SEO-специалисты сосредоточились на том, чтобы улучшить его как ключевой показатель успеха для всех веб-сайтов.

Это оказалось ужасно для качества контента в сети. Вместо того, чтобы делать более качественные и полезные веб-сайты, люди сосредоточились на создании как можно большего количества ссылок, чтобы улучшить свои показатели PageRank. Излишне говорить, что большинство этих ссылок были созданы не для того, чтобы помочь пользователям — их целью было обмануть Google.

Сами сотрудники Google пытались убедить веб-администраторов сосредоточиться на других показателях, но без особого успеха. Хотя PageRank постоянно пересчитывался, Google редко обновлял значения, отображаемые на панели инструментов. Сотрудники Google признались, что хотели избежать того, чтобы люди стали еще более одержимыми показателями PageRank.

Когда попытки изменить поведение веб-администраторов оказались безуспешными, Google, наконец, заметил, что отображение PageRank приносит больше вреда, чем пользы. Отображение PageRank на панели инструментов в последний раз обновлялось в декабре 2013 года, а три года спустя эта функция полностью исчезла.

Важные обновления PageRank

PageRank не был идеальным в своей первоначальной форме. Со временем стало очевидно, что он нуждается в улучшении и защите от тех, кто пытается им манипулировать.

Google также становился все более осторожным в отношении роли PageRank в ранжировании результатов поиска. В конце концов, бывший сотрудник Google сообщил, что компания больше не использует оригинальный патент PageRank с 2006 года . Эти шаги могли быть мотивированы тем, насколько вся SEO-индустрия была сосредоточена на манипулировании PageRank. Однако бывший сотрудник также указал, что новый алгоритм значительно быстрее вычисляется, и единственной причиной этого изменения могла быть потребность в большей эффективности.

Возможно, мы никогда не узнаем, как развивалась первоначальная формула PageRank и как она сейчас используется в поисковом рейтинге. Однако мы можем сделать два важных изменения из двух патентов, поданных в 2004 и 2006 годах.

Познакомьтесь с Джоэль, разумным серфером

В патенте, поданном в июне 2004 года, «Рейтинг документов на основе поведения пользователя и/или данных о функциях» Google описал модель разумного серфера.

Почему случайный серфер должен был стать разумным? Одним из элементов исходной модели было предположение, что пользователь имеет одинаковую вероятность щелкнуть по каждой ссылке на данной странице. Это означало, что каждая ссылка имела одинаковое значение PageRank.

Конечно, эта предпосылка не совсем отражала действительность.

Представьте женщину по имени Джоэль, которая хочет произвести впечатление на своих друзей, приготовив домашнюю пиццу. Она просматривает Интернет и просматривает множество рецептов. Когда страница ссылается на другие предложенные рецепты, она также просматривает их случайным образом.

Тем не менее, на данный момент ее вряд ли интересует политика конфиденциальности кулинарного портала. Ей также не нужно покупать горшки для выращивания базилика. Вероятность того, что она нажмет на любую из этих ссылок, ничтожно мала.

В патенте указано:

Системы и способы, совместимые с принципами изобретения, могут обеспечить разумную модель пользователя, которая указывает, что когда пользователь получает доступ к документу с набором ссылок, пользователь будет следовать некоторым ссылкам с большей вероятностью, чем другим. Эта разумная модель пользователя отражает тот факт, что не все ссылки, связанные с документом, будут переходить с одинаковой вероятностью. Примеры маловероятных ссылок могут включать ссылки «Условия предоставления услуг», рекламные баннеры и ссылки, не связанные с документом.
источник: Ранжирование документов на основе поведения пользователей и/или данных о функциях .

Джоэль нерешительна и хаотична, но разумна. Как алгоритм может успешно имитировать ее поведение? Он должен учитывать, например, позицию ссылки на веб-сайте . Размер и цвет анкорного текста также могут подсказывать, будет ли Джоэль заинтересована в клике. Если анкорный текст будет звучать слишком коммерчески, она откажется от посещения сайта. Если кто-то указал ссылку среди других, Джоэль, скорее всего, нажмет на ссылки с более высокими позициями в этом списке.

Цель заключалась в том, чтобы дифференцировать вес, передаваемый ссылками, в зависимости от их характеристик. Эти важные атрибуты перечислены в патенте:

Примеры функций, связанных со ссылкой, могут включать размер шрифта текста привязки (…); положение ссылки (…), сторона документа; если ссылка находится в списке, позиция ссылки в   список; цвет шрифта или атрибуты ссылки (например, курсив, серый, тот же цвет, что и фон и т. д.); (…); коммерческость анкорного текста, связанного со ссылкой; (…). Этот список не является исчерпывающим и может включать больше, меньше или другие функции, связанные со ссылкой.
источник: Ранжирование документов на основе поведения пользователей и/или данных о функциях .

Seed-сайты — что это такое и как они влияют на PageRank?

Еще одна важная идея, которая, вероятно, повлияла на формулу PageRank, заключалась в том, чтобы понять, что можно выбрать набор страниц, заслуживающих доверия по определению.

Маловероятно, например, что государственные сайты будут ссылаться на блоги, объясняющие, как обмануть налоговую систему. Также можно выделить несколько авторитетных газет, журналисты которых проводят качественные исследования и не ссылаются на непроверенную информацию.

Согласно патенту 2006 года под названием «Построение рейтинга страниц с использованием расстояний в графе веб-ссылок», эти типы веб-сайтов являются «исходными сайтами». В документе перечислены два примера: The Google Directory и The New York Times. Эти страницы предварительно выбраны, и мы можем предположить, что страницы, на которые они ссылаются, должны иметь более высокий PageRank.  

Но как насчет страниц, на которые ссылаются сайты, на которые напрямую ссылаются исходные сайты? Некоторые исходные сайты их не распознают, но мы все же можем быть уверены, что сайт, завоевавший доверие New York Times, не будет включать в свои статьи ненужные ссылки. Для алгоритма ранжирования целесообразно рассчитать расстояние между данной страницей и одним из выбранных исходных сайтов.

Представьте себе веб-сайт воображаемой ассоциации любителей итальянской кухни. Благодаря своей репутации, работе с профессиональными авторами и высококачественному контенту Google может считать его исходным сайтом.

Для простоты предположим, что во всем Интернете есть только две страницы с рецептом спагетти болоньезе. Когда вы голодны и ищете рецепт этого блюда, у Google может возникнуть дилемма, какой из них отображать первым. Таким образом, он проверит, насколько близко они находятся к известному веб-сайту Ассоциации энтузиастов итальянской кухни. Страница, находящаяся в двух ссылках от исходного сайта, должна иметь более высокий рейтинг, чем страница, находящаяся в семи ссылках от надежного источника.

Устаревшие методы SEO для повышения PageRank

Как мы упоминали ранее, владельцы веб-сайтов и специалисты по поисковой оптимизации поставили перед собой колоссальную задачу получить наивысший балл PageRank. Алгоритм влиял на их позицию в результатах поиска и свидетельствовал о престижности сайта. Некоторые SEO-специалисты называли значение PageRank, которое страницы передавали друг другу, «ссылочным соком». И каждый хотел выжать его до последней капли.

Визуализация ссылочного веса, перетекающего с веб-сайтов на другие веб-сайты.

К удовольствию многих, исходным алгоритмом было легко манипулировать . Люди, которые шли коротким путем и не уклонялись от недобросовестных методов, успешно генерировали массу трафика на свои некачественные сайты. Наличие большего количества ссылок было достаточно, чтобы повысить видимость любого веб-сайта. Откуда пришли эти ссылки, в конце концов, не имело значения.

Google пришлось извлечь некоторые уроки из своих ошибок, чтобы Интернет не превратился в огромную ферму ссылок. Прорыв произошел, когда компания разработала автоматические способы поимки и наказания веб-сайтов, нарушающих правила .

Что такое схемы ссылок?

Представьте, что вы ведете блог о китайской кухне. Когда вы создаете сообщения и делитесь своими знаниями, может быть полезно порекомендовать читателям другие источники. Иногда вы ссылаетесь на другой блог на эту тему или рекламируете увлекательные кулинарные мастер-классы, на которые сами пойдете.

Такие ссылки называются «естественными». Включение их в ваш пост сделает информацию более полной и ценной. Вы решаете сделать их из желания создать хороший блог, а не поднять чей-то PageRank.

Однако не у всех в сети такие благие намерения, как у вас. Люди регулярно публикуют вырванные из контекста ссылки без какой-либо пользы для пользователей. Их цель — увеличить количество обратных ссылок, указывающих на сайт, который они хотят повысить в результатах поиска. Эти бесполезные обратные ссылки, как правило, покупаются, генерируются автоматически или навязываются подрядчикам.

Такие действия, связанные с размещением неестественных ссылок и попытками манипулировать PageRank, называются схемами ссылок . Давайте обсудим их более подробно.

Покупка и продажа ссылок

В прошлом преобладала продажа ссылок по доменам с высоким рейтингом. Этот тип практики злоупотреблял принципом, согласно которому ссылки со страниц с высоким показателем PageRank значительно увеличивают показатель PageRank связанного сайта. Google поймал The Washington Post за продажу ссылок в 2007 году и BBC в 2013 году. В качестве наказания рейтинг PageRank их веб-сайтов был вручную снижен, и в последующие месяцы они потеряли много посетителей.

Однажды Google даже пришлось наказать собственный продукт. В 2012 году официальный сайт Google Chrome использовал купленные посты в блогах для продвижения. Штраф снизил PageRank домена, и первая страница результатов поиска больше не отображала страницы Chrome для запроса «браузер».

Google не раскрывает, всегда ли ручное наказание для сайтов, продающих ссылки, является снижением их PageRank, но сообщения прессы о ручных действиях Google в начале 2010-х предполагают, что оно состояло из этого.

Когда мы могли видеть показатель PageRank на панели инструментов, это был не только результат алгоритмического расчета, но и выражение мнения Google о данном портале. И Google не мог так доверять веб-сайту, уличенному в продаже неестественных ссылок, как раньше.

Бывший руководитель группы Google по борьбе со спамом Мэтт Каттс ( Matt Cutts ) упоминает проблему ручного понижения PageRank в видео на YouTube.

Продажа и покупка ссылок не всегда связана с деньгами. Бывало так, что две несвязанные страницы соглашались на обмен ссылками друг на друга. Более того, некоторые предприниматели решили отправлять другим «бесплатные» товары в обмен на прикрепление ссылки на сайт своего магазина. Некоторые бизнесмены сделали ссылку на свой сайт условием использования услуг своей компании. Обычно они не позволяли подрядчикам отказаться от этой части сделки.

Спам-комментарии

Еще одним печальным событием стала публикация спам-комментариев в сети. Предположим, кто-то заметил, что ваш блог о китайской кухне имеет высокий PageRank, а затем разместил комментарий под одним из ваших постов со ссылкой на свой рецепт карбонары, хотя вашим читателям это неинтересно. Такие действия, безусловно, не стимулируют продуктивную дискуссию в вашем блоге и служат только для неестественного повышения рейтинга другой страницы.

Связать фермы

Интернет-пользователи несколько лет назад также могли наблюдать, как фермы ссылок растут как грибы после дождя. Ссылочные фермы — это группы веб-сайтов, которые ссылаются друг на друга для повышения своего рейтинга. Ранее мы говорили о том, как PageRank имитирует поведение случайного посетителя и как он будет работать на четырех кулинарных страницах, ссылающихся друг на друга. Что, если все эти страницы создал один и тот же автор, и его единственной целью было повысить PageRank одной из них?

Представьте, что указанный автор не сделал эти дополнительные страницы источником независимой информации, а только для того, чтобы дать случайному посетителю больше шансов посетить сайт с рецептом карбонары. Их отношение не поддерживает создание надежного и удовлетворительного контента в Интернете и не соответствует целям Google.

Большинство ферм ссылок были созданы не человеческими руками, а автоматизированными программами, способными ежедневно заполнять серверы сотнями новых ненужных страниц. Ссылочные фермы следует рассматривать как очень негативное явление, поскольку они заполняют сеть спамом.

Что такое обновление Penguin и как оно борется с нечестным SEO?

В апреле 2012 года было объявлено о новом обновлении Google. Несмотря на дружественное кодовое название — «Пингвин» — он был направлен на яростную борьбу с веб-админами, которые манипулировали PageRank. Google запрограммировал алгоритм Penguin на поиск неестественных ссылок и наложение штрафа на сайты , которые извлекли из них выгоду.

После выпуска Penguin многие веб-администраторы были удивлены, обнаружив внезапное падение рейтинга их веб-сайтов. Им пришлось пройти через утомительную очистку обратных ссылок, чтобы восстановить потерянный рейтинг PageRank. Им часто приходилось отправлять запросы по электронной почте, чтобы удалить неестественные ссылки на их сайты, и Google ценил тщательное документирование этих действий.

Когда связаться с сайтом с нежелательной ссылкой было невозможно, можно было отклонить ее, отправив соответствующий запрос в Google.

Алгоритм Penguin обновлялся семь раз и стал частью базовой инфраструктуры Google. С момента своего появления ссылочные фермы или покупка ссылок могут только навредить видимости сайта — по крайней мере, в долгосрочной перспективе. Хотя ссылочный спам продолжается и сегодня, его эффективность значительно снизилась благодаря этой мере. Каждый из нас может помочь Penguin в охране качества результатов поиска. Если вы заметили неестественные ссылки, вы можете использовать эту форму Google, чтобы сообщить о схемах ссылок.

PageRank в современном SEO

PageRank прошел долгий путь с момента своего первого появления. Алгоритму пришлось перехитрить схемы ссылок и научиться различать разные типы ссылок. Его точная роль в ранжировании результатов поиска остается секретом.

Итак, что вы должны знать о PageRank, чтобы разрабатывать лучшие стратегии SEO?

Google все еще использует PageRank?

PageRank начинался как алгоритм, измеряющий, сколько времени случайный посетитель проведет на вашем сайте. Со временем он, вероятно, научился учитывать местоположение и анкорный текст ссылок и дифференцировать вероятность перехода пользователя по ним. Алгоритм также должен был стать устойчивым к манипуляциям и начать распознавать исходные сайты, которые по определению заслуживают доверия.

Все эти значительные изменения PageRank и тот факт, что его первоначальный патент был отозван самое позднее в 2006 году, могут навести вас на мысль, что Google больше не может использовать этот алгоритм. Но Google не забыл о решении, которое в первую очередь сделало его таким успешным.

Этот твит Джона Мюллера о PageRank может служить доказательством того, что Google все еще использует свой знаменитый алгоритм. Аналитик Google Webmaster Trends Гэри Иллиес также подтвердил в Твиттере, что PageRank по-прежнему важен для ранжирования.

Принципы здорового линкбилдинга

Сегодня вы больше не можете использовать панель PageRank и видеть показатель PageRank вашего веб-сайта. Однако его скрытая ценность по-прежнему имеет основополагающее значение для видимости в поиске и может быть увеличена.

Вы, конечно, не должны платить за ссылки, чтобы улучшить PageRank. Это строго нарушает рекомендации Google и в долгосрочной перспективе обязательно повредит вашему рейтингу.

Вместо этого вы должны сосредоточиться на двух вещах:

  1. Создание качественного контента, который естественным образом получает качественные обратные ссылки, чтобы улучшить внешний поток PageRank для вашего домена.
  2. Убедитесь, что ваш контент внутренне связан и подходит для правильного распределения внутреннего PageRank на вашем сайте.

Качественные обратные ссылки

Представьте, что вы завели блог о китайской кухне. Как вы можете улучшить рейтинг этой страницы, если рекламные ссылки не могут передать вам PageRank, не нарушая рекомендаций Google? Вот где цифровой PR вступает в игру. В то время как традиционный PR фокусируется на повышении узнаваемости бренда с использованием традиционных средств массовой информации, таких как пресса, цифровой PR концентрируется на онлайн-методах.

Вы можете связаться с блогерами или журналистами и предложить им написать о проекте, который вы ведете в своем блоге, в рамках которого вы рассылаете опросы диетологам и публикуете свои выводы о пользе для здоровья употребления китайских блюд. Создатели контента вряд ли будут заинтересованы только в существовании вашего веб-сайта, поскольку это один из тысяч блогов о китайской кухне, но вы можете заинтересовать их своим исследованием.

Если вы будете настойчивы, вы можете попасть в некоторые новости и статьи, а с ними вы получите естественные, ценные обратные ссылки.

Внутренняя перелинковка

Мы не можем игнорировать внутренние ссылки в обсуждении PageRank. Внутренние ссылки служат двум основным целям:

  1. Они влияют на индивидуальный рейтинг.
  2. Они помогают браузерам перемещаться по вашему сайту.

То, как отдельные страницы вашего веб-сайта ссылаются друг на друга, имеет решающее значение, потому что без правильного соединения они могут никогда не быть обнаружены Google. Например, создание так называемых страниц-сирот без внутренних ссылок, указывающих на них, является огромной ошибкой. Наша статья об этих проблемах может помочь вам узнать, как исправить проблемы с внутренними ссылками.

PageRank против поддоменов и подпапок

Интересно, что один из основных вопросов, который вы, возможно, захотите задать себе при оптимизации PageRank, — это дилемма между созданием поддоменов или подпапок для вашего веб-сайта. Представьте, например, что в вашем блоге о китайской кухне есть версия для начинающих поваров и версия для экспертов.

Широко распространенная теория гласит, что Google может рассматривать поддомен экспертной версии как отдельный веб-сайт от вашего блога (и любые ссылки между ними как внешние ссылки), а ссылки между блогом и его подпапкой экспертной версии интерпретировать как внутренние ссылки.

Многие известные эксперты по SEO, такие как Барри Адамс, утверждают, что более высокий коэффициент демпфирования будет обременять ссылки на субдомен. Таким образом, ваш блог будет передавать им меньше PageRank, а своим подпапкам — больше PageRank. Однако стоит отметить, что люди основывают эту гипотезу на несколько устаревшем понимании алгоритма, который не всегда может вести себя столь предсказуемым образом.

Как не нарушить рекомендации Google для веб-мастеров?

PageRank призван помочь пользователям поисковых систем находить качественный контент с надежных сайтов. Обратные ссылки могут измерить это доверие только тогда, когда они естественны; то есть они ссылаются на страницы, полезные в контексте поиска пользователей.

Продажа ссылок как попытка манипулировать PageRank подвергает веб-сайт штрафу, налагаемому Google, что снижает его рейтинг и видимость. После обновления Penguin 2012 года алгоритмы Google автоматически обнаруживают и наказывают такие действия.

Теперь вам может быть интересно, как так много веб-сайтов размещают рекламу среди своего контента, не ставя под угрозу их видимость. Секрет в том, что Google не будет считать ваши коммерческие ссылки неестественными или мошенническими, если они помечены соответствующим образом.

Google ценит, когда вы открыто объясняете взаимосвязь между вашим сайтом и ссылкой. Чтобы избежать случайных нарушений рекомендаций, вы можете использовать атрибуты ссылок, которые представляют собой скрытые фрагменты текста, описывающие каждую ссылку в HTML-коде.

Тег nofollow

Тег nofollow — это самый старый способ запретить Google передавать какой-либо PageRank на связанную страницу. SEO-специалисты сравнивают значение PageRank со ссылочным соком, который можно «перелить» с одного сайта на другой. Они могли бы сказать, что если бы ваш веб-сайт был стаканом ссылочного сока, который льется через отверстия для ссылок, тег nofollow был бы куском ленты, удерживающим жидкость внутри стакана.

Эта метафора явно несовершенна, потому что ссылка на другую страницу не приведет к потере PageRank. Но вы все равно можете использовать тег nofollow, чтобы предотвратить передачу полномочий страницам, которые вы не хотите поддерживать.

Тег nofollow следует использовать внутри HTML-элемента <a> как таковой:

<a href=”http://www.example.com”rel=”nofollow”>Some Anchor Text</a>

Sponsored and UGC tags

In September 2019, Google announced two new rel attributes designed to stop the PageRank flow. You can put them into HTML the same way as nofollow tags. Here's what they look like and what they do in comparison to the nofollow attribute:

Nofollow tag Sponsored tag UGC tag
rel=” nofollow” rel=” sponsored” rel=” ugc”
Marks links to sites you don't want to pass any PageRank to for whatever reason. Marks links resulting from a paid advertisement or endorsement. Marks links posted by your website's users that might be spam, and you don't want to take responsibility for them.

Google indicated that it isn't necessary to change the existing nofollow tags to more specific UGC or sponsored tags but recommended using them in the future. It's also possible to use more than one rel attribute to mark a single link.

At the same time, as stated in the announcement, from now on, the described tags will no longer serve as an absolute PageRank blocker but rather as hints for Googlebot. However, their use is still required if you don't want your site to be penalized for unnatural linking.

PageRank and redirects

Sometimes, you may need to move your website or page to a different address. Surely you'd like its PageRank to be retained. Fortunately, using a 301 redirect will help you achieve precisely this effect.

People have many doubts about how Google treats 302 redirects regarding PageRank. Due to the fear of losing PageRank, web admins often give up using those redirects. In one of the SEO Office Hours meetings, John Mueller confirmed that concerns around 302 redirects are unfounded. The 302 redirect allows the original address to retain the whole PageRank value.

PageRank and links shared on social media

A participant of a different SEO Office Hours meeting asked another interesting question whether the number of followers or likes increases the PageRank passed by the social media profile. We found out then that Google doesn't consider social media activity with regard to PageRank. Even if the search engine treats a social media profile as a regular webpage, the number of likes it has will not affect the PageRank passed.

Measuring PageRank

Since Google Toolbar isn't available anymore and Google no longer uses the original PageRank formula, there aren't any methods you can use to measure PageRank for your web pages or even to see its approximation.

However, it's still helpful to analyze your website's link profile, and for that, you need an alternative metric. There are several metrics that are popular in the SEO industry that attempt to simulate PageRank. Although Google doesn't use any of those metrics for ranking web pages, using them can be useful when auditing your website.

Page Authority and Domain Authority

Page Authority and Domain Authority are metrics developed by Moz to illustrate a page's or a domain's ranking potential. PA and DA range from 0 to 100 on a logarithmic scale, making it easier to improve them from 20 to 30 points than from 60 to 70 points. To calculate Page and Domain Authority, Moz uses data from the Mozscape web index and machine learning algorithms.

Trust Flow and Citation Flow

Trust Flow and Citation Flow by Majestic assess a website's authority based on its backlink profile. Citation Flow shows how many links point to your website, while Trust Flow focuses on the quality of those links.

Trust Flow grows when popular and reputable websites link to your page and will always score lower than Citation Flow, which considers all links no matter their status.

Domain Rating

Domain Rating is a metric developed by Ahrefs. It's calculated on a logarithmic scale of 0 to 100. Domain Rating is based on backlinks Ahrefs found pointing to your site without nofollow tags.

Ahrefs designed it to measure the authority of entire websites, not individual pages.

Key takeaways

  1. PageRank is an algorithm that helps Google evaluate the popularity and credibility of websites. It allows Google to surface more relevant content in search results. By assessing the number of links on pages and their quality, PageRank estimates how much time a random surfer would spend on them.
  2. By getting your website linked to other reputable domains, you increase your PageRank score and your chances of ranking high.
  3. For every page within your domain to rank high, you should also take care of proper internal linking to improve your internal PageRank flow.
  4. Google penalizes attempts to manipulate PageRank with unnatural links. Remember to correctly mark your links with nofollow, sponsored, and UGC tags to avoid traffic loss.