Истинный пункт назначения — Демистификация сбивающего с толку, но часто точного, истинного URL-адреса назначения для перенаправлений в отчетах о покрытии Google Search Console.

Опубликовано: 2022-11-03
Эл. адрес

Если вас смущает, когда Google сообщает о перенаправлениях как о других категориях, таких как «заблокировано robots.txt», «мягкие 404», «не проиндексировано», «404» и другие, это может быть Google, молча отслеживающий перенаправление и сообщающий о статусе истинный URL назначения вместо этого. В моем посте подробно рассматривается ситуация и приводятся примеры того, как это происходит в дикой природе.

Тщательно анализируя веб-сайты с точки зрения SEO, вы, несомненно, окажетесь глубоко в отчетах Google Search Console (GSC). GSC содержит множество данных непосредственно от Google и может помочь владельцам сайтов и специалистам по поисковой оптимизации получить ключевую информацию. Тем не менее, важно понимать нюансы, связанные с отчетами GSC, и то, как Google определяет информацию, которую он предоставляет в этих отчетах. Четкое понимание того, что показывают данные, важно при принятии мер по улучшению SEO.

И нет лучшего примера путаницы в данных GSC, чем ужасный истинный URL-адрес назначения для перенаправлений в отчетах GSC о покрытии индекса (и инструменте проверки URL-адресов). Я получил так много вопросов по этому поводу от клиентов, что решил написать этот пост, чтобы я мог просто указывать людям здесь, а не объяснять это снова и снова.

Итак, присоединяйтесь ко мне в приключении GSC, где мы раскрываем секреты истинного целевого URL. Некоторые из вас, возможно, уже знают об этом, но я знаю, что некоторые этого не знают. А для тех, кто этого не делает, все это очень скоро обретет смысл. Возможно, вам не понравится, как это работает, но, по крайней мере, вы поймете, почему URL-адреса классифицируются определенным образом в GSC (и с помощью инструмента проверки URL-адресов).

Какова ужасная ситуация с истинным URL-адресом назначения в GSC для перенаправления?
При просмотре статуса индексации в GSC URL-адресов, которые перенаправляются, Google сообщает об истинном URL-адресе назначения (даже если этот URL-адрес находится за пределами вашего собственного сайта). Например, если вы перенаправляете URL-адрес на другой URL-адрес, и этот URL-адрес по какой-либо причине не индексируется, GSC будет молча следовать за перенаправлением и сообщать о статусе конечного пункта назначения. И это может сбивать с толку владельцев сайтов и SEO-специалистов, которые не знают, что это происходит.

Да, это означает, что вы можете видеть URL-адреса, отображаемые как «заблокированные robots.txt», «неиндексированные», «мягкие 404», «404» и т. д. (когда проверяемый вами URL-адрес фактически перенаправляет). Как вы можете себе представить, многие владельцы сайтов приходят в замешательство, когда видят «заблокировано robots.txt», когда они на 100% знают, что URL-адрес перенаправляет.

Джона Мюллера из Google спрашивали об этом много раз, и он ответил так, как я объяснил выше (и признает, что это может быть немного запутанным). Кроме того, Барри написал сообщение о том, как это происходит с инструментом проверки URL, на основе комментариев Джона. Несмотря на то, что это было задокументировано, я считаю, что это все еще очень запутанная ситуация для многих владельцев сайтов и SEO-специалистов (именно поэтому я пишу этот пост).

Вот мой твит со ссылкой на Джона, объясняющего, как Google молча следует перенаправлениям (и как это отображается в GSC):

Теперь, когда вы знаете, что это происходит, вам может быть интересно, как это на самом деле выглядит в GSC. Далее я расскажу об этом на примерах того, что происходит в дикой природе.

Примеры того, как Google незаметно отслеживает перенаправления и сообщает истинный статус целевого URL в GSC:
Ниже я приведу примеры со снимками экрана, в которых Google сообщает об истинных URL-адресах назначения по сравнению с переадресацией. Опять же, это когда конечные URL-адреса назначения по какой-то причине не индексируются.

Заблокировано robots.txt:
URL-адрес перенаправляется за пределы сайта на URL-адрес, заблокированный файлом robots.txt. Google сообщает, что URL-адрес перенаправления «заблокирован robots.txt», поскольку конечный пункт назначения фактически запрещен.

Изюминка заблокированного robots.txt:
Этот URL-адрес сначала перенаправляет на URL-адрес отслеживания, который заблокирован robots.txt. Конечный пункт назначения не заблокирован, но Google не может выполнить первое перенаправление, чтобы найти URL конечного пункта назначения, поскольку он запрещен. Он просто знает, что первый URL в цепочке заблокирован, и сообщает об этом в GSC. Ниже вы можете видеть, что второй шаг показывает, что URL-адрес фактически заблокирован robots.txt (и это то, что сообщается в GSC).

Софт 404:
URL-адрес перенаправляет на страницу с ошибкой 404 (продукт недоступен). Google сообщает, что URL-адрес перенаправления является программным 404 (поскольку истинный URL-адрес назначения рассматривается как программный 404).

Вот страница, на которую перенаправляет URL (с продуктом «в настоящее время недоступен»). Отсюда и софт 404:

Без индекса:
Ага, вы угадали. URL-адрес перенаправляет на страницу, которая не проиндексирована. Google сообщает, что URL-адрес, который перенаправляет, как неиндексированный в отчетах о покрытии:

Просканировано, не проиндексировано:
На первый взгляд может показаться, что перенаправление сообщается как «Просканировано, не проиндексировано». Не правда! Это конечный целевой URL, который не индексируется Google. Google сообщает «Просканировано, не проиндексировано» для истинного целевого URL.

Конечный URL-адрес назначения действительно не проиндексирован:

404:
Как Google может увидеть перенаправление как 404? Это не так. Это истинный URL-адрес назначения с ошибкой 404, и это то, что сообщается в GSC.

404 со сменой доменного имени:
Это просто вариант ситуации 404, чтобы объяснить, как это работает при смене доменных имен. URL-адрес старого домена перенаправляется на URL-адрес нового доменного имени, но URL-адрес никогда не переносился (это 404s). Итак, Google сообщает, что URL-адрес перенаправления — 404.

Извините, больше путаницы с перенаправлениями:
Когда URL-адрес перенаправляет на страницу, которая разрешается с кодом ответа заголовка 200 и индексируется, инструмент проверки URL-адресов точно сообщает о перенаправлении (и говорит, что первоначальный URL-адрес является перенаправлением и не проиндексирован), но Google показывает канонический как истинный URL-адрес назначения (куда ведет перенаправление). Разговор о путанице, особенно на основе всего, что я объяснил выше с другими примерами, где URL-адреса перенаправления сообщаются как нечто отличное от перенаправления…

Возможное решение в GSC для устранения путаницы:
Итак, как это может быть более интуитивным? Я думаю, что если бы GSC действительно предоставил сообщение о том, что он сообщает об истинном URL-адресе назначения, это могло бы устранить путаницу для владельцев сайтов и SEO-специалистов. Ниже я смоделировал, как это может выглядеть в GSC. Если Даниэль Вайсберг читает (и я надеюсь, что вы читаете), добавьте это!

Резюме: Устранение путаницы с перенаправлениями и отчетами по целевым URL.
Я надеюсь, что этот пост помог вам понять, как Google незаметно отслеживает перенаправления и сообщает истинные URL-адреса назначения в GSC. Я знаю, что это запутанная тема для многих владельцев сайтов и SEO-специалистов, и я уверен, что это привело ко многим головокружительным моментам. Просто имейте в виду, что на данный момент GSC сообщает об истинных URL-адресах назначения, когда URL-адрес перенаправляется. Так что не удивляйтесь, если заметите перенаправления в других категориях в отчетах о покрытии GSC (или при использовании инструмента проверки URL). И кто знает, может быть, команда разработчиков GSC воплотит в жизнь то сообщение, которое я смоделировал выше…

ГАРАНТИРОВАННАЯ ПОБЕДА