Транскрипция подкаста SNYCU с Мари и Джоном Мюллерами

Опубликовано: 2020-06-03

Подкаст SNYCU с Мари и Джоном Мюллерами

Транскрипция подкаста MHC SNYCU с участием Джона Мюллера из Google от 3 июня 2020 года. Полный выпуск можно прослушать здесь.

Если вы хотите подписаться, вы можете найти подкасты здесь:
iTunes | Спотифай | Гугл игры

Или смотрите здесь:

M: Итак, добро пожаловать в очень специальный выпуск Search News You Can Use, и я доктор Мари Хейнс, и у меня есть мой первый гость на подкасте; Джон Мюллер из Google. Добро пожаловать, Джон.

Дж.: Приятно быть здесь, Мари.

М 0:15 – Итак, Джон, скажи мне – я думаю, мы все знаем, что ты работаешь аналитиком трендов для веб-мастеров в Google. Как долго ты работаешь в Google?

Д 0:23 - О боже, что это... 12 или 13 лет, что-то в этом роде.

М 0:30 - Правда? Итак, мое первое знакомство с SEO произошло на… вы помните чат-форумы по SEO? Я не знаю, был ли ты частью этого, но это было где-то в 2008 году. А потом в какой-то момент я начал смотреть ваши видеовстречи в Google Help. Вы запустили их вскоре после того, как присоединились к Google?

Д 0:57 - Давай посмотрим. Я не знаю, когда именно мы это начали. Я думаю, что это произошло в значительной степени, когда появился Google Plus, поэтому, как только вся установка была готова, и мы могли проводить эти публичные видеовстречи и приглашать людей присоединиться, все это, тогда мы начали делать это, чтобы попробовать их, чтобы увидеть, что работает, а что нет.

М 1:29 - Попался. Итак, прежде всего, я хочу поблагодарить вас, я имею в виду от всего SEO-сообщества, за то, что вы сделали все возможное за эти годы, и я не знаю, как вы это делаете. Я собирался начать с нашего первого вопроса о папках и поддоменах, или вы знаете, но я не, я не. Вы так много об этом рассказали, и поэтому я не могу себе представить, на что это похоже, поскольку каждое слово, которое вы говорите, мы, сообщество SEO, хватаемся за него и говорим: «Ну, это то, что говорит Google», и это должно быть очень трудно иметь каждое ваше слово проанализировано, и вот снова! Мы собираемся задать вам кучу вопросов для анализа. Я думаю, мы сразу приступим к вопросам и посмотрим, что из этого выйдет. В любой момент, если вы захотите вскочить и что-то сказать, все, что вы хотите сказать, будет очень полезным. Я хочу начать с забавного вопроса и спросить вас, а что там с бананами и сыром?

J 2:28 — Бананы и сыр.. Ну, я думаю, что сыр — это очевидно, как в Швейцарии, где много сыра, так что, я не знаю, это вроде как легкая часть. Я думаю, что все началось с одного твита с моего аккаунта «Я люблю Сыр». Этот твит на самом деле был сделан Гэри, так что это не моя вина. Я не знаю. Я пошел выпить кофе, а Гэри сказал: «О, твиттер открыт», поэтому он пошел и попытался что-то опубликовать. Вероятно, пытался найти что-то, что не привело бы его к увольнению.

М: Могло быть намного хуже, да.

J: И Бананы, это более случайно, потому что я искал что-то, что можно попробовать с Google Trends, и Бананы были просто первым словом, которое пришло мне на ум, и я начал получать все эти электронные письма, такие как Google Trends для бананов. вниз, это было похоже на «Хорошо».

М: Это фантастика. Итак, вы все еще получаете электронные письма о тенденциях бананов?

Дж: Да, да.

М 3:52 Мы придумали наши вопросы так: у нас есть целая команда, которая работает на меня, и моя команда на самом деле тренируется на ваших видеовстречах о помощи, поэтому они смотрят их, и вы знаете, что что-то произойдет, и вы знаете, что вы говорить о каноническом теге и моей команде, мои новые стажеры скажут: «Ну, что это такое» и начнут говорить об этих вещах. И поэтому многие члены моей команды задавали вопросы, и некоторые из моих слушателей моего подкаста тоже задавали вопросы. Давайте поговорим о nofollow, и в прошлом году Google объявил, что грядут некоторые изменения в том, как вы можете использовать nofollow. Я полагаю, что в то время вы дали нам rel=sponsored и rel=ugc. Я чувствую, что есть небольшая путаница в том, как Google может использовать nofollow-ссылки, и часть путаницы заключается в том, что люди часто спрашивают меня, указал ли кто-то на меня спам-ссылки в попытке отрицательного SEO, например, спам в комментариях и ссылки типа это, и все они являются ссылками nofollow. Могут ли эти nofollow-ссылки когда-либо использоваться в качестве сигналов для Google?

Д 5:02 — Ну, мы не используем их в негативном смысле. Так что если мы можем использовать их для обнаружения какого-то нового контента, то я считаю, что мы пытаемся это использовать, но это не тот случай, когда мы говорим, что это обычные ссылки в Интернете, поэтому мы будем учитывать их в полном объеме и если это плохие ссылки в Интернете, то они будут учитываться против вас и тому подобное. Так что, если это ссылки, которые вы не хотите ассоциировать с вашим сайтом, и они с nofollow, то это совершенно нормально. Я думаю, что многие объявления в Интернете также имеют nofollow, это то, что мы не рассматриваем как платную ссылку только потому, что теперь мы немного лучше понимаем ссылки nofollow.

М 5:44 - В этом есть смысл. Так что я думаю, что одна из проблем - вопрос, который многие люди задавали мне, заключается в том, должны ли они дезавуировать, потому что существует огромное количество ссылок nofollow, тогда вы знаете, масштаб может что-то подсказать, и мы всегда утверждали, что есть нет смысла дезавуировать ссылку nofollow, потому что весь смысл дезавуирования заключается в том, чтобы сказать Google: «Я не хочу передавать эти сигналы», поэтому я думаю, что это имеет смысл, верно? Мы на правильном пути?

Дж 6:11 — Да, не нужно их дезавуировать.

М 6:15 - Это вопрос, о котором мы говорили. На самом деле, в первый и единственный раз, когда мы встретились лично, в Нью-Йорке в офисе Google, я бы хотел, чтобы мы просто пересмотрели его, потому что я думаю, что существует так много путаницы в отношении того, кто должен использовать инструмент дезавуирования. Итак, главный вопрос заключается в том, что мы знаем, что инструмент дезавуирования существует, если у вас есть ручное действие, и мы пытаемся удалить неестественные ссылки, а те, которые мы не можем удалить, мы помещаем их в инструмент дезавуирования. То, о чем мы говорили ранее, заключается в том, есть ли причина для сайта, на котором нет ручного действия, использовать инструмент отклонения. Итак, давайте начнем с этого, пожалуй

J 7:00 – Я думаю, есть два случая, когда имеет смысл использовать инструмент дезавуирования. С одной стороны, когда вы смотрите на ссылки на свой сайт, вы почти уверены, что получите ручное действие. Так, например, если предыдущая поисковая оптимизация делала всевозможные странные вещи в отношении ссылок на ваш сайт, если они не покупали ссылки, не размещали гостевые посты, вроде всех обычных вещей, о которых мы бы сказали, что это противоречит руководящие принципы, и если вы еще не получили ручное действие для этого, то это то, где, если вы зайдете и посмотрите на такой сайт, и вы увидите все это, то это похоже на то, что вы хотели бы заранее очистить. Так что, по сути, действия, которые вы будете выполнять, когда получите ручное действие, как бы сделайте это заблаговременно, чтобы вы даже не вникали во всю эту проблему ручного действия. И это то, где время от времени я сталкиваюсь с такими людьми, которые, возможно, приходят в одну из тусовок в рабочее время или пишут в Твиттере или на справочных форумах, где, если вы посмотрите на эти ссылки, вы можете сказать хорошо, что они делали много вещей, которые они, вероятно, не должны были делать, и неясно, сделали ли они это сами или наняли для этого SEO-специалиста, это не имеет большого значения, и, возможно, у них нет ручное действие, но вы предполагаете, что если команда веб-спама наткнется на этот сайт, они, вероятно, примут меры. Так что я бы сказал, что вы можете позаботиться об этом сами с дезавуированием, очистив ссылки настолько, насколько сможете, это, я думаю, очевидно. Другой больше похож на то, что если вы действительно не уверены, что сделают алгоритмы Google, потому что мы действительно пытаемся игнорировать спам-ссылки, мы пытаемся игнорировать случайные ссылки, которые сбрасываются на форумах, которые иногда просто автоматически сбросил все виды мест. И если вы действительно не уверены, будут ли алгоритмы Google их игнорировать, вы можете просто поместить их в файл отклонения и сказать: ну, я сделал все, что мог, по крайней мере, мне не нужно об этом беспокоиться.

М 9:26 - Отречение - это предотвращение ручного действия. Это имеет смысл, верно? Если мы посмотрим на ссылочный профиль, который явно противоречит рекомендациям Google, и скажем: «Боже мой, если бы команда по борьбе со спамом посмотрела на это так, это было бы страшно, нам, вероятно, следует дезавуировать». Я думаю, путаница заключается в том, что вы упомянули об алгоритмах Google, и я понимаю, что есть некоторые вещи, которыми вы не можете поделиться по очевидным причинам. У нас были случаи, когда мы действительно чувствовали, что подали отказ, на сайте не было ручных действий, а затем в какой-то момент, либо через несколько недель, либо через пару месяцев, сайт начал видеть увеличение трафика, и наши Мы думали, как мы говорили в Нью-Йорке, что алгоритмы Google могут меньше доверять своему ссылочному профилю, а дезавуирование как бы улучшило это доверие и увидело преимущества. Итак, я думаю, что главное, и снова я могу понять, если вы не можете ответить на этот вопрос, поэтому мы знаем, что можем превентивно дезавуировать, чтобы предотвратить ручное действие, но можем ли мы увидеть улучшения в рейтинге Google, трафик Google от дезавуирования, даже если они не не имеют ручного действия.

Д 10:47 — Я думаю, это было бы очень редко. Таким образом, я теоретически мог бы представить ситуацию, когда наши алгоритмы действительно расстроены ссылками на сайт, и, отклонив их, вы можете это исправить, но по сути это будет ситуация, очень похожая на ситуацию, когда член команды по борьбе со спамом просматривает сайт. Так что только потому, что там есть несколько случайных ссылок, и вы как бы убираете вещи и сосредотачиваетесь на ссылках, которые, как вы знаете, хороши, я бы не ожидал увидеть каких-либо изменений в видимости сайта в поиске из-за чего-то. как это. Итак, я предполагаю, что вы, скорее всего, видите эффекты других вещей, которые происходят в поиске, которые могут быть обновлениями алгоритма, может быть, изменениями в экосистеме в целом, все обычные вещи, которые могут возрасти. и вниз в поисках.

М 11:38 - В этом есть смысл. В SEO всегда сложно что-то тестировать, верно? Поскольку что-то мы изменили сегодня, мы не собираемся вносить никаких изменений завтра или до конца месяца или что-то в этом роде. Я хотел бы спросить вас кое о чем — у нас сейчас есть случай, когда мы имеем дело с ручным действием для клиента, который начал использовать ручные действия для неестественных ссылок, и я вспоминаю, когда я впервые начал помогать людям с неестественные ссылки, было очень легко увидеть эти каталоги со спамом и PageRank R US или что-то в этом роде, это было очень очевидно. И мне кажется, что типы неестественных ссылок, которые сейчас вызывают ручные действия, на самом деле могут сдвинуть с места сайты. Это те, которые работали, но алгоритмы Google не обрабатывали их или что-то в этом роде, поэтому команда по борьбе с веб-спамом приняла меры вручную. Этот конкретный наш клиент, большинство ссылок, которые они сделали, находятся в статьях. И они есть в статьях в относительно авторитетных местах, таких как места, как будто они не являются ультраспамовыми статьями, и мы можем видеть, когда смотрим на них, что они явно созданы для SEO, но это статьи, которые люди будут читать. И одна из проблем, с которыми мы сталкиваемся при общении с этим клиентом, заключается в том, что они все еще очень хорошо ранжируются по своим основным ключевым словам. Итак, мы пришли и сказали: «Посмотрите, это список из сотен ссылок, которые, как мы знаем, вы сделали для SEO, у вас есть ручное действие, и мы хотим, чтобы вы начали удалять их или дезавуировать, если вы не можете», и они говоря: «Ну, мы ранжируем по всем этим терминам, зачем нам это делать?». Есть ли у вас какие-либо мысли по этому поводу, есть ли какие-либо советы, которые вы можете дать нам в этой ситуации?

J 13:20 - По сути, это гостевые посты, в которых, если они создают статьи и включают в них ссылку на свой сайт, тогда команда по борьбе с веб-спамом говорит: «Ну, это снова противоречит нашим правилам». Что касается того, что они все еще ранжируются по этим ключевым словам, мне трудно сказать. Я имею в виду, что я не знаю ситуацию там, но это то, где, если есть ручное действие, мой общий совет всегда будет заключаться в том, чтобы попытаться максимально очистить это, а не оставлять его там, потому что это неплохо. достаточно, типа того. Так что это то место, где я бы попытался очистить, если вы видите, что люди читают эти статьи, переходят на ваш сайт, а затем помещают nofollow на эти ссылки, и это так же полезно для трафика на ваш сайт и на в то же время это действительно помогает показать команде веб-спама, что хорошо, вы действительно понимаете, что это проблематично, вы ставите nofollow там, вы помещаете их в дезавуирование там, где вы не можете этого сделать, и помогаете им сказать: «Хорошо, мы можем позволить этот сайт будет совершенно естественным в поиске».

М 14:36 ​​- Хорошо, и я думаю, что иногда это своего рода борьба; сайт, который имеет несколько довольно хороших естественных ссылок в сочетании с сайтом, который сделал «ссылочное строительство высокого уровня», построение ссылок известными вам способами, некоторые из них хороши. Не всегда неправильно просить ссылку, это совершенно нормально, но масштаб может быть сложным, например, может быть хорошо, когда у вас было пять таких ссылок, но теперь, когда у вас есть 500, это не так хорошо. Одна из вещей, которая сбивает с толку многих людей, заключается в том, что когда мы смотрим на рекомендации Google по схемам ссылок, они немного расплывчаты в отношении ссылок в статьях. Так что в рекомендациях говорится о «крупномасштабных кампаниях по маркетингу статей или гостевых постов с ключевыми текстовыми ссылками», и в наши дни часто обнаруживается, что эти ручные действия, которые мы получаем, примеры ссылок, которые Google отправляет нам, не всегда являются ключевыми словами. якорь, и я думаю, что многим людям непонятно, что неестественная ссылка может быть неестественной, если якорь не является ключевым словом, верно?

J 15:46 - Верно, я имею в виду, что в конечном счете ссылка есть ссылка, она может передавать сигналы на другой сайт, и это то, за чем следит команда веб-спама.

M 15:57 — Хорошо, да, поэтому мы всегда пытаемся указать — мы называем это неестественным, потому что схемы ссылок Google говорят об этом, и большинство ссылок, которые мы получаем в эти дни в качестве примеров ссылок, — это ссылки в статьях. Это не обязательно гостевые посты. Они: «Эй, я написал этот контент, вам нужен контент, поэтому позвольте мне дать его вам». Здесь нет денег, и, кстати, там есть ссылка на мой сайт». Так это неестественно, да?

Д 16:25 - Да

М: Да, хорошо. Я думаю, что с этим борются многие SEO-компании; «пока мы не используем привязки ключевых слов, у нас все хорошо», и я чувствую, что это риск.

М 16:38 - Мы уйдем от ручных действий через минуту, но у нас действительно было много вопросов по этому поводу. Можете ли вы сказать нам, была ли задержка реагирования на ручные действия из-за пандемии?

J 16:51 - Я не так много знаю о задержке, но она была намного медленнее, чем обычно

M: Мы получили несколько ответов, вы знаете, вы вернулись на правильный путь?

Дж.: Итак, вчера некоторые люди из команды веб-спама дважды проверили, чтобы убедиться, что я не говорю ничего сумасшедшего, и похоже, что они в значительной степени на правильном пути. Я имею в виду, что всегда требуется определенное время, чтобы просмотреть их вручную, и по большей части мы пытаемся просмотреть их вручную и попытаться сделать этот процесс немного быстрее. Единственное, что делает команда веб-спама, пытается найти способы автоматизировать это. Так что, в частности, если сайт взломан, то это то, где мы можем как бы автоматически попытаться выяснить, взломан ли сайт по-прежнему после запроса на пересмотр, и если наши алгоритмы уверены, что это решено, тогда мы можем просто оставить это. И это высвобождает некоторое время для остальной части команды ручных действий, работающей с очередями, которые они получают.

М 18:00 - В этом есть смысл. Вы можете сказать нам? Я знаю, что вы упомянули, что все ручные действия проверяются людьми. И это имеет смысл для ситуаций взлома, когда вы можете использовать машину для этого. Можете ли вы рассказать нам что-нибудь о процессе проверки? Проверяет ли действия, предпринятые вручную, член команды по борьбе со спамом? Это двухэтапный процесс, когда кто-то видит что-то вроде «Они делают здесь какие-то шаги, давайте передадим это старшему участнику». Есть ли что-нибудь, чем вы можете поделиться с нами об этом?

Дж 18:34 — Это зависит от размера и сложности вопроса. Поэтому, если есть что-то, что влияет на большую часть Интернета, если это что-то особенно сложное, что-то пограничное, и это зависит от того, как вы на это смотрите, то это та ситуация, когда команда веб-спама часто привлекает других людей, чтобы попытайтесь получить второе мнение для этого. И я думаю, что в целом это имеет смысл. Это также то, что мы пытаемся сделать, если поступает второй запрос на пересмотр, что не всегда один и тот же человек просматривает один и тот же сайт, ну, они не сильно изменились. Принимая во внимание, что если бы кто-то другой смотрел на это, то они могли бы сказать, что на самом деле хорошо, этого достаточно в отношении того, что мы ожидаем от них. Иногда бывает сложно провести эту линию, потому что, когда вы смотрите на нее вручную, определенно есть некоторые вещи, где это четкая линия, мы можем сказать, что все, что выше этого, должно быть принято, а все, что ниже этого, отвергается. А вот кейсов много, например со ссылками или с некачественным контентом, и вроде можно сказать хорошо они проделали значительный объем работы, но как это посчитать. Нельзя сказать, что они сделали 17% от того, что должны были. как вы не можете придумать номер.

М 19:57 — Я чувствую, что мы говорим нашим клиентам, что цель состоит в том, чтобы убедить команду веб-спама, что вы понимаете проблему и что вы двигаетесь дальше, вы знаете, что делаете не то же самое. Иногда это может быть сложно, особенно для тех сайтов, которые имеют реальную смесь «ну, это было из-за этих усилий по SEO, и эти усилия по SEO, возможно, мы зашли слишком далеко», и иногда может быть очень сложно удалить эти вещи. Но я говорил людям, что иногда это хорошо, потому что тогда вы знаете, что это проблемы, вы знаете, что вам нужно двигаться вперед и переходить к лучшим способам получения ссылок или чего-то еще.

M 20:35 — Мы перейдем к другой интересной теме — тонкому контенту, над которым мы работали в качестве оптимизаторов на протяжении многих лет. Я собираюсь зачитать этот вопрос, потому что я считаю, что он исходил от моей команды. «В прошлом вы упомянули, что когда Google оценивает качество сайта, они учитывают все проиндексированные страницы. Есть большой сайт с более чем 100 000 проиндексированных страниц, и со временем многие из этих страниц становятся неактуальными или уже тонкими. Не будет ли индексация или перенаправление для уменьшения количества страниц повышать восприятие Google качества и способствовать повышению рейтинга, опять же при неизменном UX».

J 21:18 — Да, я думаю, что я часто вижу в такого рода вопросах то, что люди иногда видят, что все страницы равны, тогда как с нашей точки зрения, вещи очень разные в отношении того, насколько важна страница для сайт. Так что это то, где действительно трудно сказать хорошо, вы удалили 1000 страниц, поэтому остальные 90 000 страниц в порядке. Например, у вас есть концертная площадка или какое-то место для проведения мероприятий, и предполагается, что все вернутся на концерты, что, я уверен, когда-нибудь произойдет, но у вас может быть этот сайт и какой-нибудь действительно известный артист, у вас есть действительно хороший контент о концертах, и у вас есть календарь событий, где вы можете перейти к 9999 году, и большинство этих дней будут пустыми. Глядя на что-то подобное, у вас могут быть сотни тысяч действительно пустых страниц и несколько действительно хороших страниц, и только потому, что у вас есть сотни тысяч низкокачественных, тонких страниц, не обязательно означает, что 90% вашего веб-сайта плохо, и вы должны очистить это. Потому что с нашей стороны произойдет то, что мы попытаемся выяснить, какие страницы являются наиболее важными, и постараемся сосредоточиться на них. И это, вероятно, текущие концерты или что там происходит. И даже если у вас есть все эти другие страницы с тонким контентом, это не обязательно означает, что ваш веб-сайт усреднен до чего-то посредственного. Так что с этой точки зрения не имеет смысла смотреть на абсолютные** цифры, а только на то, какой контент важен для вашего сайта и действительно ли этот контент высокого качества.

M 23:13 - Хорошо, это действительно интересно, потому что мы всегда утверждали, что сайт имеет... Скажем, их CMS создает страницы со случайными изображениями, и они попадают в индекс... Так что Google должен просто игнорировать их с точки зрения качества для сайт. Это не похоже на удаление, скажем, 90% индексных страниц, которые были случайными страницами, которые не должны были попасть в индекс. Может ли удаление их из индекса улучшить оценку Google качества остальной части вашего сайта?

Д 23:44 - Не знаю. Много раз - например, если бы это было что-то, что мы бы уже игнорировали, тогда я не думаю, что это имело бы какое-то значение. Основное отличие, которое будет иметь место, касается сканирования веб-сайта и возможности находить новый и обновленный контент немного быстрее, где, если мы застрянем в бесконечном календаре, мы уйдем и проведем там много времени, потому что Googlebot очень терпелив, но это не тот контент, который вам действительно нужен для сканирования вашего сайта. Так что это своего рода, я думаю, основная часть там. Я думаю, что есть место для этой золотой середины, не обязательно абсолютно бесполезных вещей, а какой-то золотой середины, когда вы видите, что это страницы, которые получают много трафика из поиска, но когда я смотрю на них, они действительно страницы, о которых я не хочу быть известным. Как будто я понимаю, что алгоритмы Google думают, что это важные страницы, но на самом деле они не важны для меня. И если вы находитесь в такой ситуации, то это ситуация, когда вы можете принять меры. Так что не обязательно смотреть на абсолютное количество страниц, которые у вас есть, но это страницы, которые получают трафик из поиска, и именно на них я хочу, чтобы Google сосредоточился, поэтому я постараюсь избавиться от вещей, которые, возможно, менее важны. чтобы улучшить их, что-то в этом роде.

М 25:08 — Как насчет ситуации, когда веб-сайт меньшего размера, например… Я имею в виду, что много лет назад компаниям было сказано вести блоги каждый день, и есть много людей, которые ведут блоги очень низкого качества, потому что они типа «вот мой кофе сегодня, вот бананы, и Джон получил предупреждение об этом и вещах, которые, возможно, не должны быть в индексе. И затем, скажем так, начиная с этого года, я как бы включился в игру и сказал, что все, что я размещаю в своем блоге, должно быть лучшим в своем роде. Может ли это улучшить оценку Google качества моего блога в целом, если я вернусь и не проиндексирую некоторые из тех сообщений в блоге, которые никому не интересны, или Google просто помнит об этом и просто сосредоточится на новых вещах?

Д 25:52 – Я не думаю, что это будет иметь существенное значение, особенно если у вас есть значительная часть действительно хорошего контента, если вы начинаете размещать там новый контент. Тогда я не думаю, что отсутствие индексации старого контента будет иметь большое значение. Но подобно газетному сайту, где вы размещаете, может быть, 20 статей в день и 19 из этих статей, которые через неделю станут неактуальны, это не означает, что эти 19 статей автоматически являются вещами, которые вы не должны индексировать в какой-то момент. но, возможно, переместите их в раздел архива, где они менее сочувствуют пользователям и поиску, но вы все равно можете их сохранить. Мы не говорим, что это что-то плохое и от этого нужно избавиться или убрать.

М 26:40 - Хорошо, это логично. Можете ли вы дать нам какие-либо советы о том, как Google оценивает качество того, какие типы контента можно считать высококачественными. Использует ли Google сейчас BERT, чтобы лучше понять, хорош ли контент?

Д 27:00 — Так что я не очень хорошо понимаю, как мы определяем, когда вещи являются высококачественным контентом, но я думаю, что люди иногда сбиваются с толку в отношении BERT, алгоритмов BERT, всего эти вещи. По сути, это алгоритмы для лучшего понимания контента. Это не столько для того, чтобы понять качество контента, сколько для того, чтобы понять, о чем этот контент, о чем это предложение, о чем этот запрос, чтобы выяснить, какие различные сущности могут быть здесь задействованы и как они работают. привязан сюда. Такое пересечение со стороны качества контента происходит, когда вы пишете таким образом, что, по сути, невозможно понять, что вы пытаетесь сказать. И это та ситуация, когда алгоритмы BERT скажут хорошо, я действительно не знаю, что они пытаются сказать, и дело не столько в том, что алгоритм BERT делает предположение, что это контент низкого качества, это больше похоже на то, что я просто не знаю, что с этим делать. И иногда я подозреваю... Я не видел этого из первых рук и не пробовал его на каких-либо страницах, но я подозреваю, что некоторые из старых школьных SEO-текстов падают туда, где вы просто меняете местами все синонимы, которые вы возможно, можно добавить к предложению, и как человек, когда вы читаете, что вы как будто это просто совершенно чрезмерно, и я могу представить, что наши алгоритмы вроде хорошо, это не читается как настоящее предложение, я не вполне знаю, что подчеркнуть. Например, это действительно об этом предмете или о другом предмете, например, что является основным элементом в этом предложении или этом абзаце.

М 28:54 — И это можно рассматривать как негатив? Например, если у нас есть сайт электронной коммерции со страницей продукта, которую вы часто видите внизу страницы — мы называем это SEO-копией, вы знаете, она написана для поисковых систем и представляет собой просто большой блок текста, содержащий куча ключевых слов, и ни один человек никогда не прочитает это. Таким образом, я думаю о том, что BERT пытается выяснить, соответствует ли этот запрос этой странице, может быть, BERT просто борется и говорит, что это не относится к делу или что-то в этом роде. Или может Google воспринять это как негатив, сказав: «О, эта страница выглядит так, как будто она была оптимизирована для SEO, эти ключевые слова здесь для Google и наносят реальный ущерб странице».

Д 29:41. Я видел несколько случаев, когда это происходило, но обычно это было связано с нагромождением ключевых слов. Таким образом, они не столько пишут статью в Википедии на эту тему и помещают ее внизу страницы обуви, сколько просто добавляют тысячи вариантов одних и тех же ключевых слов на страницу, а затем наш алгоритм наполнения ключевыми словами может вмешайтесь и скажите, что на самом деле это похоже на наполнение ключевыми словами, возможно, нам следует быть более осторожными в отношении того, как мы ранжируем эту отдельную страницу. Так что дело не в том, что BERT запутался, и поэтому наши алгоритмы запутались, и мы скажем, что страница плохая, потому что наши алгоритмы всегда запутались, в Интернете всегда есть что-то, что сбивает с толку, поэтому было бы плохо говорить это только потому, что что-то сбивает с толку, это низкое качество. Но я думаю, что в отношении BERT одна из вещей, которую можно было бы сделать, потому что многие из этих алгоритмов имеют открытый исходный код, вокруг них много документации и справочных материалов, - это попробовать что-то и взять некоторые из этих SEO. текст и бросить его в один из этих алгоритмов и посмотреть, извлекается ли основной контент, могут ли сущности распознаваться правильно, и это не один к одному то же самое, что и мы, потому что я почти уверен, что наши алгоритмы основанный на схожих идеях, но, вероятно, настроенный по-разному, но это может дать вам некоторое представление о том, написано ли это таким образом, что на самом деле это слишком запутанно для системы, чтобы понять, о чем они пишут.

М 31:25 — Итак, вы говорите, возьмите текст, поместите его в процессор естественного языка и посмотрите, сможет ли инструмент понять «о, эта страница об этом», а если нет, то, возможно, нам нужно переписать его, потому что если инструмент не может понять это, как люди, вероятно, находят это скучным или не хотят его читать?

Д 31:41 – Я не думаю, что это было бы осуществимо изо дня в день, но может быть интересным экспериментом просто взять некоторые из этих старых текстов SEO и добавить их в эти современные алгоритмы, и посмотреть, получится ли это. все еще выясняю, о чем эта страница и в чем разница, если я перепишу эту статью в Википедии, возможно, в виде сводки из двух предложений, которую может прочитать пользователь, будут ли алгоритмы по-прежнему выяснять, что это об одном и том же?

M 32:16 — Вместо того, чтобы размещать этот SEO-текст в конце страницы электронной коммерции, у вас есть рекомендации? Я имею в виду, что есть некоторые очевидные вещи, которые нужны пользователям, но есть ли определенные вещи, которые были бы полезны с точки зрения того, что Google хотел бы видеть на странице электронной коммерции, которой вы можете поделиться с нами?

Д 32:35 - Трудно сказать. Одна вещь, которую я заметил в разговоре с людьми, занимающимися мобильным индексированием, заключается в том, что когда страницы категорий электронной коммерции не имеют никакого другого контента, кроме ссылок на продукты, нам действительно сложно ранжировать эти страницы. Так что я не говорю, что весь этот текст внизу вашей страницы плохой, но, может быть, 90%, 95% этого текста не нужны, но некоторое количество текста полезно иметь на странице, чтобы мы могли понять, что это за страница. около. И в этот момент вы, вероятно, с таким объемом текста, который пользователь, вероятно, сможет прочитать, а также сможет понять. Так вот, куда я бы направился в этом отношении. Еще одна вещь, в которой я могу представить, что наши алгоритмы иногда путаются, — это когда у них есть список продуктов вверху и, по сути, гигантская статья внизу, когда наши алгоритмы должны выяснить назначение этой страницы. Это что-то, что предназначено для коммерческих целей, или это информационная страница? Какова основная причина существования этой страницы, и я могу представить, что наши алгоритмы иногда сбиваются с толку из-за этого большого фрагмента текста, где мы говорим: «О, это информационная страница об обуви», но я могу сказать, что пользователи пытаются купить обувь, чтобы я не отправил их на эту информационную страницу.

М 34:05 - Хорошо, и это похоже.. Так BERT тоже привык понимать запрос?

Д 34:13. Да, поэтому мы используем эти алгоритмы, чтобы понимать текст, который приходит в ответ на запрос и на сами страницы.

М 34:24 - Хорошо, и я знаю, что на это уже намекали.. Я думаю, это был обыск в Сан-Франциско, я думаю, что Гэри сказал что-то, что заставило меня задуматься об этом. Это большинство результатов поиска. Вы упомянули, что Google хочет определить, кто хочет это купить. Are there a certain amount of spaces, like if Google has figured out oh this is probably a commercial query then we want to rank only sites that seem to be transactional or do you say well let's throw in a couple of informational ones? Or am I just simplifying things too much?

J 35:00 - I think you would see some amount of mixed there naturally where our algorithms tend not to be completely on or off where we say 'well this is clearly commercial in nature' and therefore we would only show commercial pages because we just don't know for sure what it is what the user is searching for. That's something where I think 10-15% of all queries are still new so these are things where even if we wanted to manually classify all these queries and say well this is clearly someone trying to buy shoes, that's something that we would never be able to do because people come and ask us in different ways all the time. So that's something where I suspect our algorithms will try to say 'well probably it's this or very very likely it's this' so we will try to include, in our search results page, I don't know 80% like this and a little bit like that just to cover those other variations.

M 36:08 - Okay that makes sense. Let's have another great subject that's fun to talk about; doorway pages. So sometimes a lot of websites struggle with location pages. So lets say a client came to us and they had a business that serviced 50-100 cities in their radius and what tends to happen is their location pages, they're unique in terms of words but really for the user, they could be all the same page. The services of the business are the same no matter the city. Is it within Google's guidelines for me to have 50 different city pages? Is there a better way to do it?

J 36:56 - A lot of times these tend to go into the doorway direction and tend to end up being low quality. And I'd say the quality aspect is almost a bigger issue there in that you have all of these pages on your site and you say well these are really important for my site but at the same time they're essentially terrible pages. Like you wouldn't be able to send a user there and say like well you're in this city therefore this page mentions your city name and the service that you're looking for so we should show that to you. So that's something where from the point of view I try to discourage that. Obviously if you have locations in individual cities, sometimes you have those addresses on separate pages with separate opening hours, all that. Another option is of course to list those different addresses on a single page, maybe by region with a map, a dynamic map, something like that. But otherwise I think it's really kind of tricky where if you're saying well I don't really have locations in these cities but anyone from any of these cities are welcome to call me up then making individual pages for all of those cities feels kind of tricky. And I realize sometimes these sites rank, sometimes these kind of pages rank well but it is something where I could imagine the search quality team saying well we need to figure out a way to deal with this better.

M 38:39 - Do you give many penalties or manual actions for doorways pages these days? It's been a while since I've seen one.

J: 38:46 - I don't know.

M: Yeah it's been a long time. I'm not saying you should by any means. If all of a sudden people start getting- I think they fell under thin content penalties, it's not my fault if that happens.

M: This is a subscribers question. I'm going to shorten it down because it's a long one but it's about… This person has a site that's YMYL, it competes with major brands and government websites so '.gov' websites. And something that we really noticed lately is that Google, for a lot of YMYL queries are really really favouring authoritative sites. So this person is saying that their content is better, I mean that's subjective, but their content is better, solves the user's query better, great videos, optimized to the fullest and they want to know, and I know this is hard because you haven't seen the site, I haven't seen the site but is it ever possible to outrank a giant authoritative website for a YMYL query.

J 39:53 - Sure, I mean it's possible to outrank these sites. It's not that any of these search results positions are hard coded and they can never change so that's something where I would say that's certainly possible but depending on the topic, depending on the competition, it can get hard so I wouldn't expect that to be something where you can just throw together a website, make some really nice looking pages, have someone rank some really good content for your page and to automatically have that rank above these authoritative sites. Especially on topics where it's kind of important that we make sure we are providing high quality, correct information to people. So technically, it's possible. Waiting it out is something I personally wouldn't recommend in cases like this. Obviously you need to continue working on your site, it's not something where you can just say okay I'll wait til my site is 10 years old then it'll be just as good as these other 10 year old sites. That's not the way it happens, you have to kind of keep at it all the time. And the other thing to keep in mind is that if these are really good websites then generally speaking you'd expect to see some traffic from other sources as well so obviously search is a big source of traffic but there are lots of other places where you can also get traffic and that's something where kind of combining all of that and continuing to work on your website, focusing maybe on other traffic sources if that's something that you can do and kind of growing out from there. But it's not that we would never rank these sites for these kinds of queries but it will be really hard, you have to prove that what you're providing is something of equal quality, equal relevance, equal correctness as maybe an official government website which depending on the government website might be hard, might be a little bit easier, it feels like government websites are generally getting better and better so that competition is not going to get less.

M 42:08 - Yeah I think in the past a lot of the time we'd say oh this .gov site page is ranking but it's horrible so if I can create something better then I can outrank it. Is this connected to EAT? Like let's say I went on a particular type of diet and it worked really well for me and I wanted to create a website about this diet but the people who are ranking on the first page are the mayo clinic and some government authoritative site. Can you give me any tips on what types of things would have to happen. Let's say I was a multimillionaire and I had access to any resource, what would it have to take for me to be able to compete with websites that are of authority like that?

J 43:03 - I don't know. I don't have any magic bullet where you can just say like be on national tv or be listed in wikipedia or something like that. It's really hard to say.

M: Can I get an 'it depends'?

J: It depends, sure. Like even if I knew a specific situation, it wouldn't be something where I'd be able to say oh you just need to tweak this one factor here and buy some gold plated network cables and then you're all set.

M 43:43 - Understandable and that was a bit of an unfair question. I think I ask it because people do that all the time, you know people come to us and say hey I want to dominate this and I've got investors. I think in the past if you had enough money you could buy links that would trick Google so we're trying to essentially tell people like you can't be the biggest authority unless you are the biggest authority and that's a struggle that SEO can't always generally fix.

M 44:14 - We're going to rap it up soon. This was an interesting one. We have a client whose site is used in the quality raters guidelines as an example of a low quality site and it's a screenshot from many years ago. And they've changed, the page is way better now. They wanted me to ask you is there anything they can do to appeal to Google to be taken out because it's not good for their brand. Any thoughts on that?

J 44:43 - I'm happy to pass something on if you have some examples of things like that but in general, the quality rater guidelines are not meant to be absolute in a sense that this particular URL should be rating like this but rather, this kind of problem should be rated like this when it comes to the general quality raters set up where were trying to figure out what are the best algorithms to use with regards to search ranking. So it's not something where I generally say like just because we have that particular site there doesn't mean that people should be watching out for that particular site and then be taking this action but rather.. this is a really obvious example of this one particular case and this is the kind of situation you need to watch out and not this is the exact URL you need to watch out for. I think the alternatives that we could use in a case like that… I mean I'm happy to pass that on..

M 45:48 - In all honesty I mean I hesitated to ask you that question because I don't Google to take away those examples. There is a lot to be learned to what you point out as high quality and potentially low quality so.. But I can see as well, I'd be quite upset if people were using my site as like 'oh Google says your site is low quality', nevermind that was something 10 years ago or whatever but fair enough.

M 46:15 - So John I hear you have your own podcast coming out soon? Tell us about that.

J 46:20 - We're working on it. We started looking into that I think at the beginning of the year. At some point we got all the equipment set up in the office and like ready to go and we recorded the trailer and all that went really well and then the office closed and everything went downhill so that kind of threw a wrench in the gears there. So we've started to pick that up again and I hope we can get the first episode or two out fairly soon. I don't know what the timing is there. But it is something where we thought we'd do something a little bit less formal and provide some human look behind the scenes of what's going on with regards to Google.

M 47:16 - Will it be something where we can ask questions like this sort of thing or is it more of a kind of fun, light..

J 47:23 - I don't know. We'll see how it evolves.

M: And we'll see how challenging it is as we pummel you with questions. I'm looking forward to it, I think it'll be good.

J: It's not meant to be a replacement for the office hangouts so it's not something where it's question, answer, question, answer type of thing but more where we realize people would kind of like to know what actually happens behind the scenes at Google when they make these kind of decisions and that's kind of what we'd like to bring in.

M 47:56 - There was a video that came out years ago of, I think it was Matt Cutts in a search meeting where the whole team was discussing 'well we could do this and it would take longer to load.' That was fascinating. I would love to see more stuff like that, what goes on behind the scenes. Just a thought. Is it going to be video? Or I guess you don't know right now right? Or is it a podcast.

J 48:22 - It's just a podcast.

M 48:24 - Alright was there anything else that you wanted to share with us at this point?

J 48:29 - Nope, it went pretty good.

M 48:31 - John, thank you so much for doing this. I can't tell you how much I appreciate it and thank you for being on twitter and putting up with all of our questions and humour too. Do you know how many times we throw into our slack channel 'oh John' because you're just such a great guy and very helpful. Anyways, I'll stop. I'm going to make you blush so thanks again John and I hope that everything's going okay for you in staying at home and all that. Hope to one day see you. We were supposed to meet again in Munich for SMX and that got cancelled like a week before we were going to be there so one day I'll see you again sometime.

J: It'll happen, don't worry.

M: Take care!

J: Thanks a lot bye.