Проблема дублирования для SEO и как с ней справиться

Опубликовано: 2022-06-03

Допустим, вы отправили письмо, но в том же городе есть еще 50 человек с таким же именем, учитывая, что точного номера дома нет. Куда доставят письмо? Как почтальон узнает, кто из 50 человек является правильным адресатом? Это не только смутит бедного почтальона, но и причинит ему немало страданий.

Теперь, если почтальон — это поисковая система, и существует более одной веб-страницы с одинаковым содержанием, представьте себе ее бедственное положение, когда она пытается выяснить, какую из них ранжировать в результатах поиска. Это то, что вызывает проблему дублирования в SEO. На самом деле 29% страниц из 200 миллионов веб-сканеров имеют дублированный контент.

Дублирование контента — это просто наличие одного и того же контента на нескольких веб-сайтах с разными адресами (или URL-адресами). Дублирование контента не всегда является преднамеренным. Ни один владелец или разработчик веб-сайта не захочет потерять рейтинг в поисковых системах, потому что их контент похож на контент на другом веб-сайте.

Некоторые из распространенных причин двуличия:

  • Скопированные или удаленные страницы

Предположим, вы нашли отличный пост в блоге на веб-сайте и поделились им на своем. Здесь вы копируете этот контент на своем веб-сайте, который не может быть этически или морально неправильным. Но для поисковой системы это означает, что один и тот же контент может находиться в нескольких местах.

Это особенно проблема, с которой сталкиваются веб-сайты электронной коммерции. Товары одного производителя могут продаваться во многих интернет-магазинах, но описание товара у них одинаковое. Здесь только несколько известных магазинов получат бизнес.

Siteliner и Copyscape — два инструмента, которые обычно используются для обнаружения дублирования. В то время как Siteliner проверяет веб-сайт на внутреннее дублирование, Copyscape проверяет содержимое веб-сайта на наличие дублирования с другими веб-сайтами.

  • URL-параметры

Иногда небольшое изменение порядка параметров URL-адреса может привести к дублированию контента. Эти параметры не изменят содержимое страницы. Но для поисковой системы это два разных URL.

Точно так же при совершении покупок в Интернете веб-сайт предоставляет вам идентификатор сеанса, который, по сути, является журналом вашей активности на веб-сайте. Из-за этого многие системы в конечном итоге используют эти идентификаторы сеансов для URL-адресов.

Источник изображения: Моз

На ранжирование веб-сайта в поисковых системах отрицательно влияет, если его URL-адрес имеет несколько параметров. Эти параметры приводят к созданию множества URL-адресов с похожим содержанием, которые могут запутать поисковый робот и повлиять на правильную индексацию веб-сайта. Для Google URL-адреса без параметров имеют лучший рейтинг в поиске.

  • www против страниц без www и HTTP против HTTPs

Есть много сайтов, которые можно найти как по URL-адресам с www, так и без www. У некоторых веб-сайтов есть две версии: одна с http://, а другая с https:// в качестве префиксов. Если обе эти версии веб-сайта работают, они будут индексироваться поисковыми системами отдельно.

Если вы ищете успешную SEO-кампанию, необходимо устранить дублирование. Как вы можете избежать этой проблемы двуличия?

  1. Используйте код 301

Перенаправление — один из лучших способов борьбы с дублированием контента. Перенаправление 301 означает, что страница навсегда переместилась с «дубликата» на «исходную».

Это решит проблему конкуренции между несколькими страницами с небольшим изменением URL. Веб-сайты с префиксом «https://» и «http://» или с префиксом www и без www будут автоматически интегрированы в одно и то же место.

Источник изображения: Моз

  1. Используйте тег «rel canonical»

Тег «rel canonical» — это не что иное, как способ сообщить поисковой системе, что между двумя URL-адресами нет разницы. Этот тег указывает поисковой системе, что страница X является дубликатом исходной страницы Y, и для всех будущих целей ранжирования и содержания следует учитывать страницу Y.

Тег «rel canonical» размещается в заголовке HTML веб-страницы и должен добавляться к каждой копируемой версии веб-страницы.

Источник изображения: HiTechWork

  1. Контролируйте и управляйте своим контентом:

Создавайте уникальный и высококачественный контент для своих веб-страниц, чтобы избежать проблемы дублирования. Если у вас есть описание продукта от производителя, напишите новое и используйте оригинальные изображения, чтобы избежать дублирования с другими сайтами электронной коммерции.

Это отнимает много времени. Но в долгосрочной перспективе важно, чтобы ваш сайт выделялся. Уникальный контент будет автоматически выбран поисковой системой, что повысит рейтинг сайта.

  1. Уменьшите однотипный контент

Чтобы избежать дублирования идентификаторов сеансов, просто отключите их в настройках системы. Для вариантов URL-адресов убедитесь, что сценарий создан с одинаковым порядком параметров, чтобы избежать дублирования.

В Google Search Console есть инструмент параметров URL-адресов, который помогает создавать URL-адреса, удобные для поисковых систем. Это в основном помогает улучшить внешний вид сайта в поисковых системах. Использование правильных слов, знаков препинания и файлов cookie для предотвращения создания идентификаторов сеансов — вот несколько простых способов решить эту проблему.



Источник изображения: Халлам

  1. Ссылка на оригинальный контент

Если вы копируете контент с другого веб-сайта и хотите избежать проблемы с дублированием, просто добавьте ссылку на оригинал либо в начало, либо в конец веб-страницы. Это можно сделать, когда вы синдицируете контент. Здесь убедитесь, что синдицирующий веб-сайт (скажем, RSS) ссылается на исходный сайт.

Вывод

Вам не нужно пугаться дублирования контента. Много раз это происходит случайно. Но бывают случаи, когда владельцы веб-сайтов берут контент с какого-то другого веб-сайта и размещают его на своем после небольших изменений. Это также приводит к двуличию, даже если вы можете подумать, что язык другой.

При ранжировании веб-сайта поисковая система будет учитывать, сколько контента копируется, какой контент был просмотрен первым и какой веб-сайт имеет больше преимуществ. Когда поисковая система находит веб-страницу с скопированным содержимым, это влияет не только на рейтинг страницы, но и на то, что сайт выделяется как ненадежный источник, и с него снимаются баллы за качество.

Двуличие — большая ловушка, когда речь идет об улучшении поискового рейтинга веб-сайта, но его легко исправить. Как только эта проблема будет решена, вы сможете следить за улучшением рейтинга вашего веб-сайта в поисковых системах с течением времени.

Но постоянно следить за производительностью веб-сайта сложно. И для этого вы можете использовать Pro Rank Tracker. Этот инструмент предоставляет вам регулярные обновления рейтинга вашего веб-сайта до и после решения его проблем с дублированием, чтобы вы могли эффективно отслеживать свой рост.

Поисковые системы не имеют исключений при попытке оценить ценность контента. Они строго следуют установленным алгоритмам. Чтобы вас заметила поисковая система, немедленно устраните проблему дублирования. Хороший рейтинг в поисковых системах означает хороший трафик, который повысит рентабельность инвестиций.