重複コンテンツとは何ですか?
公開: 2022-04-22重複コンテンツとは、複数の場所、または複数の異なるURLにある同一または非常に類似したWebコンテンツを指します。
GoogleとRavenToolsはどちらも、インターネットのかなりの量(それぞれ、 25〜30%と29% )を構成する重複コンテンツを推定しています。 したがって、重複コンテンツとそのサイトの検索エンジンランキングとの関係について知っておく必要がある特定のことがあります。
この記事では、重複コンテンツの意味、重複コンテンツのSEOの問題がどのように発生するか、およびそれらを修正する方法についてすべて説明します。
目次
- 重複コンテンツはSEOで何を意味しますか?
- 重複コンテンツとSEOの問題はどのように発生しますか?
- 重複コンテンツがあることがSEOの問題になるのはなぜですか?
- 重複コンテンツを確認する方法
- 重複コンテンツのPandaアップデート
- 重複コンテンツに関するFAQ
重複コンテンツはSEOで何を意味しますか?
SEOの重複コンテンツに関連する問題について話す前に、SEOの観点からそれが何を意味するのかを明確にする必要があります。 グーグルの重複コンテンツについて話すとき、それは、ドメイン内またはドメイン間で見られる同一またはかなり類似したコンテンツの実質的なブロックとして定義されます。
すでに述べたように、複数の情報源は、インターネットの約4分の1が反復的なコンテンツであると評価しています。
これは大きな問題のように思われるかもしれませんが、オンラインでコンテンツを複製するようになると、思ったほど悲惨なことにはなりません。
コンテンツのかなりの割合がURL間で繰り返されていますが、これは必ずしもコンテンツがコピーまたは盗まれたことを意味するわけではありません。 ほとんどの場合、重複コンテンツは多くの要因の完全に無害な副産物です。
重複コンテンツとSEOの問題はどのように発生しますか?
重複するコンテンツが意図的なものである場合もあれば、偶発的なものである場合もあります。 あなたのテキストはすべてオリジナルであるため、あなたははっきりしていると思うかもしれませんが、それでも重複コンテンツの問題が発生する可能性があります。
実際、重複コンテンツのほとんどの場合は悪意があり、欺瞞的ではなく、多くの場合、意図的でもありません。 コンテンツが複数の場所に表示される可能性がある主な理由を見ていきましょう。
WWWと非WWWおよびHTTPとHTTPS
多くの場合、重複コンテンツの問題は、サイトの構成における単純な間違いが原因で発生します。 見落とされている側面の1つは、サイトがwwwバージョンと非wwwバージョンの両方で利用できるかどうかです。
同じことがHTTPサイトとHTTPSサイトでも発生する可能性があります。
基本的に、サイトは次のいずれかの場所からアクセスできます。
- https://www.example.com
- https://example.com
- http://www.example.com
- http://example.com
あなたのサイトがこれらの複数で利用可能であり、あなたがそれを適切に説明できない場合、実際にはそれがたった1ページであるにもかかわらず、それは重複コンテンツと見なされる可能性があります。
末尾のスラッシュ
別の同様の問題は、末尾のスラッシュで発生します。 従来、末尾のスラッシュはディレクトリを示し、スラッシュがない場合はファイルを示します。 どちらを指しているかに関係なく、次のことができます。
- http://example.com/foo/
- http://example.com/foo
Googleはこれらを別々のURLとして扱います。つまり、両方のページに異なるコンテンツを含めることができます。 Googleに関する限り、これは問題ありませんが、ユーザーエクスペリエンスには悪影響を及ぼします。 人々はその構成を混乱させることに気付くでしょう、それで両方のURLが同じページにつながることが最善です。
これにより、重複の問題が発生します。 両方のURLが同じコンテンツで利用できる場合は、ページをコピーしています。 Googleの観点からは、これは2つの別々の場所にあるまったく同じコンテンツであり、未解決のままにしておくとSEOランキングに悪影響を与える可能性があります。
URLパラメータとファセットナビゲーション
ファセット検索システムは、製品をフィルタリングするための優れた方法です。 ただし、管理されていない場合、多数の組み合わせの結果として、すべて同じコンテンツで異なるURLが作成される可能性があります。 これは、クロール予算とリンクの公平性に負担をかけます。
セッションIDやトラッキングIDなどのURLパラメータでも同様の問題が発生し、複数のURLを介して同じページにアクセスできます。
代替ページバージョン
誤ってコンテンツが複製される傾向に続いて、ウェブマスターのもう1つの一般的な見落としである代替ページに到達します。 「example.com/page」などのサイトは、次のように別のURLで表示される場合があります。
- モバイル対応ページ– m.example.com/page
- 印刷しやすいページ– example.com/print/page
- Accelerated Mobile Page(AMP)– example.com/amp/page
これらのバージョンはすべてページのコンテンツを複製し、修正しないでおくと問題が発生します。
ページ付け
カテゴリページ、ブログ投稿のタイトル、ユーザーレビュー、またはコメントに関しては、ページネーションを使用してコンテンツをページ間で分割できます。
繰り返しますが、正しく処理されない場合、これによりコンテンツがURL間で重複する可能性があります。
スクレーパー
誰かがあなたのコンテンツを盗んで別のウェブサイトに公開した場合、重複コンテンツの問題が発生します。 Googleは通常、どのサイトがオリジナルであるかを判断できますが、適切な方法でスクレーパーに対処することをお勧めします。
シンジケーション
別のWebサイトに作品の再公開を許可すると、クロスドメイン重複コンテンツが作成されます。 シンジケートされたコンテンツは元のサイトより上位にランク付けされるべきではありませんが、それが起こらないように予防策を講じることができます。
重複コンテンツがあることがSEOの問題になるのはなぜですか?
多くの人がグーグルの重複コンテンツペナルティの考えを永続させてきましたが、これはあなたが一般的に心配しなければならないことではありません。

重複するコンテンツ自体は問題ではありません。 ただし、検索エンジンのランキングを操作するためにドメイン間でテキストが複製されると、問題になります。
無邪気に複製されたコンテンツとSEO
Googleは、コンテンツが正直で操作的でない限り、重複するコンテンツが検索エンジンのランキングを低下させないことをユーザーに保証します。 これは事実かもしれませんが、コンテンツが重複するとSEOのパフォーマンスが低下する可能性があります。
グーグルは検索結果に表示することを選択したページに自信を持っていますが、検索エンジンがそれを間違えることがあります。
同じページが複数のURLで利用可能であるとしましょう。 このような場合、Googleは重複するURLをクラスターにグループ化します。 これは、いくつかの点で影響を与える可能性があります。
- Googleは、クラスターの代表として「最適な」URLを選択します。 時々、あなたとグーグルは「最良の」URLが何であるかについて意見が一致せず、あなたにブランディングとUXの問題を引き起こすかもしれません。
- リンクの人気はクラスターのすべてのメンバー間で統合する必要がありますが、一部の重複はGoogleによって検出されない場合があります。 これはリンクの希薄化につながり、コンテンツのランキングの取り組みに悪影響を与える可能性があります。
また、この現象が非効率的なクロールにつながる可能性があり、Googleが新しい更新されたコンテンツを調べる時間が少なくなる可能性があるという事実を考慮してください。
スクレイピングおよびシンジケートされたコンテンツ
別のサイトに作品の再公開を許可した場合でも、コンテンツをスクレイピングした場合でも、そのコンテンツは複数のドメインに表示されるようになりました。
これによって一般的に問題が発生することはありませんが、まれに、スクレイプまたは再公開されたコンテンツが元のコンテンツを上回る場合があります。
幸いなことに、重複コンテンツの問題は、SEOパフォーマンスの最適化に役立ついくつかの異なる方法で処理できます。
重複コンテンツを確認する方法
問題を解決する前に、そもそも問題が存在することを知っておく必要があります。 これには、サイトで重複するコンテンツを検索する必要があります。 これはいくつかの方法で行うことができます。
1.Google検索コンソール
Google Search Consoleは、検索結果でのWebページのパフォーマンスに関する洞察を提供できます。 このサービスは、たとえば、検索結果で同じページランクの異なるURLを検索することにより、重複するコンテンツの問題を特定するのにも役立ちます。
2.重複コンテンツ検索
重複したコンテンツをすばやく確認する方法は、ページからテキストのブロックを検索することです。検索するときは、単語を引用符で囲みます。
理想的には、ページのみが表示されます。 他の結果がある場合は、常にではありませんが、問題が発生している可能性があります。 複数の文でこれを試すことができます。
また、Google検索バーを使用してサイトを検索することもできます。 「site:」の後にURLをすべて引用符で囲んで入力します。 これにより、Googleがインデックスに登録し、ランク付けできる可能性のあるページが表示されます。
3.重複コンテンツチェッカー
さまざまな盗用チェッカーと、 Googleの重複コンテンツチェッカーがあります。これは、コンテンツがオリジナルではないか、内部の重複コンテンツの問題があるか、または再公開されているかを確認するのに役立ちます。
重複するコンテンツに対処する方法
Googleは重複コンテンツの処理にかなり優れていますが、最良の結果を達成するために、いつでもより関与し、起こりうる問題に直接対処することができます。
何をすべきかについてのいくつかのヒントは次のとおりです。
- 301リダイレクト、正規URL、またはnoindexリダイレクトを使用します。
- 内部リンクに一貫性を持たせます。
- 国固有のコンテンツを処理するには、トップレベルドメイン(TLD)を使用します。
- シンジケートコンテンツを含むサイトにページへのリンクが含まれていることを確認するか、noindexタグを使用してください。
- 同様のコンテンツのページを統合します。
- コンテンツがスクレイピングされた場合は、 DMCAリクエストを提出してください。
重複コンテンツのPandaアップデート
GoogleのPandaアップデートは2011年にリリースされ、Googleのアルゴリズムに対する非常に重要な変更でした。 パンダはウェブサイト上の重複するコンテンツに特に対処することを意図していませんでしたが、このアップデートは、繰り返しのコンテンツを避けることを含む、ユニークで有益なテキストを奨励します。
重複コンテンツに関するFAQ
SEOで重複コンテンツとはどういう意味ですか?
重複コンテンツは、完全に一致するか、他のオンラインコンテンツとかなり類似しているテキストの実質的なブロックを表します。 反復的なコンテンツはインターネットの約4分の1を占めており、ほとんどの場合、欺瞞的または悪意のある性質のものではありません。
Googleの重複コンテンツのペナルティはありますか?
グーグルの重複コンテンツペナルティは、それがほとんど神話になっている程度まで誤って伝えられてきました。 重複するコンテンツは、Googleのウェブマスターガイドラインに違反し、検索エンジンの結果を操作する意図がない限り、ペナルティは課されません。
重複するコンテンツはSEOランキングに悪影響を及ぼしますか?
コンテンツが重複していると、SEO戦略に悪影響を与える可能性があります。 Googleは、同じページにつながる複数のURLを統合し、再公開されたコンテンツよりも高い元の結果を表示しようとします。 ただし、好ましくないURLやクロスドメインの再発行は、元の記事よりも上位にランク付けされる可能性があるため、完全なシステムではありません。 これが、重複するコンテンツにも積極的に対処する必要がある理由です。
どのくらいの重複コンテンツが許容されますか?
あなたが持っているコンテンツのどれだけを複製できるかを示唆する決定的な手段はありません。 ただし、一般的な経験則として、複製されたコンテンツの5%以下がサイトに到達するはずです。 この割合を管理するには、オンラインで盗用チェッカーを使用します。
