SEOのソフト404とは何ですか?

公開: 2022-02-17

Soft 404は公式のHTTPステータスコードではありませんが、HTTPステータスコードで示されていない場合でも、ページが存在しない(またはコンテンツがほとんどまたはまったくない)かどうかをGoogleが検出するのに役立つ高度なアルゴリズムです  

ただし、アルゴリズムは完全ではなく、Googleはページの分類中に間違いを犯す可能性があります。

ソフト404の理由が何であれ、それらはWebサイトに悪影響を及ぼし、オーガニック検索での可視性を低下させます。

この記事から、ソフト404がサイトにどのように影響するか、何が原因であるか、そしてそれらを修正するために何ができるかを学びます。

内容を隠す
1ソフト404とは何ですか?
2Soft404がWebサイトに与える影響
3ソフト404をどのように検出できますか?
3.1モバイルとデスクトップでのソフト404検出
4ソフト404の原因とその修正方法
4.1404ページが200HTTPステータスコードで応答
4.2無関係なリダイレクト
4.3コンテンツがほとんどまたはまったくないページ
4.4404のような単語を含むページ
4.5レンダリングの問題
5まとめ

ソフト404とは何ですか?

サーバーは、HTTPステータスコードを介してクライアント(ブラウザや検索エンジンボットなど)と通信します。

ページのリクエストが成功すると、サーバーは200HTTPステータスコードを返します。 ページが見つからない場合、サーバーは404(見つかりません)ステータスで応答します。

ユーザーが存在しないページをリクエストすると、ブラウザに問題が発生したことを示すメッセージが表示されます。 ただし、ブラウザに表示されるメッセージは、必ずしもHTTPステータスコードに対応しているとは限りません。

そこで、ソフト404が登場します。

Soft 404は、ページが存在しないように見えるときにGoogleがページに付けるラベルであり、同時に、成功した200HTTPステータスコードを返します。

Googleがページがソフト404であると判断した場合、クロールが遅くなります。

[ページ]をソフト404と見なすと、404のようになり、ここには何もないため、その特定のURLのクロールが遅くなります。なぜ毎日クロールする必要があるのでしょうか。
出典:ジョン・ミューラー

ソフト404の検出は、次の2つの理由から、検索エンジンの観点から不可欠です。

  1. Googleのリソースは限られています。 Webは無限に大きく、すべてのページをクロールすることは不可能です。 そのため、Googleは、クロールする価値のあるページに優先順位を付けて選択する必要があります。 ソフト404を除外すると、より価値のあるページに集中できるため、クロールの効率が向上します。
  2. Googleは、高品質のページをユーザーに提示したいと考えています。 Googleがページが存在しないと疑う場合、誰もそのページを見つけたくないことは明らかであり、検索結果ページに表示されるべきではありません。

Soft404がWebサイトに与える影響

ウェブサイトへの影響は、Googleがソフト404として分類したページの種類によって異なる場合があります。

Googleが正しく、ページが実際に存在しない場合、主な結果はクロール予算を浪費することです。

クロール予算は、Googleがウェブサイトでクロールできるページ数とクロールしたいページ数を示します。 たとえば、100,000ページがあり、クロール予算で50,000ページをクロールできる場合は、予算が貴重なページに費やされていることを確認することが不可欠です。 Googleがソフト404のクロールにクロール予算を浪費している場合、あなたにとって最も重要でトラフィックをもたらすページには十分ではない可能性があります。

コインの反対側は、Googleがステータスの割り当て中にミスを犯し、価値のあるページがソフト404であると考えた場合です。この場合、ページはインデックスに登録されず、オーガニックトラフィックをもたらしません。

ソフト404をどのように検出できますか?

インデックスカバレッジレポートで、Google検索コンソールでGoogleがソフト404として報告するページを確認できます

サイドバーの[カバレッジ]オプションをクリックして、レポートにアクセスします。

インデックスカバレッジレポートのスクリーンショット

Googleがページをソフト404と見なした場合、次の2つのステータスのいずれかに割り当てることができます。

  • ソフト404(除外カテゴリ)、または
  • 送信されたURLはソフト404(エラーカテゴリ)のようです。

これらのステータスの唯一の違いは、GoogleがURLを検出した方法です。

「送信されたURLはソフト404のようです」ステータスの場合、Googleはサイトマップ(インデックスに登録するページのみをリストする必要があるWebサイト所有者によって作成されたテキストファイル)内でそれを見つけました。 一方、「ソフト404」ステータスの場合、GoogleはこのURLを独自に検出しました。

これらのステータスのいずれかをクリックすると、ソフト404を報告する個々のURLのリストを表示できます。 このデータはエクスポートできますが、URLの制限は1,000です。 複数のサイトマップをエクスポートして複数のサイトマップを作成する場合は、各サイトマップのURLを個別にダウンロードできます。

URLのステータスを確認できるのは、インデックスカバレッジレポートだけではありません。

Google検索コンソールURL検査ツールでは、個々のURLを再確認できます。 複数のURLを検査する場合は、 URL検査APIを使用して、一度に最大2,000のURLを検査できます。

インデックスカバレッジレポートとURLインスペクションツールのステータスに違いが見られる場合は、インデックスカバレッジレポートが遅れている可能性があります。 この場合、最新のデータが表示されるURL検査ツールを信頼してください。

モバイルとデスクトップでのソフト404検出

2021年、Googleは、携帯電話やデスクトップデバイスでソフト404を検出する方法に関する最新情報を提供しました。

ステータスは、モバイルバージョンとデスクトップバージョンで異なる方法で割り当てられる可能性があることが判明しました。 ただし、Google検索コンソールはモバイルバージョンに基づいてステータスを報告するため、デスクトップバージョンのみがソフト404としてラベル付けされている場合は表示されません。

基本的に、デスクトップでは404ページのように見えるページが表示されることがあるため、これはデスクトップではソフト404であると言え、インデックスを作成する必要はありません。 また、モバイルでは通常のページのように見えるので、実際にそこでインデックスを作成します。

[…]検索コンソールでは、ソフト404が表示されますが、モバイルバージョンでは表示されます。 したがって、モバイルバージョンですべてが問題ない場合、検索コンソールでは通常のインデックスが作成されているように見えますが[…]、デスクトップではソフト404と見なすとできません。検索コンソールで直接確認してください。

出典:ジョン・ミューラー

ソフト404の原因とその修正方法

Googleがページをソフト404として分類する理由はいくつかあります。たとえば、次のようなものがあります。

  • 200 HTTPステータスコードで応答する404ページ、
  • 無関係なリダイレクト、
  • コンテンツがほとんどまたはまったくないページ、
  • 404のような単語を含むページ、
  • レンダリングの問題。

200HTTPステータスコードで応答する404ページ

ページが実際には404ページであるが、200 HTTPステータスコードを返す場合、Googleはそのページをソフト404として分類します。

これは、カスタム404ページがある場合に特に注意する必要があります。  

カスタム404ページは、ユーザーがアクセスしようとしているページが存在しない場合でも、ユーザーがWebサイトを探索できるようにするのに役立ちます。 ただし、これらのページが200HTTPステータスコードを返すことは珍しくありません。

Googleはこれらのページをクロールし続けるため、この状況を回避する必要があります。これにより、クロールの予算が無駄になります。

この問題の解決策は、存在しないページ(404 Not Found)に対して正しいステータスコードを返すようにサーバーを構成することです。  

無関係なリダイレクト

関連性のないページにリダイレクトすることは、ユーザーを混乱させる可能性のある悪い習慣です。 そのため、リダイレクトが無関係のページを指していることをGoogleが検出した場合、検索エンジンはそれに従わず、ページをソフト404として扱う可能性があります。

問題を解決するには、常に関連するページにリダイレクトしてください。  

ユーザーの視点からコンテンツを見てください。 たとえば、ユーザーが特定の何かを探していた場合、リダイレクト先のページにたどり着くのは理にかなっていますか? テーマ的に関連性がありますか? そうでない場合は、彼らの意図に答えることができるより良いページがあるかもしれません。あるいは、リダイレクトの代わりに404ページを設定する必要があります。

コンテンツがほとんどまたはまったくないページ

ページにコンテンツがほとんどまたはまったくない場合、Googleはページが空であると見なし、ソフト404として分類する可能性があります。

例としては、製品が頻繁に在庫切れになり、空の製品カテゴリにつながるeコマースWebサイトがあります。

この問題の解決策は、前の2つのケースほど簡単ではありません。

この問題に対処する1つの方法は、空のページのインデックス作成をブロックすることです。 結局のところ、それが空のページである場合、それはユーザーにとって役に立たないので、索引付けするべきではありません。 これを行うには、 noindexメタタグ(このページにインデックスを付けたくないことを検索エンジンに通知するHTMLタグ)を追加します。

さらに、Webサイト全体の構造を再考する価値があります。

たとえば、商品が1つしかない商品カテゴリがたくさんありますか? その場合は、これらのカテゴリがWebサイトで必要かどうかを再検討する必要があります。 このようなページは薄いコンテンツと見なされる可能性があり、次の2つの方法でWebサイトに悪影響を与える可能性があります。

  • 彼らはあなたのクロール予算を浪費する可能性があり、
  • 低品質でインデックスに登録可能なページがたくさんある場合、Googleは、Webサイト全体の品質が不足していると判断し、Webサイトのクロールを頻繁に停止することを決定する場合があります。

インデックスを作成する必要があるページとインデックスを作成しないページについて詳しく知りたい場合は、Webサイトのインデックス作成戦略の作成に関する記事をお読みください。

404のような単語を含むページ

通常404ページに表示される単語がページに含まれている場合、Googleのアルゴリズムがページを誤認することがあります。 たとえば、eコマースウェブサイトで、商品ページに「在庫切れ」、「商品が利用できない」、「お客様の場所に配送されない」などの用語が使用されている場合に発生する可能性があります。

上記の投稿の作者は、配信が利用できないことを示す単語を削除するだけで問題を修正しました。

レンダリングの問題

レンダリングは、Googleがコンテンツを表示するために必要な手順です。 検索エンジンがそれを見ることができない場合、それはページが空であると考えて、それをソフト404として分類するかもしれません。

レンダリングの問題の原因の1つは、 robots.txtでCSSやJavaScriptなどのリソースをブロックすることですRobots.txtは、検索エンジンボットがクロールできるページとクロールできないページを指定できるファイルです。 Googleがレンダリングに必要なリソースにアクセスできない場合、コンテンツを表示することはできません。

Googleがコンテンツを正しくレンダリングしているかどうかを確認するには、Google検索コンソールのURL検査ツールを使用します。 個々のURLを調べて、Googleがあなたのページをどのように見るかを確認できます。 コンテンツが欠落している場合は、レンダリングの問題を示しています。

この問題を解決するには、レンダリングに必要なリソースにGoogleがアクセスできることを確認してください。 robots.txtファイルを確認し、CSSとJavaScriptのクロールが許可されていることを確認します。

レンダリングの仕組みについて詳しく知りたい場合は、レンダリングSEOマニフェストを確認してください。JavaScriptSEOでは不十分な理由です。

まとめ

ソフト404を監視することは、クロール予算を浪費したり、貴重なページをインデックスから除外したりして、ウェブサイトを傷つけないようにするために重要です。

ソフト404を回避するための記事からの重要なポイントは次のとおりです。

  • ページが存在しない場合は、404HTTPステータスコードが返されることを確認してください。
  • リダイレクトを作成するときは、常に関連するコンテンツにリダイレクトしていることを確認してください。
  • robots.txtでCSSファイルやJavaScriptファイルなどのレンダリングに不可欠なリソースをブロックしないでください。
  • 空のページがある場合は、noindexメタタグを追加するか、これらのページをサイトから削除します。
  • 404のようなフレーズの使用に注意してください。 在庫切れの商品などのページがソフト404とマークされていることに気付いた場合は、単語を削除するか、別の用語を使用してみてください。