如何使用 Google Search Console 的索引覆蓋率報告

已發表: 2021-12-28

索引覆蓋率是 Google Search Console 中的一份報告,顯示 Google 為您的網站發現的所有 URL 的抓取和索引狀態。

它可以幫助您跟踪網站的索引狀態,並讓您隨時了解阻止您的頁面被正確抓取和索引的技術問題。

定期檢查索引覆蓋率報告將幫助您發現和理解問題並了解如何解決這些問題。

在這篇文章中,我將描述:

  • 指數覆蓋率報告是什麼,
  • 何時以及如何使用它,
  • 報告中顯示的狀態,包括問題的類型、它們的含義以及如何解決它們。
內容隱藏
1指數覆蓋率報告何時推出?
1.1 2021 年指數覆蓋率報告更新
2谷歌的索引管道
2.1發現
2.2爬行
2.3索引
2.4排名
3如何使用索引覆蓋率報告?
3.1 “所有提交的頁面”與“所有已知頁面”
3.2檢查 URL 狀態
4您應該多久查看一次報告?
5網址檢查工具
6指數覆蓋率報告中的狀態和問題類型
6.1錯誤
6.2警告有效
6.3有效
6.4排除
7結論

指數覆蓋率報告何時推出?

谷歌於 2018 年 1 月開始向所有用戶發布經過改進的 Search Console 版本時推出了索引覆蓋率報告

除了索引覆蓋率之外,改進後的 Search Console 還包含其他有價值的報告:

  • 搜索效果報告,
  • 搜索增強報告:AMP 狀態和職位發布頁面。

谷歌表示,谷歌搜索控制台的重新設計是受到用戶反饋的推動。 目標是:

  • 添加更多可操作的見解,
  • 支持使用該工具的不同團隊的合作,
  • 在 Google 和用戶的網站之間提供更快的反饋循環。

2021 年指數覆蓋率報告更新

2021 年 1 月, Google 改進了索引覆蓋率報告,以使報告的索引問題對用戶更加準確和清晰。

報告的更改包括:

  • 刪除通用的“抓取異常”問題類型,
  • 使已提交但被 robots.txt 阻止並被編入索引的頁面報告為“已編入索引但被阻止”(在警告中)而不是“已提交但被阻止”(錯誤),
  • 添加一個名為“無內容索引”的問題(警告),
  • 使軟 404 問題的報告更加準確。

谷歌的索引管道

在深入研究報告的細節之前,讓我們討論一下 Google 需要採取哪些步驟來索引並最終對網頁進行排名。

對於要對頁面進行排名並向用戶顯示的頁面,需要對其進行發現、抓取和索引。

發現

谷歌需要首先發現一個頁面才能抓取它。  

發現可以通過幾種方式發生。

最常見的是 Googlebot跟踪到頁面的內部或外部鏈接,或者通過XML 站點地圖找到它這是一個列出和組織您域上的 URL 的文件。

爬行

爬行包括搜索引擎探索網頁並分析其內容。

抓取的一個重要方面是抓取預算,它是搜索引擎可以並且想要花費在抓取您的網站上的時間和資源量。 搜索引擎的抓取能力有限,只能抓取網站上的一部分頁面。 閱讀有關優化抓取預算的更多信息。

索引

在編制索引期間,Google 會評估頁面並將它們添加到索引中 - 一個包含 Google 可用於生成搜索結果的所有網頁的數據庫。 此階段還包括渲染,這有助於 Google 查看頁面的佈局和內容。 Google 收集的有關頁面的信息有助於它決定如何在搜索結果中顯示它。

但是,僅僅因為 Google 可以找到並抓取您的頁面,並不意味著它會被編入索引。

被谷歌索引變得越來越複雜。 這主要是因為網絡在增長,網站變得越來越重。

但這裡是要記住的關鍵索引方面:您不應該將所有頁面都編入索引。

相反,請確保索引只包含對用戶有價值的高質量內容的頁面。 某些頁面可能包含低質量或重複的內容,如果搜索引擎看到它們,可能會對他們對整個網站的看法產生負面影響。

這就是為什麼創建索引策略並決定哪些頁面應該和不應該被索引是至關重要的。 通過準備索引策略,您可以優化爬網預算,遵循明確的索引目標並相應地解決任何問題。

如果您想了解有關索引的更多信息,請先瀏覽我們的索引 SEO 指南。

排行

被索引的頁面可以被排名並出現在相關查詢的搜索結果中。

谷歌根據許多排名因素決定如何對頁面進行排名,例如鍊接的數量和質量、頁面速度、移動友好性、內容相關性等等。

如何使用索引覆蓋率報告?

要獲取索引覆蓋率報告,請登錄您的 Google Search Console 帳戶。 然後,在左側的菜單中,選擇 Index 部分中的“Coverage”:

索引覆蓋率報告中的覆蓋率部分

然後您將看到報告。 通過勾選每個或所有狀態,您可以選擇要在圖表上顯示的內容:

guide-google-search-console-index-coverage-report - 2-guide-google-search-console-index-coverage-report

該報告將顯示響應以下四種狀態的 URL,這些狀態與 Google 在特定頁面上遇到的不同問題相關聯:

  • 錯誤- 抓取或索引中的關鍵問題。
  • 警告有效- 已編入索引但包含一些非嚴重錯誤的 URL。
  • 有效– 已正確編入索引的 URL。
  • 排除——由於問題而沒有被索引的頁面——這是最重要的部分。

“所有提交的頁面”與“所有已知頁面”

在左上角,您可以選擇是否要查看“所有已知頁面”,這是默認選項,顯示 Google 通過任何方式發現的 URL,或者“所有提交的頁面”,僅包括在站點地圖中提交的 URL。

您應該會發現“所有提交的頁面”和“所有已知頁面”的狀態之間存在明顯差異——“所有已知頁面”通常包含更多 URL,其中更多被報告為已排除。 這是因為站點地圖應該只包含可索引的 URL,而大多數網站包含許多不應被索引的頁面。 一個例子是電子商務網站上帶有跟踪參數的 URL。 像 Googlebot 這樣的搜索引擎機器人可能會通過各種方式找到這些頁面,但它們不應該在您的站點地圖中找到它們。

因此,在打開“索引覆蓋率”報告時請務必注意,並確保您正在查看您感興趣的數據。

檢查 URL 狀態

要查看針對每種狀態發現的問題的詳細信息,請查看圖表下方:

guide-google-search-console-index-coverage-report - 3-guide-google-search-console-index-coverage-report

此部分顯示狀態、特定類型的問題以及受影響的頁面數。

您還可以查看驗證狀態 - 修復問題後,您可以通知 Google 該問題已得到解決並要求驗證修復。

單擊問題後,可以在報告頂部執行此操作:

指南-google-search-console-index-coverage-report - 4-guide-google-search-console-index-coverage-report

驗證狀態可以顯示為“固定”。 但它也可能顯示“失敗”或“未開始”——您應該優先解決以這些狀態響應的問題。

您還可以查看每個狀態的趨勢——URL 的數量是上升、下降還是保持在同一水平。

單擊其中一種類型後,您將看到哪些 URL 響應此問題。 此外,您可以檢查每個 URL 的最後一次抓取時間 - 但是,由於 Google 報告可能存在延遲,這些信息並不總是最新的。

還有一個圖表顯示日期以及問題如何隨時間變化。

guide-google-search-console-index-coverage-report - 5-guide-google-search-console-index-coverage-report

以下是您在使用報告時應注意的一些重要注意事項:

  • 始終檢查您是否正在查看所有提交的頁面或所有已知頁面。 站點地圖中頁面的狀態與 Google 發現的所有頁面之間的差異可能非常明顯。
  • 該報告可能會延遲顯示更改,因此每當您發布新內容時,請至少給它幾天時間以使其被抓取和編入索引。
  • Google 會向您發送電子郵件通知,告知您網站上遇到的任何特別緊迫的問題。
  • 您的目標應該是索引您希望用戶和機器人找到的頁面的規範版本。
  • 隨著您的網站增長和您創建更多內容,預計報告中的索引頁面數量會增加。

您應該多久查看一次報告?

您應該定期檢查索引覆蓋率報告,以發現在抓取和索引您的頁面時出現的任何錯誤。 通常,嘗試至少每月檢查一次報告。

但是,如果您對網站進行任何重大更改,例如調整佈局、URL 結構或進行網站遷移,請更頻繁地監控結果以發現任何負面影響。 然後,我建議至少每周訪問一次報告,並特別注意Excluded 狀態

網址檢查工具

在深入了解索引覆蓋率報告中每個狀態的細節之前,我想提一下 Search Console 中的另一個工具,它可以讓您深入了解已抓取或編入索引的頁面。

URL 檢查工具提供有關 Google 索引頁面版本的詳細信息。

您可以在 Google Search Console 中頁面頂部的搜索欄中找到它。

只需粘貼您要檢查的 URL - 然後您將看到以下數據:

guide-google-search-console-index-coverage-report - 6-guide-google-search-console-index-coverage-report

您可以使用 URL 檢查工具:

  • 檢查 URL 的索引狀態,如果出現問題,請查看它們是什麼並進行故障排除,
  • 了解 URL 是否可編入索引,
  • 查看 URL 的呈現版本,
  • 請求將 URL 編入索引——例如,如果頁面已更改,
  • 查看加載的資源,例如 JavaScript,
  • 查看 URL 有資格獲得哪些增強功能——例如,基於結構化數據的實施以及頁面是否適合移動設備。

如果您在索引覆蓋率報告中遇到任何問題,請使用 URL 檢查工具來驗證它們並測試 URL,以更好地了解應該修復的內容。

索引覆蓋率報告中的狀態和問題類型

是時候查看報告中的四種狀態中的每一種了:

  • 討論他們可以展示的具體問題類型,
  • 是什麼導致了這些問題,以及
  • 你應該如何解決它們。

錯誤

錯誤部分包含由於 Google 遇到的錯誤而未編入索引的 URL。

每當您看到包含“已提交”的問題時,它都與已提交索引的 URL 有關,這通常是通過站點地圖完成的,這就是 Google 發現它們的方式。 確保您的站點地圖僅包含您要編入索引的 URL。

服務器錯誤 (5xx)

顧名思義,它是指狀態碼為 5xx 的服務器錯誤,例如 502 Bad Gateway 或 503 Service Unavailable。

您應該定期監控此部分,因為Googlebot 在索引存在服務器錯誤的頁面時會遇到問題。 您可能需要聯繫您的服務器管理員來修復這些錯誤,或檢查它們是否是由您站點上的任何最近升級或更改引起的。

查看 Google 關於如何修復服務器錯誤的建議。

重定向錯誤

重定向將搜索引擎機器人和用戶從舊 URL 轉移到新 URL。 它們通常在舊 URL 更改或其內容不再存在時實施。

重定向錯誤指向以下問題:

  • 重定向鏈(當 URL 之間有多個重定向時發生)太長,
  • 重定向循環 – URL 相互重定向,
  • 超過最大 URL 長度的重定向 URL,
  • 在重定向鏈中發現錯誤或空 URL。

檢查並修復每個受影響 URL 的重定向- 如果您不確定從哪裡開始,請按照我的重定向指南進行操作。

提交的 URL 被 robots.txt 阻止

這些 URL 在站點地圖中提交,但在robots.txt 中被阻止。 Robots.txt 是一個文件,其中包含有關機器人應如何抓取您的網站的說明。 如果此 URL 應被編入索引,Google 需要先對其進行抓取,因此請前往您的 robots.txt 文件並調整指令。

提交的 URL 標記為“noindex”

與上一個錯誤類似,這些頁面已提交索引,但被HTTP 響應中的 noindex 標記或標頭阻止 “Noindex”可防止頁面被編入索引——如果受影響的 URL 應該被編入索引,請刪除 noindex 指令。

提交的 URL 似乎是軟 404

軟 404 錯誤意味著頁面返回 200 OK 狀態,但其內容使其看起來像錯誤,例如,因為它是空的或包含稀薄的內容。 查看出現此錯誤的頁面,並檢查是否有辦法更改其內容或重定向它們。

提交的 URL 返回未經授權的請求 (401)

401 Unauthorized狀態碼表示請求無法完成,因為需要使用有效的用戶 ID 和密碼登錄 Googlebot 無法索引隱藏在登錄後的頁面——在這種情況下,要么刪除授權要求,要么驗證 Googlebot 以便它可以訪問這些頁面。

未找到提交的 URL (404)

404 錯誤頁面表示無法找到請求的頁面,因為它已更改或被刪除。 每個網站上都存在錯誤頁面,一般來說,其中一些不會損害您的網站。 但是,每當用戶遇到錯誤頁面時,都可能導致負面體驗。

如果您在報告中看到此問題,請查看受影響的 URL 並檢查是否可以修復錯誤。 例如,您可以設置 301 重定向到工作頁面。 此外,請確保您的站點地圖不包含任何返回 200 OK 以外的任何 HTTP 狀態代碼的 URL。

提交的網址返回 403

403 Forbidden狀態碼表示服務器理解請求但拒絕授權 您可以向匿名訪問者授予訪問權限,以便 Googlebot 可以訪問該 URL,或者如果無法做到這一點,則從站點地圖中刪除該 URL。

由於其他 4xx 問題,提交的 URL 被阻止

由於其他錯誤類型中未指定的 4xx 問題,您的 URL 可能不會被編入索引 4xx錯誤一般是指客戶端引起的問題。

您可以使用URL 檢查工具詳細了解導致每個問題的原因 如果您無法解決錯誤,請從站點地圖中刪除該 URL。

警告有效

帶有警告的有效 URL 已編入索引,但可能需要您注意。

已編入索引,但已被 robots.txt 阻止

頁面已編入索引,但 robots.txt 文件中的指令將其阻止。 通常,這些頁面不會被編入索引,但 Google 很可能會找到指向它們的鏈接並認為它們很重要。

檢查受影響的頁面——如果它們應該被編入索引,請更新您的 robots.txt 文件以允許 Google 訪問它們。 如果這些頁面不應被編入索引,請查找指向它們的任何鏈接。 如果您希望抓取 URL 但不編入索引,請實施 noindex 指令。

無內容索引的頁面

這些 URL 已編入索引,但 Google 無法讀取其內容。

此問題的常見原因包括:

  • 偽裝——向用戶和搜索引擎顯示不同的內容,
  • 頁面是空的,
  • Google 無法呈現頁面,
  • 該頁面採用 Google 無法編入索引的格式。

自己訪問這些頁面並檢查內容是否可見。 此外,請轉到 URL 檢查工具以了解 Googlebot 如何查看它。 然後,在解決問題或未發現任何問題後,您可以請求 Google 重新索引它。

有效的

此狀態顯示正確編入索引的 URL。 但是,監視此報告部分以查看是否不應將任何 URL 編入索引仍然很好。

提交並編入索引

這些是通過站點地圖正確編入索引和提交的 URL。

已編入索引,未在站點地圖中提交

在這種情況下,一個 URL 已被編入索引,即使它未包含在站點地圖中。  

您應該檢查 Google 是如何訪問此 URL 的。 您可以在 URL 檢查工具中找到此信息。

此部分中的 URL 通常包含站點的分頁,這是正確的,因為不應在站點地圖中提交分頁。 查看 URL 並檢查是否應將它們添加到站點地圖中。

排除在外

這些是尚未編入索引的頁面。 您可能會注意到,這裡的許多問題都是由與前幾節相似的方面引起的。 主要區別在於谷歌不認為排除以下網址是錯誤引起的。

您可能會發現本節中的許多 URL 已出於正確的原因被排除在外。 但重要的是要定期檢查哪些 URL 沒有被編入索引,以及為什麼要確保您的關鍵 URL 沒有被排除在索引之外。

被“noindex”標籤排除

未提交頁面以進行索引編制,但 Googlebot 找到了該頁面,但由於 noindex 標記而無法將其編入索引。 瀏覽這些 URL 以確保索引中阻止了正確的 URL。 如果應將任何 URL 編入索引,請刪除該標記。

被頁面刪除工具阻止

這些 URL 已被 Google 使用Google 的刪除工具阻止 但是,這種方法只能暫時有效,通常在 90 天后,Google 可能會再次在搜索結果中顯示它們。 如果要永久阻止頁面,可以刪除或重定向它或使用 noindex 標記。

被 robots.txt 屏蔽

這些 URL 已在 robots.txt 文件中被阻止,但未提交索引。 您應該瀏覽這些 URL 並檢查您是否打算阻止它們。

請記住,使用 robots.txt 指令並不是防止索引頁面的萬無一失的方法。 Google 可能仍會在不訪問頁面的情況下為其編制索引,例如,如果其他頁面鏈接到該頁面。 要將頁面保留在 Google 的索引之外,請使用其他方法,例如密碼保護或 noindex 標記。

由於未經授權的請求而被阻止 (401)

在這種情況下, Google 收到了 401 響應代碼,並且無權訪問這些 URL。

這往往發生在登台環境或其他受密碼保護的頁面上。

如果不應將這些 URL 編入索引,則此狀態很好。 但是,要確保這些 URL 不在 Google 的範圍內,請確保 Google 無法找到您的暫存環境。 例如,刪除指向它的任何現有內部或外部鏈接。

已爬網 - 目前未編入索引

Googlebot 已抓取一個網址,但正在等待決定是否應將其編入索引。

這可能有很多原因。 例如,可能沒有問題,Google 很快就會將該 URL 編入索引。 但是,如果頁面的內容質量不高或看起來與網站上的許多其他頁面相似,Google 通常會等待將其編入索引。 然後,谷歌將其放入優先級較低的隊列中,並專注於索引更有價值的頁面。

如果您想了解可能導致此狀態的原因以及如何解決任何問題,請務必閱讀我們關於如何修復“已抓取 - 當前未編入索引”的文章。

已發現——目前未編入索引

這意味著谷歌已經找到了一個網址——例如,在站點地圖中——但還沒有抓取它。

請記住,在某些情況下,這可能只是意味著 Google 將很快抓取它。 這個問題也可能與抓取預算問題有關——谷歌可能會認為您的網站質量低下,因為它缺乏性能或包含稀薄的內容。

可能,Google 沒有找到任何指向此 URL 的鏈接,或者遇到了具有更強鏈接信號的頁面,它會首先抓取。 如果有很多質量更好或更新的頁面,Google 可能會跳過抓取該 URL 幾個月,甚至根本不抓取它。

具有適當規範標籤的備用頁面

此 URL 是由正確標記標記的規範頁面的副本,它指向規範頁面。 規範標籤用於指定代表頁面主要版本的 URL。 當存在許多相同或相似的頁面時,這是一種防止重複內容問題的方法。

在這種情況下,您無需進行任何更改。

沒有用戶選擇的規範的重複

此頁面有重複,未指定規範版本。 這意味著Google 不會將指定的 URL 視為規範。

您可以使用URL 檢查工具來了解 Google 選擇了哪個 URL 作為規範。 最好自己選擇規範版本,並使用 rel=”canonical” 標籤在您的 URL 中相應地標記它。

重複,谷歌選擇了與用戶不同的規範

您選擇了一個規範頁面,但 Google 選擇了一個不同的頁面作為規範。

您希望作為規範的頁面在內部的鏈接可能不如非規範頁面那麼強,然後谷歌可能會選擇它作為規範版本。

解決此問題的一種方法是合併重複的 URL。 如果您想了解有關此狀態的可能原因和解決方案的更多信息,請閱讀我們關於如何修復重複的指南,Google 選擇了與用戶問題不同的規範問題。

未找到 (404)

這些是未在站點地圖中提交的 404 錯誤頁面,但 Google 仍然找到了它們。

谷歌本可以通過鏈接發現它們,或者因為它們之前存在但後來被刪除。

如果您打算不找到此頁面,則無需執行任何操作。 另一種選擇是使用 301 重定向將 404 移動到工作頁面。

帶有重定向的頁面

這些頁面正在重定向,因此尚未編入索引。 此處的頁面通常不需要您注意。

要永久重定向頁面,請確保您實施了 301 重定向到最近的替代頁面。 將 404 頁面重定向到主頁可能會導致Google 將其視為軟 404。

軟404

如前所述,這些 URL 類似於錯誤頁面,但不返回 404 狀態代碼。 例如,它們可能是自定義 404 頁面,其中包含指向其他頁面的用戶友好內容,但返回 200 OK HTTP 代碼。

修復軟 404 錯誤,您可以:

  • 添加或改進這些 URL 上的內容,
  • 301 將它們重定向到最接近的匹配替代品,或
  • 配置您的服務器以返回正確的 404 或 410 代碼。

重複的,提交的 URL 未被選為規範

這包括在站點地圖中提交但未指定規範版本的 URL。

Google 認為這些 URL 與其他 URL 重複,並決定使用 Google 選擇的規範 URL 規範化這些 URL。 您應該添加指向首選 URL 版本的規範 URL。

由於訪問被禁止而被阻止 (403)

Google 無法訪問這些 URL 並收到403 Forbidden 錯誤代碼。 如果 Google 不應該訪問這些 URL,最好使用 noindex 標記。

由於其他 4xx 問題而被阻止

這些 URL 以其他4xx 狀態代碼響應- 檢查這些頁面以了解錯誤是什麼。 然後,要么根據出現的特定代碼修復它,要么讓頁面保持原樣。

結論

索引覆蓋率報告顯示了您的抓取和索引問題的詳細概述,並指出應如何解決這些問題,使其成為SEO 數據的重要來源。

您網站的抓取和索引狀態並不簡單——並非所有頁面都應該被抓取或索引。 確保搜索引擎機器人無法訪問此類頁面與正確索引您最有價值的頁面一樣重要。

該報告反映了您的索引狀態不是黑色或白色的事實。 它突出顯示了您的 URL 可能處於的狀態範圍,顯示了嚴重的錯誤和並不總是需要採取措施的小問題。

最後,您應該定期瀏覽 Google 的索引覆蓋率報告,並在它與您的索引策略不一致時進行干預。