Google 忘记了索引队列中的 URL
已发表: 2021-12-21索引错误并非闻所未闻。 谷歌在索引编制方面一直存在问题。 无论网站的大小如何,它们都可能发生在网站所有者没有过错的任何人身上。 就在去年,有一个涉及移动索引和规范化的索引错误案例。
几个月前,当我发现我的索引 SEO 终极指南没有被索引时,我亲身经历了一个索引错误。
经过深入研究,我发现 Google 无缘无故地索引了错误版本的 URL。 您可以在我的文章My Ultimate Guide to Indexing SEO Not Indexed中了解有关此特定错误的更多信息。
今年早些时候,我发现了另一个索引错误,表明 Google 可能会丢失索引队列中的 URL。
让我们一步一步地分解它。
Google 的索引队列中被遗忘的 URL
10 月 6 日,我们发表了一篇文章:渲染 SEO:Google 如何消化您的内容。 这篇文章是 Onely 的 Bartosz Goralewicz、Google 的 Martin Splitt 和 Kalicube 的 Jason Barnard 之间的对话记录。
不幸的是,自发表之日起的三周内,这篇文章并没有从谷歌获得任何流量。

我觉得很奇怪——另一篇没有被谷歌索引的有趣文章? 谷歌是否遭受另一个索引错误?
由于我努力了解谷歌索引过程的来龙去脉,我决定进行一些调查。
我检查了 Google Search Console 对这个 URL 的评价。
GSC 表示该 URL 已“被发现 - 目前未编入索引”。

当您查看 Google 的文档时,您会发现以下状态说明:
已发现 - 当前未编入索引:该页面已被 Google 找到,但尚未被抓取。来源:谷歌
URL 的状态似乎极不可能。 我不敢相信谷歌在一个相对较小的网站上发布后三周内没有抓取这个页面。
所以,我检查了我们的服务器日志。
服务器日志允许您检查进入您网站的流量。 它们包含有关每个请求的信息,包括其时间和日期、用户代理字符串、IP 地址等。多亏了这些信息,我可以看到 Googlebot 是否(以及何时)出现在此页面上。

令人惊讶的是,我发现Googlebot 在我们发表文章的那天访问了该页面!
在这一点上,我有两个重要的信息:
- Googlebot 尚未访问该页面的来自 Google Search Console 的数据不正确。 服务器日志证明Googlebot在文章发表当天访问了该 URL 。
- 这不仅仅是来自 Google Search Console 的报告错误。 该页面没有获得任何自然流量,因此显然存在比报告中的错误更重要的问题。
更多网站遭受 Google 的索引错误
我想更多地了解这个错误及其规模,因此我研究了更大的网站样本以得出可行的结论。
我从其他四个网站收集了服务器日志并挖掘了数据。
事实证明,我检查过的网站 100% 都存在这个问题。 Googlebot 访问了多个 URL ,但被 Google Search Console 错误分类为:
- 已发现 - 当前未编入索引,或
- 未知。
在未知状态的情况下,谷歌似乎表示它从未访问过该页面,甚至没有发现该 URL 的记忆。

我发现这个问题在谷歌最初访问它的 6 个月后就出现在其中一个测试页面上。 根据服务器日志,上次访问是在 3 月 7 日,但在 10 月 27 日,状态仍然是 Unknown。
谷歌似乎偶尔会在索引管道中的某个时刻忘记 URL。 目前尚不清楚搜索引擎是否只是丢失了某些 URL 或故意忽略它们。
无论哪种方式,后果都很严重。 被遗忘的页面没有任何自然流量。
该错误的可能解决方案
Dan Shure 分享了一个与忘记 URL 错误相关的有趣案例。
“已发现——但目前未编入索引”能否将 URL 放入某种“黑名单”中?
以为我会分享一些发生在客户的一些博客文章中的奇怪而有趣的事情。
(1/5) (我讨厌做线程,但这需要一点细节)
— 丹舒尔 (@dan_shure) 2021 年 11 月 8 日
似乎更改 URL 足以解决问题。
Dan Shure 并不是唯一测试此解决方案的人。 Frank Olivo 几乎 ⅓ 的文章通过更改 URL 被编入索引!
这适用于我们尝试过的 38 篇文章中的 12 篇。 在我们重新发布的同一天全部编入索引。 将近一个月后,剩下的文章仍然被“发现”。
- 弗兰克奥利沃(@FrancoOlivo)2021 年 12 月 7 日
这些 URL 可能属于低质量 URL 的模式,因此 Google 没有抓取它们,因此在 Google Search Console 中将它们归类为“已发现 - 当前未编入索引”。
您可能会说服 Google 将该页面视为新页面,然后通过更改 URL 再次对其进行抓取。 此解决方案可能有助于将页面编入索引,但这只是一种解决方法。 它不会阻止问题再次发生。 谷歌应该解决这个问题,并且这个错误应该被永久修复。
包起来
如文章中所述,索引存在严重问题。 它不像以前的索引错误(例如,与规范化有关)那么明显和壮观,但它仍然会对任何网站产生负面影响。
如果您是 Google 员工并想调查此问题,我可以分享一些遭受此问题的示例 URL。
您是否注意到您网站上的此错误或类似的索引错误? 让我知道!
