真实目的地 – 揭开 Google Search Console 覆盖报告中用于重定向的令人困惑但通常准确的真实目的地网址的神秘面纱
已发表: 2022-11-03
如果您在 Google 将重定向报告为其他类别时感到困惑,例如“被 robots.txt 阻止”、“软 404s”、“noindexed”、“404s”等,则可能是 Google 默默地跟踪重定向并报告而是真正的目标网址。 我的帖子详细介绍了这种情况,并提供了这种情况在野外发生的例子。
在从 SEO 的角度对网站进行大量分析时,您无疑会发现自己深入 Google Search Console (GSC) 报告。 GSC 包含直接来自 Google 的大量数据,可以帮助网站所有者和 SEO 获得关键见解。 也就是说,了解 GSC 报告所涉及的细微差别以及 Google 如何确定其在这些报告中提供的信息非常重要。 在采取行动改进 SEO 时,清楚地了解数据显示的内容很重要。
在 GSC 的索引覆盖率报告(和 URL 检查工具)中,没有比用于重定向的可怕的真实目标 URL 更好的 GSC 数据混淆示例了。 我从客户那里收到了很多关于这个的问题,所以我决定写这篇文章,这样我就可以在这里指出人们,而不是一次又一次地解释它。

所以,加入我的 GSC 冒险之旅,我们将揭开真正目的地 url 的秘密。 你们中的一些人可能已经知道这一点,但我知道有些人不知道。 对于那些不这样做的人,这一切很快就会变得有意义。 您可能对它的工作方式不满意,但至少您会理解为什么在 GSC 中以某些方式(以及通过 URL 检查工具)对 url 进行分类。
GSC 中可怕的真实目标 URL 情况是什么?
当在 GSC 中查看被重定向的 url 的索引状态时,Google 会报告真实的目标 url (即使该 url 在您自己的站点之外)。 例如,如果您将一个 url 重定向到另一个 url,并且该 url 由于某种原因不可索引,则 GSC 将默默地跟踪重定向并报告最终目的地的状态。 对于不知道正在发生这种情况的网站所有者和 SEO 来说,这可能会让人非常困惑。
是的,这意味着您可以看到 url 显示为“被 robots.txt 阻止”、“noindexed”、“soft 404”、“404”等(当您检查的 url 实际上是重定向时)。 可以想象,当许多网站所有者知道 100% 的 URL 正在重定向时,当他们看到“被 robots.txt 阻止”时,他们会感到困惑。
Google 的 John Mueller 曾多次被问及这个问题,他回答了我上面解释的内容(并且承认这可能有点令人困惑)。 此外,Barry 根据 John 的评论写了一篇文章,介绍了 URL 检查工具是如何发生这种情况的。 尽管这已被记录在案,但我发现对于许多网站所有者和 SEO 来说,这仍然是一个非常令人困惑的情况(这就是我写这篇文章的原因)。
这是我的一条推文,其中包含指向 John 的链接,解释了 Google 如何默默地跟踪重定向(以及它如何在 GSC 中显示):
既然您知道这种情况正在发生,您可能想知道这在 GSC 中实际上是什么样子。 接下来,我将通过在野外发生这种情况的示例来介绍这一点。
Google 静默跟踪重定向并在 GSC 中报告真实目标 URL 状态的示例:
下面,我将提供示例,其中包含 Google 报告真实目标网址与重定向的屏幕截图。 同样,这是由于某种原因最终目标 url 不可索引的时候。
被 robots.txt 阻止:
该 url 在站点外部被重定向到一个被 robots.txt 阻止的 url。 Google 将重定向 url 报告为“被 robots.txt 阻止”,因为最终目的地实际上是不允许的。

被 robots.txt 阻止的一个转折点:
此网址首先重定向到被 robots.txt 阻止的跟踪网址。 最终目的地未被阻止,但由于不允许,Google 无法按照第一个重定向找到最终目的地网址。 它只知道链中的第一个 url 被阻止并在 GSC 中报告。 在下面,您可以看到第二步显示该 url 实际上被 robots.txt 阻止(这就是 GSC 中报告的内容)。


软404:
url 重定向到软 404 页面(产品不可用)。 Google 报告重定向 url 是软 404(因为真正的目标 url 被视为软 404)。

这是 url 重定向到的页面(产品“当前不可用”)。 因此软 404:

无索引:
是的,你猜对了。 url 重定向到没有索引的页面。 Google 在覆盖率报告中将重定向的 url 报告为 noindexed:

已爬网,未编入索引:
乍一看,您可能会认为重定向被报告为“已抓取,未编入索引”。 不对! 它是未被 Google 索引的最终目标网址。 谷歌正在报告真实目标网址的“已抓取,未编入索引”。

最终的目标 url 确实没有被索引:

404:
Google 如何将重定向视为 404? 它没有。 这是 404 的真正目标 URL,这就是 GSC 中报告的内容。

404与域名更改:
这只是 404 情况的一种变体,用于解释更改域名时它是如何工作的。 旧域上的 url 重定向到新域名上的 url,但 url 从未迁移(它 404s)。 所以谷歌报告重定向 url 是 404。


抱歉,重定向更加混乱:
当 url 重定向到使用 200 标头响应代码解析的页面并被索引时,URL 检查工具会准确报告重定向(并说初始 url 是重定向而不是索引),但 Google 将规范显示为真正的目标网址(重定向指向的位置)。 谈论令人困惑的事情,尤其是基于我上面解释的所有其他示例,其中重定向 url 被报告为与重定向不同的东西……

GSC 中一个可能的解决方案来消除混乱:
那么,这怎么能更直观呢? 我认为,如果 GSC 确实提供了一条消息,表明它正在报告真实的目标网址,它可以消除网站所有者和 SEO 的困惑。 下面,我模拟了 GSC 中的样子。 如果 Daniel Waisberg 正在阅读(我希望你正在阅读),请添加此内容!

摘要:清除重定向和目标 URL 报告的混淆。
我希望这篇文章能帮助您了解 Google 如何默默地跟踪重定向并报告 GSC 中的真实目标网址。 我知道对于许多网站所有者和 SEO 来说,这是一个令人困惑的话题,我相信它已经导致了许多令人头疼的时刻。 请记住,截至目前,当 url 重定向时,GSC 会报告真实的目标 url。 因此,当您在 GSC 的覆盖报告中发现其他类别的重定向时(或使用 url 检查工具时),请不要感到惊讶。 谁知道呢,也许 GSC 产品团队会实施我在上面模拟的那个消息……
GG
