SEO 办公时间,2022 年 1 月 21 日
已发表: 2022-01-26这是2022 年 1 月 21 日Google SEO Office Hours与John Mueller的最有趣问题和答案的摘要。
内部链接的价值
00:44 “页眉、页脚或内容中的内部链接值是否不同?”
根据约翰的说法,“这非常相似。 我认为页面不同部分的内部链接没有任何可量化的不同。 我认为当涉及到页面不同部分的内容时,我们试图找出页面的独特之处是不同的。 但关于链接,我不认为那是什么。”
抓取问题
03:33 “在 [2021 年 11 月] 之后,谷歌 [Core] 更新了我的网站 [在抓取方面存在一些问题。 有些链接[已被抓取,而]有些则没有。 [...] 我该如何修复 [它]?”
约翰说:“我认为有两种可能性。 一是可能存在技术问题。 我认为不一定是这种情况 [...] 因为听起来有些页面正在正常爬网。
另一个是我们不会一直抓取所有内容。 我们不会将网络上的所有内容都编入索引,有时我们必须对事物进行优先排序。 [...] 我们试图了解网站的整体价值是什么,我们应该在网站上花费多少资源。 这也反映在我们爬了多少。 这可能是您在我们的算法不确定网站整体质量的情况下看到的情况。 帮助提高网站的质量通常最终使我们能够抓取更多的网站。”
索引页数下降
05:47 “在过去的一年里,我们一直在对网站进行大量技术改进,我们的客户似乎对网站很满意。 然而,自 10 月底以来,谷歌索引的页面数量急剧下降了 25% [即] 约 500,000 页。 我们提交的 […] 下降了 50% 以上。 […] 我们发现 […] 如果产品页面上没有评论,架构验证器会不高兴,因为没有提到评论。 […] 有没有我们遗漏的东西 […] 或者这实际上足以成为它的核心原因?”
John 回答说: “仅仅因为结构化数据在页面上不完全有效并不意味着我们会将其从索引中删除,所以这似乎与我无关。 我想 Search Console 中的报告显示了所有这些错误。 你看着它们,你说,好吧,我不在乎那里的标记。 这很好。 这并不表示我们认为您的网站不好,因为结构化数据无效。 只是我们想让您知道,如果您想使用此结构化数据,它不起作用。 但这不会影响抓取、索引或排名。
很难说是什么原因造成的。 可能是 [...] 我们的系统不确定您网站的整体质量。 当涉及到如此大的网站时,您会在其中查看大量数字,我还会做的一件事是尝试查看一些示例并尝试查看,这些数字是否真的反映了实际问题? 还是索引页面的数量本质上反映了正在清理的技术?
例如,有时,我们会将附加了不同参数(如 Analytics 跟踪参数)的页面编入索引。 我们很容易突然索引其中的 100,000 个页面。 它们都已编入索引。 在图表中,看起来这是一件大事。 但是,如果我们要删除所有这些页面,它不会改变您网站的任何内容,因为这些是意外索引的页面。 所以在图表中,这可能看起来非常戏剧化,它会上升,所有这些东西都被索引,然后它会下降。 [...] 但可能只是我们的系统正在修复一个不影响您网站其余部分的索引问题。 我要做的是找出这些问题中的哪些问题正在影响您网站的流量或可见性。 那么也许索引问题属于其中,但我会尝试将其分开。”
09:13 “我们注意到一件事,这是我们第一次看到 Crawled [- current] 未编入索引。 [...] 我们觉得这告诉了我们一些事情,但我们不太确定如何解释它。”
约翰:“我不认为你可以从中抽离出来。 这两种状态,Crawled [‒ current] not indexed 和 Discovered [‒ current] not indexed,它们本质上是等价的,因为我们知道 URL。 我们确认我们已经听说过它,但我们决定不将其编入索引。 这是我们正在与索引团队一起寻找解决的问题,这是一个普遍的问题吗? 因为我们听到越来越多的关于这方面的报道。 还是它本质上比以前更明显? 因为即使在过去,我们也只会索引网站的一部分。 但我们从未在 Search Console 中向人们展示过这一点。 我们专注于您获得的流量,而不是为什么我们不索引单个页面。”
已取消索引的页面与 URL 中的特殊字符
23:56 “我们刚刚发现,从 1 月 13 日开始,我们的索引页面下降了 90% 以上。 [...] 您能否就我们可以找出哪些方面来确定问题提供一些建议? [...] 当我们检查样本时,我们注意到 [Google 抓取的] URL 有一些不寻常的标记,例如问号 [和] URL 中的一些加号,但我们的实际 URL 没有这些标记。 被发现是一件不寻常的事情。”
John 的回答是:“我认为您可能还想检查的一个方面是我们是否可以正确抓取它们。 我想你已经调查过了,但在那里仔细检查总是好的。”
当谈到 URL 中的特殊字符时,John 补充说:“我们总是会发现很多网站的 URL。 如果我们认为它们不重要,我们会将它们保留在我们的列表中,并且在某个时候,我们会尝试抓取它们。 我怀疑这些只是我们随着时间的推移发现的随机 URL。 我们会不时尝试抓取它们,看看是否有任何我们遗漏的东西,但如果我们还抓取一些随机 URL,这并不是网站出现问题的迹象。”
谈到可能导致这种情况的技术方面,John 说: “通常,主要问题是关于网站的整体质量,这会影响是否为单个 URL 编制索引的决定。 这也是会随着时间而改变的。 与其说是您网站的质量发生了变化,不如说是我们对网站质量的看法会随着时间而改变。 这通常是在那里发挥作用的主要元素。

如果您在短时间内看到这些索引更改发生,那么可能是我们的系统刚刚改变了我们评估您网站质量的方式,并且突然之间,一切都在一个稍微不同的桶中。 然而,如果您在较长时间内看到它们,那么 [...] 随着时间的推移,我们的系统对网站的信心越来越低。”
GSC 属性和非尾随索引页面
33:18 “我们一直在尝试为我们的一些国家/地区特定文件夹创建 GSC 属性,以更好地监控它们的性能。 我们不在 URL 上使用斜杠。 所以当新的文件夹属性添加到 GSC 时,地址会自动添加尾部斜线,对于非尾部版本的索引页面,不会捕获并报告任何数据。 有没有办法将文件夹添加为 GSC 属性并捕获非尾随索引页面的统计信息? “
约翰: “不,目前没有。 从我们的角度来看,末尾没有斜线的页面只是一个页面。 如果它有斜线,那么它就是一个文件夹,这就是我们用于 Search Console 的模型。 因此,如果您有网站某个部分的主页并且没有尾部斜杠,那么我们会将其视为更高级别网站中的页面。 在域级别上,您可能会看到所有这些。 如果您希望数据独立可见,则必须将其从 Search Console 中的更高级别属性中提取出来。”
从网站的停机时间中恢复
34:29 “我的网站,平均每天大约 200,000 次会话,遇到了技术问题。 就在两天前,该网站关闭了 14-15 小时。 虽然昨天的流量大致正常,但今天,我们的很多页面都在 Google 搜索中丢失了。 该网站在过去 8 年中一直很稳定,我们以前从未遇到过这样的问题。 你有什么建议吗? “
John 说:“通常,如果您在短时间内遇到此类技术问题,这些页面可能会从我们的索引中退出,并且通常它们也会很快重新出现。 通常发生的情况是,我们更经常抓取的页面可能会首先被拾取并在此技术问题中引起注意。 也许我们在那段时间放弃了它们。 所以你可能会在你的流量中看到这一点,但好消息是这些页面也往往被频繁地重新抓取,所以它们[也]应该相当频繁地重新出现。
防止此问题的最佳方法是确保您有一些系统可以在出现问题时提供 503 结果代码。 可能是它不会自动触发,但是即使你可以手动打开这个 503 结果代码,本质上发生的情况是,当我们在这段时间内抓取页面并看到 503 时,我们会说有问题这里。 我们将忽略它,稍后再回来仔细检查。
本质上,如果您可以在一两天内提供 503 结果代码,那么我们会将其视为临时故障,并且我们不会从索引中删除这些页面,因为我们认为它们仍然存在。 然而,如果您直接提供 404,或者如果您提供一个空页面或只是一个错误页面,那么我们可能会假设该页面已经消失,我们会将其从索引中删除。
那将是我的建议。 通常情况下,您不能只是在事情出现问题时突然介入并突然想出如何执行 503。所以我会提前准备该系统,以便您可以尽快切换。 [...] 如果您可以提供一两天的 503,那么您根本不会在搜索索引中看到任何变化。 如果它更长,那么显然你仍然可以,但至少在一两天内——你受到保护。
如果您不能像在此处那样执行此操作,我会假设这会自动返回。 我不认为你需要做任何手册。 我们将重新抓取这些页面。 我们会再次注意到那里有很好的内容。 我们将再次对它们进行索引,[...] 拾取我们之前收到的信号。 它本质上应该像以前一样被索引和排名。 这里不应该有任何长期问题。”
网站迁移
38:37 “我们希望将一个网站的内容迁移到两个不同的域并拆分它。 在旧域名的 GSC 中我们应该怎么做? 我们应该指向哪个域作为收件人? 如何通知 Google?”
John 说:“在这种情况下,您要拆分或合并网站,您不能使用 Search Console 中的地址更改工具,因为它依赖于移动是一对一移动这一事实从一个域到另一个域。 一旦您拆分或合并网站,就不再是一对一的移动,这本质上是必须在每个 URL 的基础上处理的东西。 因此,对于这些事情,本质上,您要做的只是正确设置重定向。 请遵循我们为网站移动制定的常规准则,并记住 Search Console 的地址更改设置可能不适合那里。
此外,Search Console 设置将尝试测试您网站上的一些示例页面以进行该重定向。 可能看起来一切正常,但我认为如果您要拆分网站,使用该设置仍然是错误的。 仅仅因为它可能会稍微混淆信号,我怀疑它会导致问题,但我认为如果您不从一个域移动到另一个域,那么使用该地址更改工具不会有任何优势。 ”
内部链接和网站结构
51:16 “查看网站重要页面的内部链接是否有意义,看看它们是否有来自其他内部重要页面的链接,以及 [...] 到 [删除] 到不太重要页面的链接,以便链接到重要的页面更重?”
约翰回答说: “这是你可以做的事情。 这有点棘手,因为我们试图巧妙地处理内部链接。 尤其是一些非常常见的页面,它们有很多链接,比如关于我们页面或服务条款,它们是从整个网站链接的。 但同时,我们理解这是一种正常的模式,并不意味着我们应该为任何正在搜索公司名称的人对服务条款页面进行排名。 一方面,您可以控制内部链接。 但我不会过分说,好吧,我删除了指向我认为不重要的页面的链接。 因为当我们引入nofollow 时尤其如此,人们会说,哦,我的服务条款[页面]——所有链接都将指向它。 这不会改变任何事情。 这是很多工作,你必须永远维护它,但它不会改变你的网站,所以它就像是浪费工作。
但我仍然建议您浏览您的网站并尝试创建一个图表来说明事物是如何链接的。 我认为一些或可能大多数 SEO 工具都有一些能力来抓取网站并创建此图 [...] 以显示网站的结构。 当你看到它时,有时你可以第一眼看到它的结构是干净的还是完全凌乱的? 如果它完全一团糟,那么我认为还有空间来清理它并明确结构应该是什么。
通过制定更清晰的结构,您可以帮助我们了解您认为哪些页面更重要,因此我会尝试寻找清理的方法。 我并不是说如果你有一个干净的结构你的网站排名会更好,但如果我们了解你的网站应该在这个范围内排名[以及]这些页面中哪些是最重要的,那就更重要了。 这就是您在那儿告诉我们的 [...] 并为您带来价值,并且您正在将人们发送到您关心的页面。 这当然是我会考虑做的事情。”
55:03 “很容易计算的内部PageRank呢? 您会建议这样做以查看哪些页面确实从内部链接中获得最大权重,还是您会说这是没有必要的?”
John 回答说: “[...] 你无法在其中建模的方面是各个页面将获得不同的外部链接,这从本质上也会影响内部 PageRank。 如果每个人都链接到您的服务条款页面,那么它突然之间就会有很多 PageRank。 PageRank 是我们在系统中使用的东西,但我们使用了很多其他的东西。 从技术角度来看,这是一个有趣的小工具,但从实际角度来看,我不会认为它是超临界的。 你更想弄乱数字和玩图表——当然你可以计算出来。 我不认为这是在谷歌一对一反映的东西。”
