SEO 办公时间 – 2021 年 10 月 8 日

已发表: 2021-10-15

这是2021 年 10 月 8 日Google SEO Office Hours与John Mueller的最有趣问题和答案的摘要。

内容隐藏

1索引页数与站点权限

2评估网站的主要目的

3链接重定向

4从核心更新中恢复

5访客帖子中的链接

6产品价格作为排名因素

7在站点地图之间移动 URL

8多区域内容

9网站移动中的重定向

10 API和爬取预算

11 JavaScript 和谷歌缓存

索引页面数与站点权限

03:52 “因此，您过去曾多次建议大型网站 [...] 专注于较小的页面集 [...]。我现在正在处理的网站，我们有 [...] 大约 1,000 个没有任何流量的页面，这些页面很旧，所以我一直建议删除这些页面。但是我们的开发团队有一个问题，他们的印象是，Google 为您的网站编制索引的页面越多，它赋予该网站的权限就越高，并且不愿删除任何页面。你能解释一下吗？”

正如 John 所说， “如果您有更多的页面被索引，我们绝对不会认为您的网站更好。 [...] 有时，将大量页面编入索引是有意义的。有时，它们是一种有用的页面，可以像这样被索引。但这并不是关于被索引的页面数量的质量标志。尤其是如果您谈论的是 [...] 1,000、2,000、5,000 页，这对于我们的系统来说总体上是一个相当低的数字。我们并不是说 5,000 页优于 1,000 页。对我们来说，这有点像，嗯，它是一个小网站，我们会尽我们所能。当然，小型网站是相对的。这不像说它是一个无关紧要的网站。它可能很小，但可能仍然非常有用 [...]”。

评估网站的主要目的

10:03 “上次我们谈到了网站的一些问题 [...] – 这是一个电子商务网站，我们有信息和交易的东西。 [...] 您的建议是将这些内容稍微分为面向事务的页面和面向信息的页面。所以我对此还有另一个问题。如果你有，比如说，一个电子商务网站，你有一个巨大的博客，或者杂志，或者类似的东西，你有大量的信息，但它是一个旧的部分。另一方面，您拥有所有这些产品页面和类别等。那么这个包含纯信息内容的巨大块是否会给整个网站带来一种信息感或特征，以便谷歌说，哦，我们不确定这是否是 [...] 人们可以获取信息而不是购买东西的东西，或者是这个评估是在每页的基础上进行的吗？”

John 说：“[...] 我的理解是，这更像是一个页面级别的事情。 [...] 很多网站只是混合了不同种类的内容。然后，您尝试找出这些页面中的哪些与搜索者的意图相匹配，并尝试对它们进行适当的排名。 […]

我的意思是，你经常在新闻网站上看到这一点。 […] 他们有最近的事件，但他们也有发生的旧事件的部分，或者 […] 对于其他重大事件，他们有一个独立的存档部分。如果您真的想要正在发生的事情，或者您想要某种信息研究，常青类型的内容，那么这些是非常不同的意图。

[...]我们必须逐页查看它，而不是说，哦，这是一个研究网站，因为这里有一些研究内容”。

链接重定向

13:21 “我们看到人们正在链接到 [...] 我们的页面子类别。问题是 […] 我们的内容来来去去，这意味着有时，某些类别中会出现更多内容。有时，内容会被删除。因此子类别可以创建也可以消失。我们看到大量来自反向链接的推荐，因为它们链接到不再存在的子类别。我的问题是：是否可以将 [...] 这些链接重定向到父类别。如果我们这样做，我们如何做到这一点——例如 302？就像临时重定向一样，因为将来这个子类别可能会再次填充内容，[...] 这不是永久重定向”。

John 回应说：“因此，如果我们看到这种情况发生在更大的范围内，并且您重定向到父级别，我们可能会将其视为软 404。[...] 而不是 404 代码，您正在重定向，也许这就是对用户来说更好，但我们将其视为 404。[...] 如果从用户的角度来看重定向是有意义的，那么我会选择它。

[...] 关于 301 或 302，我认为这并不重要，因为我们要么将其视为软 404，要么将其视为规范化问题。如果是软 404，则代码无关紧要。如果这是一个规范化问题，那么它归结为我们在搜索结果中显示的 URL。而且通常情况下，更高级别的信号无论如何都会更强，我们将专注于更高级别的信号。因此，在这种情况下，是 301 还是 302 都没关系。

[...] 如果我们将其视为软 404，[...] 我们会减慢该特定 URL 的抓取速度，因为这里没有任何内容 [...]。如果我们将其视为重定向 [...]，我们不需要每天都抓取它，因为我们专注于主 URL。所以我认为在这两种情况下，我们都会放慢对该 URL 的抓取速度，直到我们得到新的信号来告诉我们，实际上，这可能又是新事物了。 [...] 这就像内部链接或站点地图文件 [...]。这将是我们再次爬行的更强信号。但我认为在所有这些情况下，爬行速度的放缓都是相似的。

[...]我认为仅 [更新] 站点地图可能还不够。 我真的会确保内部链接也很清晰”。

从核心更新中恢复

18:34 “所以大约一年前，我们看到流量显着下降。审核后，[…] 所有信号都表明该站点存在站点质量问题。我们能够在今年 2 月之前解决这些问题。到了 6 月的核心更新，我们看到了一些增长。但这仍然没有达到大约一年前下降之前的水平。所以我的问题是站点质量问题，如果是这样的话，这是我们可以预期的恢复吗，或者如果我们认为我们已经解决了所有已确定的问题，我们是否可以期待更多的恢复[...]？”

约翰说：“[……] 我们不会认为这是一种你必须解决问题的情况。而是 [...] 如果您致力于提高网站的相关性，那么 [...] 您将拥有一个更好的网站。所以这并不是说 [...] 我们会将其更改回之前的状态。 [...] 它与以前不同或不相似，因此期望它更改为之前的状态会有点棘手 [...]。

[…]通过核心更新，我们不再关注个别问题，而是关注网站整体的相关性。 这可能包括可用性和页面上的广告等内容，但它本质上是整个网站。通常，这也意味着内容的焦点、呈现事物的方式、向用户明确内容背后的内容的方式，例如来源是什么 […]。 如果您真的希望 Google 将您的网站视为更好的东西，您可能还需要在内容方面工作。

[...] 想想哪里可能有低质量的内容，用户在访问我的网站时可能会感到困惑。我们可以通过技术问题和用户体验更改来解决这种混乱吗？还是我们真的必须改变我们呈现的一些内容？”

来宾帖子中的链接

28:24 “[...] 如果 [网站有] 访客帖子，而 Google 不知道它是否已付费，那么 Google 将如何确定 [他们应该] 获取此链接或销毁此链接？答案是什么，所以我们从各个角度都是安全的？”

根据约翰的说法，“[...]我们对链接和访客帖子的指导是，它们应该是禁止关注的。 [...] 我真的要注意确保链接不被关注，这样您就可以提高意识，您正在谈论您在做什么，您正在制作它以便用户可以访问您的页。但从本质上讲，它是为您的企业投放的广告。所以从这个角度来看，我只会让他们不关注”。

产品价格作为排名因素

32:25 “如果有两个竞争的电子商务网站销售完全相同的产品——一个网站以 500 美元的价格提供产品，另一个以 100 美元的价格提供产品，那么所有 SEO 信号都是相同的。价格较低的网站是否会有更好的排名机会，因为完全相同的产品存在如此大的价格差异？”。

约翰说：“所以纯粹从网络搜索的角度来看，不。我们不会尝试识别页面上的价格并将其用作排名因素。因此，我们不会说我们会选择更便宜的并排名更高[...]。

但是，其中很多产品也以产品搜索结果的形式出现，这可能是因为您提交了提要，也可能是因为我们识别了这些页面上的产品信息。还有产品搜索结果，不知道是怎么排序的。可能是他们考虑了价格或可用性等因素[...]。

所以从网络搜索的角度来看，我们不考虑价格。 从产品搜索的角度来看，这是可能的。 我认为棘手的部分是，作为 SEO，搜索的这些不同方面通常组合在一个搜索结果页面中，您会在其中看到正常的网络结果，也许您会在旁边看到一些产品结果，或者也许你会看到一些混合的[…]”。

在站点地图之间移动 URL

34:04 “如果我们有 200 个站点地图文件，并且每周有 20% 到 30% 的 URL 从一个文件跳转到另一个文件，那会有多糟糕？还是我们应该永远严格地将我们的 URL 保存在同一个文件中？”

“[...]我们的建议通常是在同一个站点地图文件中保留相同的 URL 。 主要原因是我们以不同的速率处理站点地图文件。因此，如果您将一个 URL 从一个站点地图文件移动到另一个，可能是我们的系统中有来自多个站点地图文件的相同 URL。如果您对这个 URL 有不同的信息——例如不同的更改日期——那么我们将不知道实际使用哪个属性。

所以从这个角度来看，如果你总是把它放在同一个站点地图文件中，那么我们就更容易说，哦，我们在这里有这个 URL 的信息，我们可以相信这些信息，因为它只在那里。所以这就是我试图避免 [...] 这些 URL 随机移动的地方。但与此同时，它通常不会中断对站点地图文件的处理。而且它绝对不会对您的网站产生排名影响。 所以在我们的站点地图系统中没有任何东西可以映射到网站的质量”。

多区域内容

38:13 “我在新闻垂直行业工作。我的团队正在寻求扩大我们的国际影响力，并已完成建立多区域子目录的工作。在大多数情况下，不同多区域版本的页面看起来是一样的。主页和部分页面（如政治或生活方式）将具有相似的内容，但会减去该地区独有的一些内容。

文章很棘手。在具有相关链接的模块之外，我们无法区分多区域子目录，这让我们担心重复内容问题。 Google 如何处理新闻空间中的重复内容？ [...] 内容保持不变，但模板的元素不同。所有多区域网站都应该只有一个规范吗？”

John 的回答是：“[…] 听起来这些是同一个国家的不同地区，而且是相同的语言内容。 […] 如果这些是不同的国家，那么你就有了地理定位方面的问题，如果这些是不同的语言，它就会发挥作用。因此，如果你在欧洲工作，并且覆盖德国、法国、意大利或其他地方，那么你也会有不同的语言。

[...] 但是，如果您在同一个国家/地区谈论相同的语言内容，那么 [...]会更容易一些，因为您不必担心所有这些技术联系。但另一方面，重复内容问题更加明显。而当涉及到重复内容时，像这样的网站上的棘手方面是你最终最终会与自己竞争。如果您在 [...] 五六个不同的区域网站上发布一篇新闻文章，那么所有这些不同的区域网站都会尝试对完全相同的文章进行排名。这可能会导致该文章的排名不如其他情况。

因此，我建议尝试为这些单独的文章找到规范的 URL，这样你就可以真正地说‘好吧，我在我的五个区域网站上有一篇文章，但这是我希望看到的首选版本搜索'。然后我们可以将所有的精力、所有的信号集中在一个更喜欢的版本上，我们可以尝试对那个版本进行更好的排名。它不必总是相同的版本。因此，绝对可以有一篇新闻文章在一个区域内是规范的，而另一篇新闻文章对于另一个区域更规范。如何选择哪个区域作为规范完全取决于您。 [...] 通常，您会尝试找出最相关的地方，然后选择那个作为规范版本。这是针对个别文章本身的。

对于类别、部分和主页，似乎内容更独特，更具体到各个地区。因此，我会尝试将这些索引级别分开。因此，如果您有五个不同的区域网站、它们的主页、它们的类别部分，它们都会被单独编入索引。新闻文章本身将映射到这些不同区域之一。这就是我们推荐的一种方法 […]。

这种方法也 [...] 适用于不同的域名。因此，如果您在各个地区有不同的域，但它们都是同一个新闻组的一部分，您仍然可以在不同版本之间进行这种规范转换。如果您在具有子目录的同一域中执行此操作，那也很好”。

网站移动中的重定向

44:34 “当您必须 301 将所有 URL 重定向到一组新 URL 时，最好的做法是什么？页面数量将超过一百万，您想最小化沙盒效应吗？如果有沙盒效应，能持续多久？我们会失去可能永远无法恢复的排名吗？我们计划进行一对一重定向，并已请求批量重定向，但这是不可能的，因此页面、图像、URL等必须同时翻转”。

正如 John 所说：“对我来说，这听起来像是传统的网站迁移情况。您从一个域移动到另一个域，并将所有 URL 从旧站点重定向到新站点，我们必须处理这个问题 […]。 在站点移动方面，我们绝对没有任何定义为沙盒效应。 因此，如果您必须进行站点移动，请进行站点移动，并重定向您的所有页面。通常最简单的方法就是一次重定向所有页面。我们的系统也对此进行了一些调整，以尝试识别这一点。因此，当我们看到一个网站开始将所有页面重定向到不同的网站时，我们会尝试更快地重新处理它，以便我们可以尽快处理该网站的移动。 我们绝对不会说，哦，他们正在做一个网站迁移，因此，我们会放慢速度[...]”。

API 和爬取预算

46:13 “我有一个网站，它连接到客户端的 API 以获取数据。这些网址是否包含在抓取预算中？如果您禁止这些 URL，[...] 会产生任何问题吗？”

“[...] 如果在呈现页面时包含这些 API，那么是的，它们将包含在抓取中，并且它们将计入您的抓取预算，本质上是因为我们必须抓取这些 URL 以呈现页面。如果您希望它们在渲染期间不被抓取或不使用，您可以通过 robots.txt 阻止它们。如果您喜欢这样做，完全取决于您。尤其是如果您有一个维护成本高或占用大量资源的 API，那么有时这是有道理的。

我想，棘手的部分是，如果您禁止抓取您的 API 端点，我们将无法使用有关 API 返回的任何数据进行索引。因此，如果您的页面内容纯粹来自 API，并且您禁止抓取 API，我们将不会有该联系人。 [...] 如果 API 只是对页面做一些补充，比如绘制地图或 [...] 您在页面上拥有的数字表格的图形，[...] 那么也许该内容是否是无关紧要的'不包含在索引中。另一件事是，有时，当 API 被阻止时，页面的运行方式并非易事。特别是，如果您使用 JavaScript 并且 API 调用因为 robots.txt 而被阻止，那么您必须以某种方式处理该异常。并且根据您在页面上嵌入 JavaScript 的方式、您对 API 所做的操作，您需要确保它仍然有效。因此，如果该 API 调用不起作用，然后页面的其余部分渲染完全中断，那么我们就无法索引太多，因为没有任何东西可以渲染。

但是，如果 API 调用中断，我们仍然可以索引您页面的其余部分，那么这可能非常好。 [...] 我认为如果您为其他人运行 API 会比较棘手，因为如果您不允许抓取，那么您就会产生这种二阶效应，即其他人的网站可能依赖于您的 API。取决于你的 API 做什么，突然间，他们的网站没有可索引的内容。他们甚至可能没有注意到，因为他们没有意识到你突然在那里添加了一个不允许。这可能会导致类似的间接影响 […]”。

JavaScript 和谷歌缓存

49:36 “所以有两个页面来自同一个域。 URL 有点不同，它是相同目录结构的一部分。而且 [...] 它们是由 NextJS 生成的。所以 NextJS 是一个服务端渲染的 React 框架。它们正在被索引，但我在 Google 缓存中看到一页，而第二页不在 Google 缓存中。无论我如何生成页面 [...]，我都会看到相同的模式。我的大部分页面都在 Google 缓存中，但现在我很担心，因为我目前正在从生成所有这些页面的基于 Java 的技术堆栈转移到 Google NextJS。 [...] 当我调试时，我发现这也是我们使用的旧 Java 堆栈的问题。

所以问题是两个部分。基本上，为什么会有这种行为？其次，这种行为会影响我的排名吗？我看到那些出现在搜索结果中的页面不在 Google 缓存中”。

John 回答：“[...] 缓存页面与我们索引的内容完全分离。所以有没有缓存页，排名都无所谓，索引也无所谓。 有时，我们没有缓存页面是有技术原因的。有时，我们只是没有单个 URL 的缓存页面。另一件事是，如果页面使用 JavaScript 框架，那么 JavaScript 是否在缓存页面上运行有时会很棘手，因为缓存页面托管在 Google 域上。根据您拥有的 JavaScript 类型、将 JavaScript 文件拉入的位置，有时 JavaScript 无法在 Google 域上运行。

[…] 缓存页面不是渲染页面。它本质上只是我们请求的 HTML 文件，以及它的副本。如果 HTML 文件显示了某些内容，那很好。如果它使用 JavaScript，并且 JavaScript 因为它是缓存页面而无法运行，那同样可以。您只是在缓存页面中看不到它。所以如果缓存页面没有显示，我不会担心。这不是任何问题的迹象。通常，[...] 你无法控制是否有缓存页面。我会忽略这一点”。

https://www.youtube.com/watch?v=Vd0rEQrwHDc