SEO 办公时间,2021 年 12 月 10 日
已发表: 2021-12-14这是2021 年 12 月 10 日Google SEO Office Hours与John Mueller的最有趣问题和答案的摘要。
网站停机时间与排名
04:17 “我客户的一个网站将关闭一两周。 [...] 我如何告诉 Google 这是暂时的情况? [...] 我可以告诉谷歌这个网站目前已经关闭,但它会在两周或一周内恢复正常吗? 但不应该有任何排名损失,或者我可以获得的最低排名损失?”
约翰回答说:“我认为你在那段时间做不到,不管你做了什么。 因此,对于大约一天左右的中断,使用 503 结果代码是告诉我们应该检查的好方法。 但是几天后,我们认为这是一个永久的结果代码,我们认为您的页面刚刚消失,我们会将它们从索引中删除。 并且当页面返回时,我们会再次抓取它们,并且我们会尝试再次对其进行索引。 但是 [...] 在那段时间里,我们可能会从我们的索引中删除网站上的很多页面。 而且很有可能它会以类似的方式回来,但并不总是有保证。
所以任何时候你有更长时间的停电,我想不止几天,我会假设至少暂时,你会有非常强烈的波动,并且需要一点时间才能恢复。这并非不可能,因为这些事情有时会发生。 但是,如果您可以采取任何措施来避免这种中断,我会尽力做到这一点。 这可能类似于在某处设置网站的静态版本,并暂时向用户展示。 但特别是如果你有计划地这样做,我会尽可能想办法将停电时间减少到不到一天。”
304 响应代码与爬行
11:48 《你觉得304响应码会影响爬取吗? 因为从逻辑上讲,如果 Googlebot 检查具有相同内容的 URL,并且它第一次返回 304 代码,那么 Googlebot 可能会减少对相同 URL 的抓取,因为它返回 304 代码。”
约翰说:“我认为有两件事。 因此,我认为 304 是对“If-Modified-Since”请求的响应,Googlebot 试图查看此页面是否已更改。 我的理解是304 响应代码不适用于抓取预算方面的事情。 所以这对我们来说意味着,我们可以重用该请求并在网站上抓取其他内容。 所以有这个方面。
另一方面,关于少抓取特定 URL 的问题,我认为情况并非如此。 但是我们确实会尝试弄清楚页面更改的频率,并尝试根据假设的页面频率或我们拥有的更新频率重新抓取页面。 因此,特定 URL 的抓取频率并没有那么高。 我们更了解这些页面的更改频率。 然后在此基础上,我们可以稍微更新或刷新爬虫。”
13:29 “所以如果网站上的大部分页面返回 304,那么这可能是向 Googlebot 发出的信号,表明该网站没有新的更新内容,[并] 降低抓取速度?”
约翰:“不,我不这么认为。 我不认为我们会降低抓取速度。 我们会尝试更多地关注我们确实看到更新发生的部分。 所以我不会人为地隐藏 304,希望它能改善爬行。”
来自移动设备与桌面的抓取请求
14:06 “由于我们的抓取速度恢复正常,我们注意到来自智能手机的抓取请求的恢复速度比桌面设备快得多。 你能解释一下吗?”
约翰回答说:“我不知道。 这听起来就像移动优先索引所期望的那样,我们在移动设备上爬得更多。 我不知道您的特定网站是否已经转向移动优先索引,但这很正常,我们使用移动设备抓取的次数更多,然后您会更快地看到那里的任何变化。”
已发现/已抓取‒当前未编入索引的报告
26:12 “我们正在被发现 - 目前未编入索引而不是已抓取 - 目前 99% [页面] 未编入索引。 我们应该区分这两者吗? 因为我们的网站不是那么大,在我看来这不是抓取预算问题。 在那种情况下,这两个名称是否几乎相同,只是质量问题?”
约翰回答说:“我不知道你们的网站,所以我很难随便说。 但是,如果您看到已发现、[‒ 目前] 未编入索引的报告中列出了干净的 URL,本质上是您确实希望编入索引的 URL,那么听起来这不是谷歌无法解决的问题去抓取那么多网址。 因为,再一次,有 25,000 个页面,大多数大小合理的服务器都可以轻松地定期进行爬网。 这可能更多地取决于我们对整体网站质量的理解。
对于较大的网站,或者如果在已发现,[‒ 目前] 未编入索引的报告中,您会看到 URL 有许多不同的变体,例如带有参数或大小写,[...]这可能表明内部链接很混乱,我们无法找到要抓取的正确 URL。 但是,如果我们在已发现、[‒ 目前] 未编入索引的报告中显示正确的 URL,并且它是一个相当小的网站,那么对我来说,这更多地指向整体网站质量的方向。”

27:54 “所以你认为我们应该尝试在其中添加文本吗? 我们展示的是公司目录,我们展示了股票价格对于该公司未来增长的意义。 所以这是一个数字,但没有很多可读的文本与之配套。 [...] 我们确实有描述,但对所有这些公司来说都是通用的,如果我们要为每个公司挤入独特的文本,我们必须弄清楚该怎么做。 但我们应该朝那个方向前进,你觉得呢?”
约翰:“我认为文本不会影响我们索引页面的方式。 因此,从这个角度来看,如果您看到影响用户如何查看您的页面并能够与您的页面交互的文本,然后确定。 但这更多的是试图弄清楚用户正在寻找什么以及您可以在哪里为您的用户提供独特的价值。 但只是在页面中添加文本——我认为 [that] 不会影响我们如何抓取和索引这些页面。
如果是你提供数字的地方,比如那里的股票号码,那我也会试着弄清楚你能做些什么来确保你提供的东西是独一无二的,并为用户提供价值。 做一些可能类似于用户研究的事情来弄清楚,我们可以做些什么来制作我们的网站,以便用户也将其推荐给其他人? 从用户的角度来看,它的建立几乎就像,我不知道,信任或其他东西。 很多时候,这些并不是你在网站上改变的纯粹技术性的东西,你改变一个设计,或者你将一些数字转换成文本,例如。 这是网站整体设置的问题。”
m-dot 网站的索引
30:20 “谷歌在索引子域上有移动版本的网站时是否有任何问题? 例如,example.com 和 m.example.com?”
John 说:“从我们的角度来看,至少据我所知,我们对 m-dot 域没有任何问题,因为这是我们为移动网站提供的支持格式之一. 我们不推荐使用 m-dot 设置。 因此,如果您要建立一个新网站,我会尽量避免这种情况,而是使用响应式设置,但这是可行的。
因此,如果您经常在您的网站上看到我们无法正确索引您的移动内容,那么对我来说,这将更多地指向您网站上的问题,当移动 Googlebot 尝试抓取时,它无法按预期访问所有内容。 所以这就是我要去那里尝试清理它的方向。
有时使用 m-dot 域让人们失望的一件事是移动优先索引,我们切换到 m-dot 版本作为规范 URL,并且可能会在桌面搜索结果中显示 m-dot 版本也是。 因此,您不仅需要注意将移动用户从桌面重定向到移动版本,还要注意将桌面用户从移动重定向到桌面版本。
再说一次,[...] 如果您有响应式设计设置,则不必担心。 因此,如果可能的话,这是另一个做出响应的理由。”
处理过时的博客
41:03 “我们有大约 450 个博客,其中一些已有四到五年的历史,因此已经过时,几乎没有流量。 您是否建议删除它们,因为它们会损害我们的一般搜索排名? 最好的方法是:一次删除所有没有流量并在谷歌请求删除索引,或者你推荐一步一步的方法?
约翰回答说:“我认为对于博客,您可能是指博客文章,即单个页面,而不是整组页面。 因为我认为如果你有这么多不同的页面集,那可能是一个更大的变化。 但是有 450 页,[...] 你说,嗯,这些不会有很多流量,我应该删除它们还是不删除它们? 从我的角度来看,这可能是您可以自己拨打电话的地方。 我不认为从 SEO 的角度来看,除非这些是糟糕的博客文章,否则您会看到重大变化。
但是,我要注意的主要事情是,仅仅因为某些内容没有很多流量并不意味着它是一个糟糕的内容。 这可能意味着它很少获得流量,也许一年一次,也许是非常季节性的。 总体而言,当您从网站的角度来看它时,它并不是很相关,但它可能在圣诞节之前很相关,例如。 所以从这个角度来看,我会说浏览一个网站并找出你想要保留哪些部分以及你想要清理哪些部分是很好的。 但只是单纯地看流量来确定你想清理哪些部分,我认为这太简单了。
但同样,从 SEO 的角度来看,从更大的网站中删除 450 个页面,这是一个很小的变化,我不会担心你什么时候这样做以及你是如何做到的。 只要您发现它们不再有价值,就删除它们。 一次全部删除,这也是一种选择。
关于在 Search Console 中使用删除工具提交它们,这可能不会改变任何内容,因为Search Console 中的删除工具会在搜索结果中隐藏页面,它不会从索引中删除任何内容。 所以这是你不必做的一件事。 但同样,否则,我会考虑您要保留哪些页面,要删除哪些页面,然后像这样浏览它。”
新文章的索引问题
54:55 “我有一个小网站,只有几百个 URL。 […]而且它已经进行了很长时间。 突然,在 11 月,已发表的文章不再被索引,而不是全部。 […] 我们坐在那里,看到 Google 正在抓取它们或发现它们 […]‒ 但 [它们] 没有被索引。 所以我尝试了一切:我查看了技术问题,链接很好。 所以我的问题是,谷歌是否有一种范式转变,嗯,谢谢你发表这些文章,但我们现在不想要它? 这是最近发生了变化的新事物吗?”
根据约翰的说法,“不是真的,至少不是我所知道的。 我的意思是,我认为我现在看到的关于索引问题的很多内容是从技术角度来看的,网站很容易制作出可以正常工作的网站。 您设置了 WordPress,然后基本上所有的 SEO 都是为您完成的。 从我们的角度来看,这意味着很少会出现没有被索引的页面的技术问题。 这意味着我们获得的所有内容在技术上基本上都是可以的,而且我们的系统必须对网站的整体质量、我们获得的内容的质量更加关键。 此外,在 Search Console 中,我们还会为您提供所有信息,例如已发现、[- 当前] 未编入索引或已抓取、[- 当前] 未编入索引。 然后突然间你看到所有这些问题,这似乎是人们必须解决的问题。 从这个角度来看,对我们来说,获得更多这些索引问题是很正常的,因为很多内容都可以,我们仍然无法索引网络上的所有内容,所以我们必须在某个地方剪一下。”
