如何在 Google Search Console 中修复“重复,Google 选择的规范与用户不同”
已发表: 2022-02-11许多网站未能以对 SEO 友好的方式优化其重复内容。 事实上,根据Tomek Rudzki 的研究,与重复内容相关的状态是各种规模网站的 Google Search Console 中第二常见的问题。
一个普遍的重复内容搜索引擎优化问题是当谷歌不同意用户在哪个页面版本是主要版本时。 在这种情况下,您可能会在 Google Search Console 中看到“重复,Google 选择了与用户不同的规范”状态。
以下是 Google 文档中关于“重复,Google 选择了不同于用户的规范”的内容:
此页面被标记为一组页面的规范,但 Google 认为另一个 URL 可以更好地规范。 谷歌已将我们认为规范的页面编入索引,而不是这个页面。 我们建议您将此页面明确标记为规范 URL 的副本。 此页面是在没有明确的爬网请求的情况下发现的。 检查此 URL应显示 Google 选择的规范 URL。来源:谷歌
Google 将与您预期不同的内容编入索引的后果因具体情况而异。 最严重的一种是通过向用户显示结果来阻止用户访问或停留在您的页面上,例如,缺少您首选版本中存在的基本信息。
本文介绍了“重复,Google 选择了与用户不同的规范”状态的可能原因和解决方案。
您在哪里可以找到“重复,Google 选择了与用户不同的规范”状态?
您可以在 Google Search Console的索引覆盖率报告中检查您的页面状态。
指数覆盖率报告包括四组问题:
- 错误,
- 警告有效,
- 有效的,
- 排除。
“重复,Google 选择了与用户不同的规范”属于排除类别。 排除的 URL不会被编入索引,Google 认为这不是一个错误。
单击详细信息部分中的状态后,您可以看到报告“重复,Google 选择的规范与用户不同”的 URL 列表。

该列表可用于导出,但有 1000 个 URL 限制。 但是,如果您有多个站点地图,则可以分别下载每个站点地图的报告并增加导出 URL 的数量。
如何检查谷歌选择哪个页面作为规范页面?
“重复,Google 选择了与用户不同的规范”状态不会向您显示 Google 选择了哪个页面。 您所看到的只是它与您想要编入索引的页面不同。
要查看 Google 选择的页面,您需要导航到URL 检查工具。
输入您要检查的 URL 后,您将看到许多不同的信息,包括Coverage 状态。 您可以展开此选项以查看 Google 选择的规范和用户声明的规范。
借助URL 检查 API,您现在可以每天使用 URL 检查工具批量检查多达 2000 个 URL,并在 JSON 文件中获取有关 Google 选择的规范的信息。
添加的 API 访问权限对于任何与 Google 选择与用户选择的标准不同的规范的人都非常有帮助。 如果没有 API,在大量 URL 样本上检查 Google 选择的规范非常耗时。
谷歌如何选择规范页面?
在我进入 Google 用来选择规范页面的方法之前,让我解释一下为什么 Google 必须确定哪些页面是原始页面:
首先,谷歌的指导方针指出,搜索引擎“努力索引和显示具有不同信息的页面。 ” 这就是为什么在遇到重复内容后,它会选择它认为对用户最有用的规范内容。 否则,用户将看到许多导致相同内容的不同结果。
其次,根据谷歌的文档, “复制的抓取频率低于规范页面”。 它允许 Google节省资源以抓取更重要的页面,并减少其在您的服务器上的抓取负载。
现在,让我们看看 Google 如何选择规范页面。
我们尝试通过遵循两个一般准则来选择规范 URL:首先,网站希望我们使用哪个 URL ; 那么,该网站的偏好是什么? 其次,哪个 URL 对用户更有用?资料来源:约翰·穆勒
Google 在确定规范版本时会考虑的一些信号包括:
- 规范标签,
- 站点地图,
- 内部链接结构,
- HTTPS over HTTP 协议,
- 更好看的网址,
- 重定向。
这些因素是您可以用来帮助 Google 了解您希望将哪个页面编入索引的提示。 但是,搜索引擎没有义务尊重它们。
规范标签
<link rel="canonical" href="https://example.com/original-page">规范标签是放置在 <head> 部分中的一段 HTML 代码。 它的 href 属性包括指向页面规范版本的链接。 如果有问题的页面是您内容的重复、非规范版本,您应该在 href 属性中放置一个指向规范版本的链接。
但您也可以添加自引用规范标签。 自引用页面包含一个规范标签,其 href 属性指向自身。 在Google 的 SEO Office Hours 期间, John Mueller 建议使用自引用规范标签,即使页面只有一个版本。
我建议使用这种自引用规范,因为它确实让我们清楚地知道您希望将哪个页面编入索引,或者当它被编入索引时 URL 应该是什么。即使您只有一个页面,有时也会有不同的 URL 变体可以拉出该页面。 例如,最后带有参数,可能带有大写小写或 www 和非 www,所有这些都可以使用 rel 规范标签进行清理。
资料来源:约翰·穆勒
站点地图
站点地图是简单的文本文件,列出了您作为站点所有者希望被编入索引的 URL。 它作为搜索引擎机器人的路线图,使它们能够快速找到有价值的 URL,而无需先爬取整个网站。
站点地图应仅包含规范网址。 将重复页面放入站点地图可能会浪费您的抓取预算(Google 可以并希望在您的网站上抓取的 URL 数量)并混淆搜索引擎。
但是,将 URL 放入站点地图并不能保证搜索引擎会索引该 URL。 这只是帮助他们了解您最关心哪些页面的提示。 在我们的 XML 站点地图终极指南中,您可以了解有关创建和优化站点地图的更多信息。
内部链接
页面链接在一起的方式有助于搜索引擎找到所有有价值的页面并确定它们的重要性。
页面越有价值,指向它的链接就越多。
让我们假设有两个同样有价值的页面。 其中之一仅从站点地图链接。 另一个很容易在导航中找到,并且有从网站上的其他页面指向它的链接。 在这种情况下,Google 假定带有链接的页面比仅在站点地图中找到的页面更有价值。
内部链接结构是称为网站架构的更复杂问题的一部分。 如果您想了解更多信息,我建议您阅读我们关于网站架构的详尽指南,其中详细解释了它是什么以及如何为您的网站设计一个完美的网站。
基于 HTTP 的 HTTPS
HTTP 是一种定义服务器和客户端之间数据传输的协议。 HTTPS 是协议的加密版本。 由于增加了安全层,数据传输更安全,数据被操纵的风险更小。

HTTPS 会影响您网页的排名。
如果您的网页同时可访问 HTTP 和 HTTPS 版本,Google 将选择索引 HTTPS 版本。
更好看的网址
URL 可以帮助用户和搜索引擎查看页面包含的内容。 作为网站所有者,您可以控制 URL 的外观。 正如约翰·穆勒 (John Mueller) 所说,如果多个 URL 指向同一页面,谷歌可能会选择“更好看的那些”。
更好看的 URL 到底是什么意思? 谷歌说“网站的 URL 结构应该尽可能简单”。
我们来看两个 URL 的例子:
- https://www.example.com/index.php?id_sezione=360&sid=sdr3bc
- https://www.example.com/summer/dress
第二个 URL 绝对“更好看”。 这是因为它更短,并且清楚地表明了该页面包含的内容。 如果您有兴趣了解有关 URL 结构的更多信息,我建议您阅读我们关于如何创建对 SEO 友好的 URL 的文章。
重定向
使用 301 重定向是合并站点上重复内容的方法之一。 如果用户或搜索引擎机器人访问一个页面,它会自动将他们重定向到一个新页面。
当您只希望页面的一个版本在您的网站上可用时,您可以使用它。 例如,如果您有 www 和非 www 版本,则可以使用 301 重定向来指定您应该保持可用并被索引的版本。
“重复,Google 选择了与用户不同的规范”状态的原因和解决方案
在某些情况下,选择与用户不同的规范 URL 可能不会带来任何后果。 如果两个页面相同,则 Google 选择的页面可能与您选择的页面一样好。
但很有可能,您选择规范页面是有原因的。 如果页面不相同,则 Google 选择的页面可能缺少一些重要细节,这可能会阻止用户访问您的网站。
因此,让我们看看 Google 可能会在规范版本和解决问题的方法上与您意见相左的可能原因。
由于各种原因,Google 可能会选择与用户不同的规范页面,包括:
- 信号不一致,
- 没有唯一内容的自引用规范标签,
- 渲染问题,
- 针对使用相同/相似语言的不同国家/地区。
不一致的信号
如“谷歌如何选择规范页面?”中所述章,您可以使用多种信号来指示哪一页是原始页面。 但是,如果您不一致地使用它们,它可能会混淆 Google 并导致它选择错误的 URL 来索引。
让我们想象一个有三个重复页面的情况:
- 所有页面都有指向页面 A 的规范标签,
- 页面 B 在站点地图中,
- 页面 C 有最多的内部链接指向它。
如果出现相互冲突的信号, Google 需要猜测哪一页是真正的规范页面。
你发出的信号越清晰,它们就越容易被信任:)。 例如,如果内部链接、站点地图、hreflang、rel-canonical 等都对齐,那就没什么好猜的了。 通常它非常不一致且难以选择。
- 约翰(个人)(@JohnMu)2018 年 2 月 28 日
解决方案
对于“重复,Google 选择与用户不同的规范”状态的原因有一个解决方案:保持一致!
以下是设置规范信号时要记住的一些提示:
- 避免在站点地图中放置非规范页面或带有重定向的页面,
- 确保您的内部链接是一致的,并且每个链接都指向规范版本,
- 规范标签应该指向最终版本,不要包含重定向到不同页面的页面,
- 避免规范循环(页面 A 有一个规范标签指向页面 B,页面 B 有一个规范标签指向页面 A)和规范链(页面 A 有一个规范标签指向页面 B,页面 B 有一个规范标签指向 C 页)。
没有唯一内容的自引用规范标签
如果您有多个带有自引用规范标签的页面,但 Google 认为它们不包含唯一值,则它可能只选择一个页面进行索引。
当多个产品具有相同的描述时,它通常发生在电子商务网站上。
如果您销售不同尺寸的相同床型,您可能希望对所有不同尺寸的页面进行索引,以便用户可以轻松找到他们正在寻找的内容。 毕竟,如果他们正在寻找一张特大号床,并且在搜索结果中只看到专为儿童设计的小床,他们可能会忽略您的页面,转而访问您的竞争对手的网站。
如果有人在您的页面上的此重复描述中搜索一段文本,那么我们会识别出这段文本是在您网站上的一堆页面上找到的,我们会尝试选择一个或两个页面从您的网站显示。资料来源:约翰·穆勒
解决方案
为您的页面添加独特的内容。
不要只依赖自引用的规范标签。 相反,请确保每个页面都具有唯一的值。
John Mueller 在Google 的 SEO 办公时间内解决了重复描述的问题。 他说你至少应该有一些额外的文字信息来表明产品是不同的。
[…]如果您的文本内容中根本没有任何内容涵盖您产品的视觉元素,那么我们就很难在搜索结果中正确显示这些内容。 […]所以这就是我在这里所采取的角度,可以复制部分描述。 但我肯定会确保你至少有一些东西,其中包含关于你所销售的那些单个产品所独有的视觉元素的文本。
资料来源:约翰·穆勒
渲染问题
搜索引擎在呈现 JavaScript 方面仍然不完美。 因此,如果您严重依赖它来显示您的内容,Google 可能会在查看您页面上的每个元素时遇到问题。
渲染对于 Google 和其他搜索引擎查看和理解我们网站的内容和布局至关重要。 没有渲染,您的内容就不会在线存在。 您只需查看网站的 HTML 代码即可查看您的内容的时代已经过去了。来源:渲染 SEO 宣言——为什么 JavaScript SEO 还不够
Google 可能会认为某些页面是重复的,因为它无法呈现使它们独一无二的内容。
假设您有三个独特的页面。 每个都有一个自引用的规范标签。 JavaScript 生成它们的主要内容,并且出于某种原因,Google 不呈现它。 相反,它只看到一个空白区域和一些附加元素,例如每个页面都相同的导航栏。 对于谷歌来说,这些页面看起来像是重复的,这就是为什么它只选择其中一个来索引。
您可以在 Google Search Console 的 URL 检查工具中检查 Google 如何呈现您的页面。 该工具提供了渲染页面的屏幕截图,让您可以深入了解 Google 如何看待您的页面。 如果屏幕截图中缺少您的内容,则表明渲染可能存在一些问题。
解决方案
首先,您应该确保 Google 可以访问所有必要的脚本。 确保您的 JavaScript 资源未被robots.txt (您可以创建该文件以指定可以抓取哪些页面)阻止。
如果 Google 可以访问您的资源,则需要评估脚本。 您应该考虑脚本大小等方面,以及是否需要全部来生成页面。
渲染 SEO 的主题很广泛,如果您没有编码经验,您可能需要开发人员的帮助来解决一些更复杂的问题。 有关更多信息,请访问我们的渲染 SEO 宣言,我们在其中详细解释了该主题。
针对使用相同/相似语言的不同国家/地区
如果您的网页定位到使用相同或相似语言的特定国家/地区(例如,美国和英国),Google 可能只选择其中一个进行索引。
假设您用来指示您使用相同语言针对不同国家/地区的唯一解决方案是作为精灵引用规范标签。 在这种情况下,Google 可能不了解其目的,并认为这些都是重复页面。 因此,它只会选择其中一个进行索引,您的用户可能会在他们的搜索结果中找到专门针对不同国家/地区的页面。
对于电子商务网站来说,这可能是一个特别大的问题,因为它可能导致客户无法购买。
解决方案
你应该始终确保你有hreflang 标签。
hreflang 标记是一段 HTML 代码,可帮助您指定页面目标的语言和国家/地区。
<link rel="alternate" hreflang=" en-gb " href="https://en-gb.example.com/item"> <link rel="alternate" hreflang=" en-us " href="https://en-us.example.com/item">
hreflang 标签不仅可以指定语言(en – 英语),还可以指定国家(gb – 英国,us – 美国)。
您可以做的另一件事是确保您的内容不仅被翻译,而且被本地化。 即使语言相同,不同的国家也有不同的文化。 确保为来自特定国家/地区的用户调整您的页面。 这种做法不仅可以为您的客户提供更好的用户体验,还可以让 Google 相信这些页面是独一无二的。
最后但并非最不重要的一点是,您应该有一个备份计划,以防上述技术失败。 创建一个基于用户位置显示的JavaScript 横幅。 如果它检测到,例如,英国用户输入了美国版本,它将建议更合适的版本,并让客户决定他们是要留下来还是访问为他们所在地区指定的页面。
“重复,Google 选择了与用户不同的规范”与“重复,提交的 URL 未选择为规范”与“没有用户选择的规范的重复”
“重复,Google 选择了与用户不同的规范”可能很容易与索引覆盖率报告中的两种不同状态混淆:
- “重复的、提交的 URL 未被选为规范”,以及
- “复制没有用户选择的规范。”
这些状态表示同一件事:该页面未编入索引,因为 Google 认为它不规范。
不同之处在于 Google 如何发现该页面以及用户是否声明了规范标签。
它们之间的主要区别在于“重复,Google 选择了与用户不同的规范”已经指定了 Google 没有选择的规范标签。 相比之下,其他两种状态没有用户定义的任何规范标签。
此外,您明确要求通过在您的站点地图中提交来将报告“重复,提交的 URL 未选为规范”的 URL 编入索引。
包起来
如果您看到“重复,Google 选择了与用户不同的规范”状态,并且您认为 Google 没有选择正确的页面进行索引,那么您可以采取一些措施来让您的首选页面获得最佳的索引机会:
- 在发送规范信号时保持一致:确保只有规范页面在您的站点地图中,并且内部链接指向它,
- 确保每个页面都有唯一的价值。 如果您的产品页面具有相同的描述,请添加表明产品不同的文字内容,
- 确保您的内容在 URL 检查工具中正确呈现,
- 不仅要翻译不同语言的内容,还要针对您定位的特定国家/地区进行本地化,
- 永远记得为针对多个国家的内容添加hreflang 标签。
