Canonical标签:最佳实践、常见错误及其对 SEO 的影响

Publicat: 2022-07-29

任何 网站 都 可能 出现 重复 内容 问题 问题 问题 即便 即便 您 可能 不 知道 您 的 某些 内容 被 视为 重复 内容。 此时 , , 标签 可 让 您 指定 多 个 首选 重复 页面 中 的 哪个 是 页面 的 主要 、 首选 首选 版本。 中 的 的 哪个 是 页面 的 主要 、 首选 首选 版本。。 中 的 哪个 是 页面 的 主要 、 、 首选 版本。。 中 的 的 哪个 页面 页面 的 主要 、 首选 首选 版本。。

如果没有Canonical规范标签,搜索引擎将自己选择规范版本。而且,它们很可能会选择一个不具有代表性的页面。这会严重影响您的搜索可见性和排名。

在 这 篇 文章 中 , 我们 将 解释 什么 是 是 规范 规范 标签 、 什么 时候 应该 使用 使用 、 如何 正确 使用 使用 , , 以及 使用 使用 时 时 需 避免 的 常见 错误。。。。。

Canonical标签

Navigare rapidă

  • 一、什么是Canonical标签?
  • 二、搜索引擎和重复内容
  • 三、为什么规范标签很重要?
  • 四、何时应该使用规范标签
  • 五、如何向页面添加规范标签
    • 1. rel=canonică <link> 标记
    • 2. rel=HTTP canonic 标头
    • 3. 站点地图
    • 4.在CMS中添加规范标签
  • 六、Google 如何选择规范页面?
  • 七、使用规范标签的最佳实践和常见错误
    • 1) 不要直接删除非规范版本
    • 2)使用绝对 URL
    • 3)向搜索引擎发送明确的信号
    • 4)表面创建链式或交叉式规范
    • 5)确保在内链使用的是规范URL
    • 6)选择正确的域版本
    • 7)针对桌面版网址和移动版网址的注释
    • 8)规范标签 & Hreflang
  • 八、如何检查规范标签
    • 1. 右键查看网页原始代码
    • 2. 使用Google Search Console检查
    • 3. 使用网络爬虫工具
  • 总结

一、什么是Canonical标签?

Canonical标签是一段代码,当该页面存在多个版本时,它指示页面的主要(规范)版本。使用规范标签,您可以告诉搜索引擎应该将哪个 URL编入索引并出现在搜索结果中。

实现规范标签的最常见技术是将link rel=”canonical”代码片段添加到页面的 HTML 中,例如:

 <link rel="canonical" href="https://example.com/sample-page/" />

该代码表示​​规范页面是上述指定的 URL。

规范标签主要用于解决重复内容问题——但搜索引擎是如何判断哪些决重复内容问题——但搜索引擎是如何判断哪些决重哪些内容是隅容昍皅容昍

二、搜索引擎和重复内容

重复内容的问题源于一个简单的事实,即搜索引擎爬虫查看页面的方式悈的方式渎事实

对于搜索引擎爬虫,以下每个 URL 都不同:

  • http://example.com
  • https://example.com
  • https://example.com/index.php
  • http://example.com/index.php
  • http://www.example.com

当 用户 在 上面 每 个 页面 看到 相同 的 内容 时 , 爬虫 却 将 每 个 url 地址 视为 一 个 单独 的 实体 , 即使 多 个 页面 具有 相同 的 内容。。。

对于 电子 商务 网站 来说 , 重复 内容 问题 往往 特别 严重。 但 重复 内容 的 问题 不仅 限于 电商 网站 , 许多 现代 网站 会 自动 将 标签 和 参数 添加 到 内容 导致 重复 内容 的 产生。 以下 是 产生 重复 内容 最 重复 重复 内容 的 产生。 以下 是 是 产生 重复 内容 最 重复 重复 内容 的 产生。 以下 是 产生 重复 内容 最 重复 重复 内容 的 产生。 以下 是 产生 重复 内容 最 重复 重复 内容 ”的原因:

1. 为了支持多种设备类型:

 https://example.com/guide/google-seo https://m.example.com/guide/google-seo

2. 为了启用搜索参数或会话 ID 等所需的动态网址:

 https://www.example.com/products?category=dresses&color=red https://www.example.com/dresses/red/reddress.html

3. 当您将同一篇博文同时放在多个版块中时,博客系统会自动保存多个网

https://blog.example.com/dresses/red-dresses-are-awesome/ https://blog.example.com/red-things/red-dresses-are-awesome/

4. 服务器已配置为针对 www/非 www http/https 和协议端口变体提供相同的内容:

 http://example.com/red-dresses https://example.com/red-dresses http://www.example.com/red-dresses http://example.com:80/red-dresses https://example.com:443/red-dresses

5.您在相应博客上提供的要转载到其他网站上的内容与这些网域中的原域中的原域中的原木閄原木閄原有到其他网站上的内容与这上提供的要转载到其他网站

https://news.example.com/red-dresses-for-every-day-155672.html(转载博文)

https://blog.example.com/dresses/red-dresses-are-awesome/3245/(原始博文)

无论基于何种原因,当搜索引擎遇到重复的内容时,它们很难做出决定:

  • 应该索引哪个页面,
  • 哪个页面应该为相关关键字排名,以及
  • 他们是否应该将排名信号合并到一个 URL 下,或者将其拆分到多个页面。

Google

三、为什么规范标签很重要?

重复 内容 是 一 个 复杂 的 主题 , 但是 当 搜索 引擎 抓取 具有 相同 (或 非常 相似) 内容 的 许多 许多 时 , 可能 会 导致 许多 许多 许多 问题。 而 通过 添加 规范 标签 , 您 可以 : :

1.指定应出现在搜索结果中的页面

搜索 引擎 旨 在 提供 最 佳 的 用户 体验 体验 体验 这 就 是 为什么 它们 很 少 会 在 搜索 结果 中 显示 多 个 版本 的 相同 内容。 规范 标签 让 您 有 机会 提高 最 具 代表性 的 页面 版本 版本 的 搜索 可 见 性 , , 具 的 页面 页面 版本 的 搜索 可 见 性 性 , ,这可以增加该页面的自然流量并转化为商业利益。

2.增强规范页面的排名信号

其他网站可能会链接到您网页的不同重复版本,从而稀释搜索引擎在排引擎在排吴的不同重复版本,从而稀释搜索引擎在排吴的排吴的不同重复版本

当 您 使用 规范 标签 时 , 您 告诉 搜索 引擎 应该 将 来自 其他 网站 的 链接 都 整合 至 规范 页面 从而 增强 规范 页面 的 排名 信号。 此外 , 同 网站 或 跨 网站 的 重复 内容 将 不 再 需要 在 搜索 引擎 中 争夺 重复 内容 内容 将 不 再 需要 在 搜索 引擎 中 争夺 重复 内容 内容 将 不 再 需要 在 搜索 引擎 中 争夺 重复 重复 内容 将 不 再 需要 在 搜索 引擎 中 争夺 ”排名或流量。

3.不鼓励抓取重复页面

如果 您 添加 规范 标签 , 则 搜索 引擎 不 太 可能 会 在 知道 它们 是 副本 的 情况 下 继续 抓取 这些 重复 页面。 这 是 一 个 让 您 的 规范 页面 被 更 有效 地 抓取 的 机会 机会 , 可以 对 对 您 网站 网站 有效 抓取 抓取 机会 机会 机会 这 可以 可以 对 您 您 网站 网站的索引状态产生积极影响。

四、何时应该使用规范标签

现在我们知道了规范标签对SEO的重要性了,那么应该在何时使用规范时使用规范时使用规范使用在规范标用规范标筋丄范标筋性了,那么应该在

1.修复网站常见的重复内容

如果您的网站存在以下问题,那么您需要添加规范标签。

  • 可以从不同的 URL 访问主页(例如 www.domain.com、domain.com、www.domain.com/index.html 等)
  • 可以使用或不使用尾部斜杠 (“/”) 访问页面
  • 可以不区分大小写访问页面
  • 内容以不同的版本呈现(例如印刷版、PDF 等)
  • 该 URL 在没有 SSL 加密的 HTTP 版本下仍然可用

2.产品过滤和分类

电子商务网站典型的过滤和排序选项通常被添加到 URL 的查询字符串——这会产生大量重复的内容。规范化过滤和排序页面将帮助您的规范版本排名更高,并防止搜索引擎不必要地抓取重复内容。

3. URL中的冗余参数

如果参数不用于跟踪、不能更改内容并且不向 URL 添加有意义的信息,则 参数对于页面可能是多余的。此外,它们可能会导致您的网站不能被充分抓取。

4.跟踪参数和会话 ID

跟踪参数可以跟踪活动或用户旅程,但它们不会更改页面的内容,因歌胷旅程,但它们不会更改页面的内容,因歌胷旅程

5.转载内容

转载 内容 意味 着 一 段 内容 在 另 一 个 网站 上 被 重新 发布。 实施 规范 标签 有助于将 作品 的 所有权 归 属于原始 发布 者 者。。

五、如何向页面添加规范标签

您有多种方法可以添加规范标签。以下我们介绍常用的4种。

1. rel=canonică <link> 标记

在 HTML 中添加规范标签是实现它的最常用方法。您可以将以下代码添加签是实现的最常用方法。您可以将以下代码添加签是实现它的最常用方法。您可以将以下代码添加签是实现它的最常用方法

<link rel="canonical” href="https://example.com” />

假设我们有三个重复的页面 – 页面A、B、C,我们决定选择页面A作为首选顂首选顂

页面A:https://example.com/page-a

页面B:https://example.com/page-b

页面C:https://example.com/page-c

在这种情况下,我们将相同的<link rel=”canonical” href=”https://example.com/page-a” />添加到页面A、页面B和页面B和面B和

注意此方法仅适用于 HTML 页面,因此如果您想规范化其他类型的文件,的文件,请佀HTTP

2. rel=HTTP canonic 标头

对于像 PDF 这样的文档,由于没有网页的 <head> 部分,因此无法在网页开头插入权威内容标签。碰到这种情况,您需要使用 HTTP 标头来设置权威页面。

例如,如果您通过多个网址显示某个 PDF 文件,可以返回 rel=”canonic” HTTP 标头,址显示某个 PDF 文件,可以返回”

 Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

注意:要使用此解决方案,您需要访问您网站的服务器。

3. 站点地图

您可以为您的每个网页选择一个规范网址,然后通过站点地图提交这些规范网址。您在站点地图中列出的所有网页都会被视为向系统建议的规范网页;Google 会根据内容相似度决定哪些网页是重复网页(如果有).

4.在CMS中添加规范标签

1 )在 WordPress中设置权威内容标签

您 可以 安装 yoast seo 插件 , 它 会 自动 添加 自 引用 权威 内容 标签。 若 想 要 设置 自 定义 权威 页面 , 请 使用 每 个 帖子 或 网页 上 的 „高级” 部分。。 每 个 帖子 或 网页 上 的 的 的 高级 ”部分 部分。。

2 )在 Shopify中设置权威内容标签

Shopify 自身 默 认为 产品 和 博客 添加 自 引用 权威 内容 标签。 若 想 要 设置 自 定义 权威 页面 , 您 可以 直接 编辑 模板 (.liquid) 文件。。。。。。。。。。。。。。。。。

3 )在 Squarespace中设置权威内容标签

与 Shopify 的情况一样, Squarespace 也会默认添加自引用网址。但是,如果想添加自定添加自定东添加自引用网址。但是,如果想添加自定义添定义添定义

六、Google 如何选择规范页面?

请务必注意,Googlebot 并不总是遵循您的规范标签 —— 它仅将您设置的规范标签觀标签觀标签

实际上,Google在选择规范版本时会 考虑许多其他页面因素。这些因素包括:

  • 重定向
  • 站点地图
  • URL结构
  • 内链和外链
  • HTTPS协议的使用

您可以用URL 检查工具来检查 Google 是否尊重您的规范标签或选择了不同的标签。

七、使用规范标签的最佳实践和常见错误

遵循 规范 标签 最 佳 实践 有助于 降低 搜索 引擎 将 错误 版本 的 页面 视为 首 选 页面 的 风险。 以下 是 我 对 规范 标签 的 一些 建议 :

1) 不要直接删除非规范版本

当 我们 发现 重复 内容 时 , 一些 人 可能 会 想 直接 删掉 重复 的 页面 或 内容。 问题 在于 , 有时 这些 重复 页面 已经 在 其他 地方 被 引用。 如果 您 直接 删除 这些 页面 , 用户 将 无法 通过 在 其他 直接 地方 删除 这些 , 用户 将 将 无法 通过 在 其他 地方 地方 删除 这些 , 用户 将 将 无法 通过 在 其他 地方 地方 删除 这些 , 用户 将 将 无法 通过 在 其他 地方 地方 删除 这些 , 用户 将 将 无法 通过 在 其他 地方 地方 ”内链或外链访问它们。

因此,如果您必须删除某些重复页面,最好先将它们301重定向至规范版本

2)使用绝对 URL

理论上,Google 可以识别相对 URL 和绝对 URL。但是,绝对URL不易出错且更易于更改。

换句话说,尽可能在规范标签中使用完整的 URL:

<link rel="canonical” href="https://example.com/sample-page/” />

而不要只包含 URL 路径:

<link rel="canonical” href="/sample-page/” />

3)向搜索引擎发送明确的信号

向搜索引擎发送明确的信号是指每页仅指定一个规范。例如您应该避免将某一个URL 指定为规范,同时又将这个URL 重定向到不同的URL。

4)表面创建链式或交叉式规范

确保仅对多个重复页面的一个来源进行规范化。例如,假设页面A、B、C、D是重复页面且是A是首选页面。那么,您不能在B页面设定A页面为规范URL,然后在 c 页面 又 将 b 页面 设 为 规范 url。 否则 , 搜索 引擎 可能 感到 困惑。 正确 的 方式 是 页面 a 、 b 、 c 、 d 都 将 页面 a 添加 为 规范 网址。。。

5)确保在内链使用的是规范URL

在 您 的 网站 上 添加 内链 时 , 请 确保 您 链接到 规范 url , 而 不 是 重复链接。 如 前所 , , 如果 更 强 的 信号 指向 另 一 个 重复 页面 , Google 可能 不 会 选择 您 设定 的 规范 规范 重复 , , Google 可能 不 会 选择 您 设定 的 规范 规范 重复 页面 , Google 可能 不 会 选择 您 设定 的 规范 规范 重复 页面 , Google 可能 不 会 选择 您 设定 的 规范 规范 url 。

6)选择正确的域版本

切换到 SSL 后,请务必不要在规范标签中包含任何非 HTTPS的URL,因为这会造为这会造成朴洚造成湶朷淏成湶総标签中包含任何非

7)针对桌面版网址和移动版网址的注释

Google 不 推荐 在 网站 设置 中 使用 单独 的 网址 , 因为 这样 难以 实现 和 维护。 但是 仍 有 好 一 部分 网站 的 桌面端 为 为 为 www.example.com , 在 移动 端 对应 的 地址 却 变成 变成 m.example.com .

这种情况下,您需要通过包含 rel=”canonic” 和 rel=”alternativ” 元素的 <link> 标记表明两个网坴个网廴鳴个网元素的

  • Googlebot
  • 在移动版网页上,添加指向相应桌面版网址的 rel=”canonic” 标记。

例如,在桌面版网页 (http://www.example.com/page-1) 上,添加以下注释:

 <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/page-1">

在移动版网页 (http://m.example.com/page-1) 上,所需的注释应为:

 <link rel="canonical" href="http://www.example.com/page-1">

8)规范标签 & Hreflang

尽管 Google 不会将翻译成其他语言的相同内容的不同版本视为重复,但您仍应使用规范标签。如果您在同一个多区域网站的不同网址上以同一种语言提供类似内容或重复内容(例如 , 如果 exemplu.fr/ 和 exemplu.com/fr/ 都 显示 类似 的 法语 内容) , 则 设定 一 个 首选 版本 , 然后 使用 rel = ”canonic” 元素 和 和 hreflang 标记 确保 向 搜索 用户 提供 正确 的 语言 或 或 区域 区域 区域网址。

八、如何检查规范标签

Canonical Tag添加完成后,别忘了检查是否添加成功。这里我们提供了3种检查方法。

1. 右键查看网页原始代码

步骤1 在浏览器中打开您要检查的页面

步骤2 右键单击页面中的任意位置,并选择„Inspect”或„Vizualizare sursa paginii”,您将能看到页面朋到页面朋到页面皜戰页面皜

步骤3 按 Ctrl + F(Windows)或 F + comandă(Mac)。然后在按字符串、选择器或 XPath 的查找中查找中在按字符串、选择器或

步骤 4 „Canonical” 一 词 将 出现 并 突出 显示 为 黄色 , 您 可以 检查 该 规范 标签 是否 正确。 如果 未 出现 任何 , 则 则 表示 该 页面 未 设置 规范 规范 标签。 , , 则 表示 该 页面 页面 未 设置 规范 标签 标签。 , , 则 表示 该 页面 页面 未 设置 规范 标签 标签。 , , 则 表示 该 页面 未 未 设置 规范 标签 标签。

右键查看网页原始代码

2. 使用Google Search Console检查

Google Search Console 包含一些有用的工具来价差您的规范页面:索引覆盖率报告和 URL 检查。

2.1.覆盖率报告

Consola de căutare Google 中 的 覆盖率 报告 是 关于 您 的 页面 页面 是否 被 收录 的 重要 来源 来源 来源 哪些 哪些 哪些 url 已 编入 , 哪些 url 未 被 编入 索引 , 以及 原因 原因。。。。。。。。。。。。。。。。。。。

要分析您网站的规范化网址,请导航到排除类别,您将看到以下一些以下一些下到排除类别,您将看到以下一些以下一些下帀些与帀些与觅的纛与规的

1 )重复网页,网址已提交但未被选为规范网址

这意味着Google 在您的 XML 站点地图中发现了它并认为它是重复页面。

2 )备用网页(有适当的规范标记)

标有 此 状态 的 url 表示 Google 尊重 您 的 url 规范化 的 网页。 如果 您 最近 对 某些 页面 进行 了 规范化 , 则 可以 预期 这些 url 的 数量 会 增加。。。。。。。。。。。

3 )重复网页,Google选择的规范网页与用户指定的不同

该状态表明Google 忽略了您选择的规范化网址,而自行选择了另一个页面。

规范网页

2.2.网址检查工具

您可以使用网址检查工具进一步调查 Googlebot如何查看从索引中排除的网址具进一步调查 您可以使用网址检查工具进一步调查

  • 上次抓取日期– Googlebot上次抓取页面的时间。如果最近添加了规范标签,那么迃规范标签,那么 桵面的时间。如果最近添加了规范标签,那么远倷倷乏衵面的时间最近添加
  • 用户声明的规范– 这应该显示您选择的 URL – 检查它是否是正确的 URL。
  • Google选择的规范– 如果 Google 选择了不同的规范页面,您可以看到选择了哪个 URL。

3. 使用网络爬虫工具

您可以使用类似Screaming Frog的工具帮助您发现规范标签的问题。 这些工具可以为您提供有关规范与非规范页面比率的详细信息。它们也会提示您任何不正确的规范页面。

总结

添加规范标签可以让您告诉搜索引擎哪个URL是重复内容的最佳版本。它可以帮您节省抓取预算、将权重集中到最重要的页面、并最大可能地将您想要的版本出现在搜索结果中。

虽然Google不必然会选择您设定的规范页面,但大部分情况,Google会尊重您的选择。但是,添加Canonical 标签的过程中,容易出现各种各样的错误,使您添加的标签无效。因此,请阅读并遵循本文的最佳实践进行。