Canonical标签:最佳实践、常见错误及其对 SEO 的影响

Publié: 2022-07-29

任何 网站 都 可能 出现 重复 内容 问题 —— 即便 您 可能 不 知道 您 的 某些 内容 被 视为 重复 内容。 此时 , , 标签 可 让 您 指定 多 个 重复 中 中 的 哪个 是 页面 的 主要 、 版本。 页面 中 的 哪个 是 页面 的 主要 、 版本 版本。。

如果 没有 canonique 规范 标签 , 搜索 引擎 将 自己 选择 规范 版本。 而且 , 它们 很 可能 会 选择 一 个 不 具有 代表性 的 页面。这 会 影响 您 的 搜索 可 见性 和 排名。 这 会 严重 影响 的 搜索 可 见性 和 排名。

在 这 篇 文章 中 , 我们 将 解释 什么 是 Canonique 规范 标签 、 什么 时候 应该 使用 Canonique 、 如何 正确 使用 Canonique , 以及 使用 Canonique 时 需 避免 的 错误 错误。

Canonical标签

Navigation Rapide

  • 一、什么是Canonical标签?
  • 二、搜索引擎和重复内容
  • 三、为什么规范标签很重要?
  • 四、何时应该使用规范标签
  • 五、如何向页面添加规范标签
    • 1. rel=canonical <link> 标记
    • 2. rel=canonical HTTP 标头
    • 3. 站点地图
    • 4.在CMS中添加规范标签
  • 六、Google 如何选择规范页面?
  • 七、使用规范标签的最佳实践和常见错误
    • 1) 不要直接删除非规范版本
    • 2)使用绝对 URL
    • 3)向搜索引擎发送明确的信号
    • 4)表面创建链式或交叉式规范
    • 5)确保在内链使用的是规范URL
    • 6)选择正确的域版本
    • 7)针对桌面版网址和移动版网址的注释
    • 8)规范标签 & Hreflang
  • 八、如何检查规范标签
    • 1. 右键查看网页原始代码
    • 2. 使用Google Search Console检查
    • 3. 使用网络爬虫工具
  • 总结

一、什么是Canonical标签?

标签 是 一 段 代码 , 当 该 页面 存在 多 个 版本 时 , 它 指示 页面 的 (规范) 版本。 规范 标签 , 页面 主要 (规范)) 版本。规范 标签 , 可以 告诉 搜索 应该 应该 将 将 哪个 使用 标签 , 在 告诉 引擎 应该 应该 将 将 哪个编入 索引 并 在 结果 中 中 中 应该 将 将 哪个 编入 索引 出现 在 结果 中 中 中。。。

实现规范标签的最常见技术是将link rel=”canonical”代码片段添加到页面的 HTML 中,例如:

 <link rel="canonical" href="https://example.com/sample-page/" />

URL。

规范标签主要用于解决重复内容问题——但搜索引擎是如何判断哪些内容是重复的呢?

二、搜索引擎和重复内容

重复内容的问题源于一个简单的事实,即搜索引擎爬虫查看页面的方式与用户不同。

对于搜索引擎爬虫,以下每个 URL 都不同:

  • http://exemple.com
  • https://exemple.com
  • https://example.com/index.php
  • http://exemple.com/index.php
  • http://www.exemple.com

当 用户 在 上面 每 个 页面 看到 相同 的 内容 时 , 爬虫 却 将 每 个 URL 地址 视为 一 个 单独 的 实体 , 即使 多 个 页面 具有 相同 的 内容。

对于 电子 商务 网站 来说 , 重复 内容 问题 往往 特别 严重。 但 重复 内容 的 问题 不仅 限于 电商 网站 , 许多 现代 网站 会 将 将 标签 和 参数 添加 到 导致 重复 内容 的 产生。 以下 是 产生 内容 最 常见 重复 重复 内容 的 产生。 以下 产生 重复 内容 最 常见 常见的原因:

1. 为了支持多种设备类型:

 https://example.com/guide/google-seo https://m.example.com/guide/google-seo

2. 为了启用搜索参数或会话 ID 等所需的动态网址:

 https://www.example.com/products?category=dresses&color=red https://www.example.com/dresses/red/reddress.html

3. 当您将同一篇博文同时放在多个版块中时,博客系统会自动保存多个网址

https://blog.example.com/dresses/red-dresses-are-awesome/ https://blog.example.com/red-things/red-dresses-are-awesome/

4. 服务器已配置为针对 www/非 www http/https 和协议端口变体提供相同的内容:

 http://example.com/red-dresses https://example.com/red-dresses http://www.example.com/red-dresses http://example.com:80/red-dresses https://example.com:443/red-dresses

5 .

https://news.example.com/red-dresses-for-every-day-155672.html(转载博文)

https://blog.example.com/dresses/red-dresses-are-awesome/3245/(原始博文)

无论基于何种原因,当搜索引擎遇到重复的内容时,它们很难做出决定:

  • 应该索引哪个页面,
  • 哪个页面应该为相关关键字排名,以及
  • URL 下,或者将其拆分到多个页面。

这个时候,就需要给您在一组重复页面中,使用Canonical标签之处最具代表性的一个页面,帮助Google偋出邂

三、为什么规范标签很重要?

重复 内容 是 一 个 复杂 的 主题 , 但是 当 搜索 引擎 抓取 具有 相同 (或 非常 相似) 内容 的 许多 URL 时 , 可能 会 导致 许多 SEO 问题。 而 添加 添加 规范 标签 , 您 ::

1.指定应出现在搜索结果中的页面

搜索 引擎 旨 在 提供 最 佳 的 用户 体验 —— 这 就 是 为什么 它们 很 少 会 在 搜索 结果 中 显示 多 个 版本 相同 相同 内容。 标签 让 您 有 机会 提高 最 具 代表性 的 页面 版本 搜索 可 见 性 性 最 具 代表性 的 页面 的 搜索 可 见 性 性 性这可以增加该页面的自然流量并转化为商业利益。

2.增强规范页面的排名信号

其他网站可能会链接到您网页的不同重复版本,从而稀释搜索引擎在排名期间考虑的信号。

当 您 使用 规范 标签 时 , 您 告诉 搜索 引擎 应该 将 来自 其他 网站 的 链接 都 整合 至 规范 从而 从而 增强 规范 页面 排名 信号 信号 此外 , 同 网站 跨 跨 网站 的 重复 内容 将 不 需要 在 引擎 引擎 中 网站 的 重复 内容 将 不 需要 在 搜索 引擎 中 中 中排名或流量。

3.不鼓励抓取重复页面

如果 您 添加 规范 标签 , 则 搜索 引擎 不 太 可能 会 在 知道 它们 是 副本 的 情况 下 继续 抓取 这些 重复 页面。 是 一 一 个 您 的 规范 页面 被 更 有效 地 抓取 的 机会 , 可以 对 您 被 被 更 有效 抓取 的 机会 , 这 可以 您 您 您 网站的索引状态产生积极影响。

四、何时应该使用规范标签

现在我们知道了规范标签对SEO的重要性了,那么应该在何时使用规范标签呢?以帋是规范标签皛

1.修复网站常见的重复内容

如果您的网站存在以下问题,那么您需要添加规范标签。

  • 可以从不同的 URL 访问主页(例如 www.domain.com、domain.com、www.domain.com/index.html 等)
  • 可以使用或不使用尾部斜杠 ("/") 访问页面
  • 可以不区分大小写访问页面
  • Fichier PDF
  • 该 URL 在没有 SSL 加密的 HTTP 版本下仍然可用

2.产品过滤和分类

电子 商务 网站 典型 的 过滤 和 排序 选项 通常 被 添加 到 URL 的 查询 字 符串 —— 这 会 产生 大量 重复 的 内容。 规范化 过滤 和 排序 页面 将 帮助 的 规范 版本 排名 更 高 , 并 防止 引擎 不 必要 规范 地 版本 排名 更 高 , 并 搜索 引擎 不 必要 地 地抓取重复内容。

3. URL中的冗余参数

如果 参数 不 用 于 跟踪 、 不 能 更改 内容 并且 不 向 URL 添加 有 意义 的 信息 , 则 对于 对于 页面 可能 是 的 的。 此外 , 它们 可能 导致 您 的 网站 不 能 被 此外 , 它们 可能 导致 您 的 网站 不 能 被 充分。。。 会 导致 您 的 网站 不 能 被 充分。。

4.跟踪参数和会话 ID

跟踪参数可以跟踪活动或用户旅程,但它们不会更改页面的内容,因此也应该规范化。

5.转载内容

转载 内容 意味 着 一 段 内容 在 另 一 个 网站 上 被 重新 发布。 实施 规范 标签 有助于将 作品 的 所有权 归 属于原始 发布 者。

五、如何向页面添加规范标签

您有多种方法可以添加规范标签。以下我们介绍常用的4种。

1. rel=canonical <link> 标记

在 HTML 中添加规范标签是实现它的最常用方法。您可以将以下代码添加HTML額复页蝢的 URL < head>部分并粘

<link rel="canonical" href="https://example.com" />

假设我们有三个重复的页面 – 页面A、B、C,我们决定选择页面A作为首选页面。

页面A:https://example.com/page-a

页面B:https://example.com/page-b

页面C:https://example.com/page-c

在这种情况下,我们将相同的<link rel=”canonical” href=”https://example.com/page-a” />添加到页面A、页面B和页面C。

注意:此方法仅适用于 HTML 页面,因此如果您想规范化其他类型的文件,请使用 HTTP 标头。

2. rel=canonical HTTP 标头

对于 像 PDF 这样 的 文档 , 由于 没有 网页 的 <A-tête> 部分 , 因此 无法 在 网页 开头 插入 权威 内容 标签。 碰到 这 情况 , , 您 需要 使用 Http 标头 来 设置 权威 页面。 , 您 需要 使用

例如,如果您通过多个网址显示某个 PDF 文件,可以返回 rel="canonical" HTTP 标头,将该 PDF 文件的规范网址呚知 Googlebot

 Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

注意:要使用此解决方案,您需要访问您网站的服务器。

3. 站点地图

您 可以 为 您 的 每 个 网页 选择 一 个 规范 网址 , 然后 通过 站点 地图 提交 这些 规范 网址。您 在 站点 地图 列出 的 的 所有 都 会 被 视为 向 系统 建议 的 规范 网页; ; 会 内容 相似 度 向 系统 建议 的 网页 网页 ; 会 根据 内容 相似 度 度 度哪些网页是重复网页(如果有)。

4.在CMS中添加规范标签

1 )在 WordPress中设置权威内容标签

您 可以 安装 yoast seo 插件 , 它 会 自动 添加 自 引用 权威 内容 标签。 若 想 要 设置 自 定义 权威 页面 , 请 每 每 个 帖子 或 网页 上 的 高级 高级 部分 部分。 每 个 帖子 或 网页 上 的 的 高级 高级 部分 部分。

2 )在 Shopify中设置权威内容标签

Shopify 自身 默 认为 产品 和 博客 添加 自 引用 权威 内容 标签。 若 想 要 设置 自 定义 权威 页面 , 您 可以 直接 编辑 模板 (.Liquide) 文件。。

3 )在 Squarespace中设置权威内容标签

Avec Shopify, Squarespace avec Squarespace et avec Squarespace.

六、Google 如何选择规范页面?

请务必注意,Googlebot 并不总是遵循您的规范标签 ——

实际上,Google在选择规范版本时会 考虑许多其他页面因素。这些因素包括:

  • 重定向
  • 站点地图
  • URL结构
  • 内链和外链
  • HTTPS协议的使用

您可以用URL 检查工具来检查 Google 是否尊重您的规范标签或选择了不同的标签。

七、使用规范标签的最佳实践和常见错误

遵循 规范 标签 最 佳 实践 有助于 降低 搜索 引擎 将 错误 版本 的 页面 视为 首 选 页面 的 风险。 以下 是 我 对 规范 标签 的 一些 ::

1) 不要直接删除非规范版本

当 我们 发现 重复 内容 时 , 一些 人 可能 会 想 直接 删掉 重复 的 页面 或 内容。 问题 在于 , 有时 这些 重复 页面 在 其他 其他 地方 引用。 如果 您 直接 删除 这些 页面 , 用户 将 通过 在 其他 地方 直接 删除 删除 这些 , 用户 将 无法 在 其他 地方 地方 的内链或外链访问它们。

因此,如果您必须删除某些重复页面,最好先将它们301重定向至规范版本。

2)使用绝对 URL

理论上,Google 可以识别相对 URL 和绝对 URL。但是,绝对URL不易出错且更易于更改。

URL:

<link rel="canonical" href="https://example.com/sample-page/" />

而不要只包含 URL 路径:

<link rel="canonical" href="/sample-page/" />

3)向搜索引擎发送明确的信号

向 搜索 引擎 发送 明确 的 信号 是 指 每 页 仅 指定 一 个 规范。 例如 您 应该 避免 将 某 一 个 URL 指定 为 规范 , 同时 又 将 这个 URL 重定 向 到 不同 的 URL。

4)表面创建链式或交叉式规范

确保 仅 对 多 个 重复 页面 的 一 个 来源 进行 规范化。 例如 , 假设 页面 A 、 B 、 C 、 D 是 重复 页面 且 是 A 是 首 选 页面。 那么 您 您 不 能 在 B 页面 设定 A 页面 为 规范 那么 您 您 不 能 在 B 页面 设定 A 页面 为 规范 规范 , 然后在 C 页面 又 将 B 页面 设 为 规范 URL。 否则 , 搜索 引擎 可能 感到 困惑。 正确 的 方式 是 页面 A 、 B 、 C 、 D 都 将 页面 A 添加 为 网址 网址。

5)确保在内链使用的是规范URL

在 您 的 网站 上 添加 内链 时 , 请 确保 您 链接到 规范 规范 URL , 而 不 是 重复链接。 如 前所 述 , 如果 更 的 的 信号 指向 另 个 个 页面 , , 可能 可能 不 会 选择 您 的 规范 个 重复 页面 , Google 可能 不 会 选择 您 的 规范 规范 规范 重复 页面 , 。

6)选择正确的域版本

切换到 SSL 后,请务必不要在规范标签中包含任何非 HTTPS的URL,因为这会造成混淆并可能导致意外结果も

7)针对桌面版网址和移动版网址的注释

Google 不 推荐 在 网站 设置 中 使用 单独 的 网址 , 因为 这样 难以 实现 和 维护。 但是 仍 有 好 一 部分 网站 的 桌面端 地址 为 www.example.com , 在 端 端 对应 的 地址 却 变成 m.example.com .

这种情况下,您需要通过包含 rel=”canonical” 和 rel=”alternate” 元素的 <link> 标记表明两个网址之间的关系。

  • 在桌面版网页上,添加指向相应移动版网址的 rel=”alternate” 标记。这有助于 Googlebot 发现网站的移动版网页扈网页扈
  • 在移动版网页上,添加指向相应桌面版网址的 rel=”canonical” 标记。

例如,在桌面版网页 (http://www.example.com/page-1) 上,添加以下注释:

 <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/page-1">

在移动版网页 (http://m.example.com/page-1) 上,所需的注释应为:

 <link rel="canonical" href="http://www.example.com/page-1">

8)规范标签 & Hreflang

尽管 Google 不 会 将 翻译 成 其他 语言 的 相同 内容 的 不同 版本 视为 重复 , 但 您 仍 应 使用 规范 标签。 如果 您 在 同 一 个 区域 网站 的 不同 网址 上 以 同 一 种 语言 类似 内容 内容 或 内容 内容 内容 以 一 种 语言 提供 内容 内容 或 重复 内容 内容 内容 (例如 , 如果 Exemple.fr/ 和 Exemple.com/fr/ 都 显示 类似 的 法语 内容) , 则 设定 一 个 首选 版本 , 然后 使用 Rel = ”Canonical” 元素 和 Hreflang 标记 确保 搜索 搜索 用户 提供 正确 的 语言 或 区域 区域 区域 确保 向 搜索 用户 提供 正确 的 语言 或 区域 区域 区域网址。

八、如何检查规范标签

Balise canonique

1. 右键查看网页原始代码

步骤1 在浏览器中打开您要检查的页面

步骤2 右键单击页面中的任意位置,并选择“Inspecter”或“View page source”,您将能看到页面的所有源代码。

步骤3 按 Ctrl + F(Windows)或 F + commande(Mac)。然后在按字符串、选择器或 XPath 的查找中键入“canonical”。

步骤 4 : «canonique» 一 词 将 出现 并 突出 显示 为 黄色 , 您 可以 检查 该 规范 标签 是否 正确。 如果 未 出现 结果 , , 则 该 页面 未 设置 规范 标签。 任何 结果 , 则 该 页面 未 设置 规范 标签。。

右键查看网页原始代码

2. 使用Google Search Console检查

Console de recherche Google

2.1.覆盖率报告

Console de recherche Google 中 的 覆盖率 报告 是 关于 您 的 页面 是否 被 收录 的 重要 信息 来源 来源 —— 哪些 URL 已 索引 索引 , 哪些 URL 未 被 编入 索引 , 以及 原因。

要分析您网站的规范化网址,请导航到排除类别,您将看到以下一些与规范化相关的状态:

1 )重复网页,网址已提交但未被选为规范网址

这意味着Google 在您的 XML 站点地图中发现了它并认为它是重复页面。

2 )备用网页(有适当的规范标记)

标有 此 状态 的 URL 表示 Google 尊重 您 的 URL 规范化 的 网页。 如果 您 最近 对 某些 页面 进行 了 规范化 , 则 可以 预期 这些 URL 的 数量 会 增加。

3 )重复网页,Google选择的规范网页与用户指定的不同

Google ?

规范网页

2.2.网址检查工具

您可以使用网址检查工具进一步调查 Googlebot如何查看从索引中排除的网址。检查页面时,请查看:

  • 上次抓取日期– Googlebot上次抓取页面的时间。如果最近添加了规范标签,那么 Googlebot 可能軎那时起就没有抓
  • URL – URL ;
  • Google选择的规范– 如果 Google 选择了不同的规范页面,您可以看到选择了哪个 URL。

3. 使用网络爬虫工具

您 可以 使用 类似 Frog hurlant 的 工具 帮助 您 发现 规范 标签 的 问题。 这些 工具 可以 为 您 提供 有关 规范 与 非 规范 比率 比率 的 详细 信息 它们 也 会 提示 您 任何 ​​不 正确 的 详细。 它们 也 会 提示 您 任何 ​​不 正确 的 规范 页面。。。 会 提示 提示 您 任何 ​​正确 的 规范 页面。。

总结

添加 规范 标签 可以 让 您 告诉 搜索 引擎 哪个 URL 是 重复 内容 的 最佳 版本。 它 可以 帮 您 节省 抓取 预算 、 将 集中 集中 到 最 重要 页面 、 并 最大 可能 地 将 您 想要 的 版本 在 、 并 最大 可能 地 将 您 想要 的 出现 在 在 搜索 搜索结果中。

虽然 Google 不 必然 会 选择 您 设定 的 规范 页面 , 但 大部分 情况 , Google 会 尊重 您 的 选择。 但是 , 添加 添加 标签 标签 的 过程 中 , 容易 各种各样 的 错误 , 使 您 添加 的 中 , 容易 各种各样 的 错误 , 使 您 添加 的 标签。。。 各种各样 错误 , , 您 添加 的 标签 无效。。因此,请阅读并遵循本文的最佳实践进行。