الكنسي 标签 : 最佳 实践 、 常见 错误 及其 对 SEO 的 影响

نشرت: 2022-07-29

任何 网站 都 可能 出现 重复 内容 问题 您 可能 不 知道 您 的 某些 内容 被 视为 重复。 此时 , المتعارف عليه

如果 没有 الكنسي 规范 标签 , 搜索 引擎 将 自己 选择 规范 版本。 而且 , 它们 很 可能 会 选择 一个 不 具有 代表性 的 页面。这 会 严重 影响 您 的 搜索 可见 性 和 排名。

在 这篇 文章 中 , 我们 将 解释 什么 是 Canonical 规范 标签 、 什么 时候 应该 使用 Canonical 、 如何 正确 Canonical , 以及 使用 Canonical 时 需 避免 的 常见 错误。

الكنسي 标签

الإنتقال السريع

  • 、 什么 是 المتعارف عليه 标签?
  • 二 、 搜索 引擎 和 重复 内容
  • 三 、 为什么 规范 标签 很 重要?
  • 四 、 何时 应该 使用 规范 标签
  • 、 如何 向 页面 添加 规范 标签
    • 1. rel = canonical <link> 标记
    • 2. rel = HTTP الأساسي 标 头
    • 3. 站点 地图
    • 4. 在 CMS 中 添加 规范 标签
  • 六 、 جوجل 如何 选择 规范 页面?
  • 、 使用 规范 标签 的 最佳 实践 和 常见 错误
    • 1) 不要 直接 删除 非 规范 版本
    • 2) 使用 绝对 URL
    • 3) 向 搜索 引擎 发送 明确 的 信号
    • 4) 表面 创建 链式 或 交叉 式 规范
    • 5 عنوان URL
    • 6) 选择 正确 的 域 版本
    • 7) 针对 桌面 版 网址 和 移动 版 网址 的 注释
    • 8) 规范 标签 & Hreflang
  • 八 、 如何 检查 规范 标签
    • 1. 右键 查看 网页 原始 代码
    • 2. 使用 جوجل Search Console
    • 3. 使用 网络 爬虫 工具
  • 总结

、 什么 是 المتعارف عليه 标签?

متعارف عليه

实现 规范 标签 的 最 常见 技术 是 将 link rel = ”canonical” 代码 片段 添加 到 页面 的 HTML 中 , 例如 :

 <link rel="canonical" href="https://example.com/sample-page/" />

该 代码 表示 规范 页面 是 上述 指定 的 URL。

规范 标签 主要 用于 解决 重复 内容 问题 —— 但 搜索 引擎 是 如何 判断 哪些 内容 是 重复 的 呢?

二 、 搜索 引擎 和 重复 内容

重复 内容 的 问题 源于 一个 简单 的 事实 , 即搜索 引擎 爬虫 查看 页面 的 方式 与 用户 不同。

对于 搜索 引擎 爬虫 , 以下 每个 URL 都 不同 :

  • http://example.com
  • https://example.com
  • https://example.com/index.php
  • http://example.com/index.php
  • http://www.example.com

当 用户 在 上面 每个 页面 看到 相同 的 内容 时 , 爬虫 却将 每个 URL 地址 视为 一个 单独 的 实体 , 即使 多个 页面 具有 相同 的 内容。

对于 电子商务 网站 来说 , 重复 内容 问题 往往 特别 严重。 但 重复 的 问题 不仅 限于 商 商 许多 现代 网站 会 自动 将 标签 和 参数 添加 到 的 产生。 以下 是 产生 重复 内容 最 常见的 原因 :

1. 为了 支持 多种 设备 类型 :

 https://example.com/guide/google-seo https://m.example.com/guide/google-seo

2. 为了 启用 搜索 参数 或 会话 ID 等 所需 的 动态 网址 :

 https://www.example.com/products?category=dresses&color=red https://www.example.com/dresses/red/reddress.html

3. 当 您 将 同 一篇 博 文 同时 放在 多个 版块 中 时 , 博客 系统 会 自动 保存 多个 网址

https://blog.example.com/dresses/red-dresses-are-awesome/ https://blog.example.com/red-things/red-dresses-are-awesome/

4. 服务器 已 配置 为 针对 www / 非 www http / https 和 协议 端口 变 体 提供 相同 的 内容 :

 http://example.com/red-dresses https://example.com/red-dresses http://www.example.com/red-dresses http://example.com:80/red-dresses https://example.com:443/red-dresses

5.您 在 相应 博客 上 提供 的 要 转载 到 其他 网站 上 的 内容 与 这些 网域 中 的 原有 内容 完全 重复 或 部分 重复 :

https://news.example.com/red-dresses-for-every-day-155672.html (转载 博 文)

https://blog.example.com/dresses/red-dresses-are-awesome/3245/ (原始 博 文)

无论 基于 何种 原因 , 当 搜索 引擎 遇到 重复 的 内容 时 , 它们 很难 做出 决定 :

  • 应该 索引 哪个 页面 ,
  • 页面 应该 为 相关 关键字 排名 , 以及
  • 他们 是否 应该 将 排名 信号 合并 到 一个 URL 下 , 或者 将 其 拆分 到 多个 页面。

这个 时候 , 就 需要 给 您 在 一 组 重复 页面 中 , الكنسي 标签 之 处 最具 代表性 的 一个 页面 , 帮助 Google 做出 选择。

三 、 为什么 规范 标签 很 重要?

重复 内容 是 一个 复杂 的 主题 , 但是 当 搜索 引擎 抓取 具有 相同 (或 非常) 内容 的 许多 可能 会 导致 许多 SEO 问题。 而 通过 添加 规范 标签 , 您 可以 :

1.指定 应 出现 在 搜索 结果 中 的 页面

搜索 引擎 旨在 提供 最佳 的 用户 体验 —— 这 就是 为什么 它们 很少 会 在 搜索 结果 显示 多个 相同 内容。 规范 标签 有 机会 提高 最具 代表性 的 版本 的 搜索 可见 性 ,这 可以 增加 该 页面 的 自然 流量 并 转化 为 商业 利益。

2.增强 规范 页面 的 排名 信号

其他 网站 可能 会 链接 到 您 网页 的 不同 重复 版本 , 从而 稀释 搜索 引擎 在 排名 期间 考虑 的 信号。

当当 使用 规范 标签 时 , 您 搜索 引擎 应该 将 来自 其他 网站 的 链接 整合 至 规范 从而 增强 规范 页面 的 排名。 此外 , 同 网站 或 网站 的 重复 内容 将 不再 需要 搜索 引擎 中排名 或 流量。

3.不 鼓励 抓取 重复 页面

.的 索引 状态 产生 积极 影响。

四 、 何时 应该 使用 规范 标签

现在 我们 知道 了 规范 标签 对 SEO 的 重要性 了 , 那么 应该 在 何时 使用 规范 标签 呢? 以下 是 规范 标签 的 一些 常见 用 例 :

1.修复 网站 常见 的 重复 内容

如果 您 的 网站 存在 以下 问题 , 那么 您 需要 添加 规范 标签。

  • 可以 从 不同 的 URL 访问 主页 (例如 www.domain.com 、 domain.com 、 www.domain.com / index.html 等)
  • 可以 使用 或 不 使用 尾部 ("/") 访问 页面
  • 可以 不 区分 大小写 访问 页面
  • 内容 以 不同 的 版本 呈现 (例如 印刷 版 、 PDF 等)
  • 该 URL 在 没有 SSL 加密 的 HTTP 版本 下 仍然 可用

2.产品 过滤 和 分类

电子商务 网站 典型 的 过滤 和 排序 选项 通常 被 添加 到 字符串 会 产生 大量 重复 的 内容。 规范化 过滤 和 排序 帮助 您 的 规范 排名 , 并 防止 搜索 引擎 不必要 地抓取 重复 内容。

3. URL中 的 冗余 参数

如果 参数 不 用于 跟踪 、 不能 更改 内容 并且 不 向 URL 添加 有意义 的 信息 , 则 参数 对于 页面 是 的。 此外 , 它们 可能 会 导致 您 的 网站 不能 被 充分 抓取。

4.跟踪 参数 和 会话 ID

跟踪 参数 可以 跟踪 活动 或 用户 旅程 , 但 它们 不会 更改 页面 的 内容 , 因此 也 应该 规范化。

5.转载 内容

转载 内容 意味着 一段 内容 在 另一个 网站 上 被 重新 发布。 实施 规范 标签 有助于将 作品 的 所有权 归属于 原始 发布 者。

、 如何 向 页面 添加 规范 标签

您 有 多种 方法 可以 添加 规范 标签。 以下 我们 介绍 常用 的 4 种。

1. rel = canonical <link> 标记

在 HTML 中 添加 规范 标签 是 实现 它 的 最 常用 方法。 您 可以 将 以下 代码 添加HTML重复 页面 的 <head>部分 并 粘贴 规范 版本 的 URL

<link rel = ”canonical” href = ”https://example.com” />

假设 我们 有 三个 重复 的 页面 - 页面 A 、 B 、 C , 我们 决定 选择 页面 A 作为 首选 页面。

页面 أ : https: //example.com/page-a

页面 ب : https: //example.com/page-b

页面 C : https: //example.com/page-c

在 这种 情况 下 , 我们 将 相同 的 <link rel = ”canonical” href = ”https://example.com/page-a” /> 添加 到 页面 A 、 页面 B 和 页面 C。

注意 :此 方法 仅 适用 于 HTML 页面 , 因此 如果 您 想 规范化 其他 类型 的 文件 , 请 使用 HTTP 标 头。

2. rel = HTTP الأساسي 标 头

对于 像 PDF 这样 的 文档 , 由于 没有 网页 的 <head> 部分 , 因此 无法 在 网页 开头 插入 权威 内容 标签。 碰到 这种 情况 , 您 需要 使用 HTTP 标 头来 设置 权威 页面。

例如 , 如果 您 通过 多个 网址 显示 某个 PDF 文件 , 可以 返回 rel = ”canonical” HTTP 标 头 , 将该 PDF 文件 的 规范 网址 Googlebot :

 Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

注意 :要 使用 此 解决 方案 , 您 需要 访问 您 网站 的 服务器。

3. 站点 地图

لا شيء哪些 网页 是 重复 网页 (如果 有)。

4. 在 CMS 中 添加 规范 标签

1 ) 在 WordPress中 设置 权威 内容 标签

您 可以 安装 Yoast SEO 插件 , 它 会 自动 添加 自 引用 权威 内容 标签。 若 想要 设置 自 权威 页面 , 使用 使用 每个 帖子 或 网页 的 的 "高级" 部分。

2 ) 在 Shopify中 设置 权威 内容 标签

Shopify 自身 默认 为 产品 和 博客 添加 自 引用 权威 内容 标签。 若 想要 设置 自 定义 权威 页面 , 您 可以 编辑 模板 (. سائل) 文件。

3 ) 在 Squarespace中 设置 权威 内容 标签

与 Shopify 的 情况 一样 ، Squarespace 也会 默认 添加 自 引用 网址。 但是 , 如果 想 添加 自 定义 权威 页面 , 则 需要 直接 编辑 代码。

六 、 جوجل 如何 选择 规范 页面?

请 务必 注意 , Googlebot 并不 总是 遵循 您 的 规范 标签 —— 它 仅 将 您 设置 的 规范 标签 视作 一种 建议。

实际上 , جوجل 在 选择 规范 版本 时 会 考虑 许多 其他 页面 因素。 这些 因素 包括 :

  • 重定向
  • 站点 地图
  • URL 结构
  • 内 链 和 外 链
  • HTTPS 协议 的 使用

您 可以 用 URL 检查 工具 来 检查 Google 是否 尊重 您 的 规范 标签 或 选择 了 不同 的 标签。

、 使用 规范 标签 的 最佳 实践 和 常见 错误

遵循 规范 标签 最佳 实践 有助于 降低 搜索 引擎 将 错误 版本 的 页面 视为 首选 页面 的。 以下 以下 对 规范 标签 的 一些 建议 :

1) 不要 直接 删除 非 规范 版本

当当 发现 重复 内容 时 , 一些 可能 会 想 直接 删掉 重复 的 页面 或。 问题 在于 有时 这些 重复 页面 已经 在 地方 被 引用。 如果 您 删除 这些 页面 , 用户 将 无法 在 其他 地方内 链 或 外 链 访问 它们。

因此 , 如果 您 必须 删除 某些 重复 页面 , 最好 先将 它们 301 重定向 至 规范 版本。

2) 使用 绝对 URL

理论上 , Google 可以 识别 相对 URL 和 绝对 URL。 但是 , 绝对 URL 不易 出错 且更 易于 更改。

换句话说 , 尽可能 在 规范 标签 中 使用 完整 的 URL :

<link rel = ”canonical” href = ”https://example.com/sample-page/” />

而 不要 只 包含 URL 路径 :

<link rel = ”canonical” href = ”/ sample-page /” />

3) 向 搜索 引擎 发送 明确 的 信号

رابط الموقع URL

4) 表面 创建 链式 或 交叉 式 规范

确保 仅对 多个 ​​重复 页面 的 一个 来源 进行 规范化。 例如 , 假设 页面 A 、 B 、 C 、 D 是 重复 且 是 是 A 是 首选 页面。 那么 , 不能 不能 在 B 页面 设定 A 页面 为 规范 URL , 然后在 C 页面 又将 B 页面 设为 规范 URL。 否则 , 搜索 引擎 可能 感到 困惑。 正确 的 方式 是 页面 A 、 B 、 C 、 D 都 将 页面 A 添加 为 规范 网址。

5 عنوان URL

عنوان URL لـ Google 您 的 网站 上 添加 内 链 时 , 请 确保 您 链接 到 规范 URL 。

6) 选择 正确 的 域 版本

切换 到 SSL 后 , 请 务必 不要 在 规范 标签 中 包含 任何 HTTPS 的 URL , 因为 这 会 造成 混淆 并 可能 导致 意外 结果。

7) 针对 桌面 版 网址 和 移动 版 网址 的 注释

جوجل 不 推荐 在 网站 设置 中 使用 单独 的 网址 , 因为 这样 难以 实现 和 维护。 但是 仍有 好 一部分 网站 的 桌面 端 地址 为 www.example.com , 在 移动 端 对应 的 地址 却 变成 m.example.com .

这种 情况 下 , 您 需要 通过 rel = ”canonical” 和 rel = ”alternate” 元素 的 <link> 标记 表明 两个 网址 之间 的 关系

  • 在 桌面 版 网页 上 , 添加 指向 相应 移动 版 网址 的 rel = ”alternate” 标记。 这 有助于 Googlebot 发现 网站 的 移动 版 网页 所在 的 位置。
  • 在 移动 版 网页 上 , 添加 指向 相应 桌面 版 网址 的 rel = ”canonical” 标记。

例如 , 在 桌面 版 网页 (http://www.example.com/page-1) 上 , 添加 以下 注释 :

 <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/page-1">

在 移动 版 网页 (http://m.example.com/page-1) 上 , 所需 的 注释 应 为 :

 <link rel="canonical" href="http://www.example.com/page-1">

8) 规范 标签 & Hreflang

尽管 جوجل 不会 将 翻译 成 其他 语言 的 相同 内容 的 不同 版本 视为 重复 , 但 您 仍应 使用 规范。 如果 您 同 一个 一个 区域 网站 的 不同 网址 以 一种 语言 提供 类似 内容 或 重复 内容 (例如 , 如果 example.fr/ 和 example.com/fr/ 都 显示 类似 的 法语 内容) , 则 设定 一个 首选 版本 , 然后 使用 rel = ”canonical” 元素 和 hreflang 标记 确保 向 搜索 用户 提供 正确 的 语言 或 区域网址。

八 、 如何 检查 规范 标签

العلامة الأساسية 添加 完成 后 , 别忘 了 检查 是否 添加 成功。 这里 我们 提供 了 3 种 检查 方法。

1. 右键 查看 网页 原始 代码

步骤 1 在 浏览 器 中 打开 您 要 检查 的 页面

步骤 2 右键 单击 页面 中 的 任意 位置 , 并 选择 “فحص” 或 “عرض مصدر الصفحة” , 您 将 能 看到 页面 的 所有 源 代码。

步骤 3 按 Ctrl + F (Windows) 或 F + أمر (Mac)。 然后 在 按 字符串 、 选择 器 XPath 的 查找 中 键入 “canonical”。

步骤 4 "متعارف عليه" 一词 将 出现 并 突出 显示 为 黄色 , 您 可以 检查 该 规范 标签 是否 正确。 如果 未 出现 任何 结果 , 则 表示 该 页面 未 设置 规范 标签。

右键 查看 网页 原始 代码

2. 使用 جوجل Search Console

Google Search Console 包含 一些 有用 的 工具 来 价差 您 的 规范 页面 : 索引 覆盖率 报告 和 URL 检查 工具。

2.1.覆盖率 报告

Google Search Console 中 的 覆盖率 报告 是 关于 您 的 页面 是否 被 收录 的 重要 信息 来源 —— 哪些 URL 已 编 入 索引 , 哪些 URL 未被 编 入 索引 , 以及 原因。

要 分析 您 网站 的 规范化 网址 , 请 导航 到 排除 类别 , 您 将 看到 以下 一些 与 规范化 相关 的 状态 :

1 ) 重复 网页 , 网址 已 提交 但 未被 选为 规范 网址

这 意味着 جوجل 在 您 的 XML 站点 地图 中 发现 了 它 并 认为 它 是 重复 页面。

2 ) 备用 网页 (有 适当 的 规范 标记)

标 有 此 状态 的 URL 表示 Google 尊重 您 的 URL 规范化 的 网页。 如果 您 最近 对 某些 页面 进行 了 规范化 , 则 预期 预期 URL 的 数量 会 增加。

3 ) 重复 网页 , Google选择 的 规范 网页 与 用户 指定 的 不同

该 状态 表明 جوجل 忽略 了 您 选择 的 规范化 网址 , 而 自行 选择 了 另一个 页面。

规范 网页

2.2.网址 检查 工具

您 可以 使用 网址 检查 工具 进一步 调查 Googlebot 如何 查看 从 索引 中 排除 的 网址。 检查 页面 时 , 请 查看 :

  • 上次 抓取 日期- Googlebot 上次 抓取 页面 的 时间。 如果 最近 添加 了 规范 标签 , 那么 Googlebot 可能 从那时 起 就 没有 抓取 过 该 网址。
  • 用户 声明 的 规范- 这 应该 显示 您 选择 的 URL - 检查 它 是否 是 正确 的 URL。
  • Google选择 的 规范- 如果 Google 选择 了 不同 的 规范 页面 , 您 可以 看到 选择 了 哪个 URL。

3. 使用 网络 爬虫 工具

您 可以 使用 类似 发现 规范 标签。 这些 工具 可以 为 您 有关 规范 与 非 规范 页面 比率 的 详细 信息。 它们 也会 提示 任何 不 正确 的 规范 页面。

总结

العنوان结果 中。

虽然 Google 不 必然会 选择 您 设定 的 规范 页面 , 但 大部分 情况 , Google 会 尊重 您 的 选择。 但是 , الكنسي 标签 的 过程 中 , 容易 出现 各种各样 的 错误 , 使 您 添加 的 标签 无效。因此 , 请 阅读 并 遵循 本文 的 最佳 实践 进行。