什么是重复内容?
已发表: 2022-04-22重复内容是指在多个地方或多个不同 URL 中发现的相同或非常相似的 Web 内容。
Google 和 Raven Tools 都估计重复内容在互联网上占相当大的比例——分别为25-30%和29% 。 因此,您需要了解有关重复内容及其与您网站搜索引擎排名的关系的某些事项。
在本文中,我们将讨论重复内容的含义、重复内容 SEO问题是如何出现的以及如何解决这些问题。
目录
- 重复内容在 SEO 中意味着什么?
- 重复内容和 SEO 问题是如何发生的?
- 为什么重复内容对 SEO 来说是个问题?
- 如何检查重复内容
- 重复内容的熊猫更新
- 重复内容常见问题解答
重复内容在 SEO 中意味着什么?
在我们谈论与 SEO 重复内容相关的问题之前,我们需要弄清楚它在 SEO 方面的含义。 当谈到重复内容时,谷歌将其定义为在域内或跨域发现的相同或明显相似的实质性内容块。
如前所述,多个消息来源称,大约四分之一的互联网是重复内容。
这似乎是一个大问题,但是,当涉及到在线复制内容时,事情并不像您想象的那么可怕。
虽然相当比例的内容在 URL 中重复,但这并不总是意味着它被复制或窃取。 大多数时候,重复的内容是许多因素的完全无辜的副产品。
重复内容和 SEO 问题是如何发生的?
有时,重复的内容是故意的,而有时则是偶然的。 尽管您可能认为您的文本都是原创的,所以您很清楚,但仍然可能出现重复的内容问题。
事实上,大多数重复内容的案例都不是恶意的、欺骗性的,而且很多时候,它们甚至不是故意的。 让我们回顾一下您的内容可能出现在多个地方的主要原因。
WWW 与非 WWW 和 HTTP 与 HTTPS
通常,重复内容问题是由配置站点时的简单错误引起的。 被忽视的方面之一是您的网站是否可以作为 www 和非 www 版本使用。
HTTP 和 HTTPS 站点也会发生同样的事情。
基本上,您的网站可以在以下位置之一访问:
- https://www.example.com
- https://example.com
- http://www.example.com
- http://example.com
如果您的网站在其中一个以上可用,并且您未能正确说明它,则可以将其视为重复内容,而实际上它只是一页。
尾随斜杠
另一个类似的问题出现在尾部斜杠上。 通常,末尾的斜杠表示目录,而缺少斜杠则表示文件。 无论您指向哪一个,您都可以:
- http://example.com/foo/
- http://example.com/foo
Google 将这些视为单独的 URL,这意味着您可以在两个页面上拥有不同的内容。 就谷歌而言,这很好,但是,这对用户体验不利。 人们会发现这种配置令人困惑,因此最好让两个 URL 都指向同一个页面。
这给我们带来了重复问题。 如果两个 URL 都具有相同的内容,则您复制了您的页面。 从 Google 的角度来看,这是在两个不同位置的完全相同的内容,如果不加以解决,可能会损害您的 SEO 排名。
URL 参数和分面导航
分面搜索系统是过滤产品的一种巧妙方法。 但是,如果不进行管理,他们可以通过多种组合创建不同的 URL,所有这些都具有相同的内容。 这会影响您的抓取预算和链接资产。
URL 参数也会出现类似的问题,例如会话 ID 或跟踪 ID,其中可以通过多个 URL 访问同一页面。
备用页面版本
跟随意外重复内容的趋势,我们遇到了网站管理员的另一个常见疏忽——备用页面。 诸如“example.com/page”之类的站点可以在不同的 URL 下显示为:
- 适合移动设备的页面 - m.example.com/page
- 适合打印的页面——example.com/print/page
- 加速移动页面 (AMP) – example.com/amp/page
所有这些版本都复制了页面的内容,如果不加以修改会导致问题。
分页
当涉及到类别页面、博客文章标题、用户评论或评论时,可以使用分页在页面之间拆分内容。
同样,如果处理不当,这可能会导致内容在 URL 之间重复。
刮板
如果有人窃取了您的内容并将其发布到不同的网站上,您就会遇到重复内容问题。 谷歌通常可以确定哪个网站是原始网站,但是,您可能需要解决刮板问题。
辛迪加
如果您允许其他网站重新发布您的作品,您将创建跨域重复内容。 虽然联合内容不应高于您的原始网站,但您可以采取预防措施以确保它不会发生。
为什么重复内容对 SEO 来说是个问题?
虽然许多人一直在坚持Google 重复内容惩罚的想法,但这并不是您通常需要担心的事情。

重复内容本身不是问题。 但是,如果跨域复制文本以操纵搜索引擎排名,则会成为问题。
无辜重复的内容和搜索引擎优化
谷歌向其用户保证,只要内容是诚实的且不被操纵,重复的内容不会降低他们的搜索引擎排名。 虽然这可能是真的,但重复的内容可能会导致较差的 SEO 性能。
尽管谷歌对它选择在搜索结果中显示的页面很有信心,但有时,搜索引擎会出错。
假设同一页面可在多个 URL 上使用。 在这种情况下,Google 会将重复的 URL 分组到一个集群中。 这可能会以多种方式影响您:
- Google 将选择“最佳”URL 作为集群的代表。 有时,您和 Google 可能会在什么是“最佳” URL 上存在分歧,从而导致您的品牌和用户体验问题;
- 尽管应该在集群的所有成员中合并链接流行度,但 Google 可能无法检测到某些重复项。 这可能会导致链接稀释并损害您的内容排名努力;
此外,请考虑这样一个事实,即这种现象会导致抓取效率低下,从而使 Google 有更少的时间来浏览您更新和更新的内容。
抓取和联合内容
无论您是否允许其他网站重新发布您的作品,或者您的内容已被抓取,该内容现在都会出现在多个域中。
这通常不会引起问题,但有时,尽管可能很少见,但被抓取或重新发布的内容可能会超过原始内容。
幸运的是,可以通过几种不同的方式处理重复内容问题,从而帮助优化您的 SEO 性能。
如何检查重复内容
在解决任何问题之前,您首先需要知道它们存在。 这将要求您在您的网站上搜索重复的内容。 您可以通过以下几种方式做到这一点:
1.谷歌搜索控制台
Google Search Console 可以让您深入了解您的网页在搜索结果中的表现。 该服务还可以帮助您识别重复内容问题,例如,通过在搜索结果中查找相同页面排名的不同 URL。
2.重复内容搜索
检查重复内容的一种快速方法是从页面中搜索文本块——在搜索它们时,将单词放在引号内。
理想情况下,应该只显示您的页面。 如果有其他结果,您可能会遇到问题,但并非总是如此。 你可以用多个句子来试试这个。
您还可以使用 Google 搜索栏查找您的网站。 输入“site:”,后跟 URL,全部用引号括起来。 这将向您显示 google 已编入索引并可能排名的页面。
3. 重复内容检查器
有各种抄袭检查器,以及谷歌重复内容检查器,可以帮助您找出您的内容是否非原创、是否存在内部重复内容问题或已重新发布。
如何解决重复内容
尽管谷歌在处理重复内容方面做得相当好,但您总是可以更多地参与并直接解决可能出现的问题,以达到最佳效果。
关于做什么的一些提示包括:
- 使用 301 重定向、规范 URL 或 noindex 重定向;
- 在您的内部链接中保持一致;
- 使用顶级域 - TLD - 处理特定国家/地区的内容;
- 确保包含联合内容的网站包含返回您页面的链接或使用 noindex 标签;
- 合并具有相似内容的页面;
- 在内容被抓取的情况下提交DMCA 请求;
重复内容的熊猫更新
Google 的 Panda 更新于 2011 年推出,对 Google 的算法来说是一个非常重要的变化。 虽然 Panda 并非专门针对网站上的重复内容,但该更新确实鼓励独特且信息丰富的文本,其中包括避免重复内容。
重复内容常见问题解答
重复内容在 SEO 中意味着什么?
重复内容表示与其他在线内容完全匹配或明显相似的实质性文本块。 重复内容约占互联网的四分之一,而且大多数时候本质上不是欺骗性或恶意的。
谷歌是否有重复内容处罚?
谷歌对重复内容的处罚被歪曲了,以至于它几乎成了一个神话。 重复内容不会受到处罚,除非它违反了 Google 的网站管理员指南并打算操纵搜索引擎结果。
重复的内容会损害 SEO 排名吗?
重复的内容会对您的 SEO 策略产生负面影响。 谷歌确实尝试合并多个指向同一页面的 URL,并显示原始结果高于重新发布的内容。 然而,它并不是一个完美的系统,因为不利的 URL 或跨域重新发布可能会比您的原始文章排名更高。 这就是为什么还需要主动解决重复内容的原因。
可以接受多少重复内容?
没有明确的衡量标准可以表明您可以复制多少内容。 但是,作为一般经验法则,不超过 5% 的重复内容应该会进入您的网站。 要管理这个百分比,请使用在线抄袭检查器。
