什麼是重複內容?

已發表: 2022-04-22

重複內容是指在多個地方或多個不同 URL 中發現的相同或非常相似的 Web 內容。

Google 和 Raven Tools 都估計重複內容在互聯網上佔相當大的比例——分別為25-30%29% 因此,您需要了解有關重複內容及其與您網站搜索引擎排名的關係的某些事項。

在本文中,我們將討論重複內容的含義、重複內容 SEO問題是如何出現的以及如何解決這些問題。

目錄

  • 重複內容在 SEO 中意味著什麼?
  • 重複內容和 SEO 問題是如何發生的?
  • 為什麼重複內容對 SEO 來說是個問題?
  • 如何檢查重複內容
  • 重複內容的熊貓更新
  • 重複內容常見問題解答

重複內容在 SEO 中意味著什麼?

在我們談論與 SEO 重複內容相關的問題之前,我們需要弄清楚它在 SEO 方面的含義。 當談到重複內容時,谷歌將其定義為在域內或跨域發現的相同或明顯相似的實質性內容塊。

如前所述,多個消息來源稱,大約四分之一的互聯網是重複內容。

這似乎是一個大問題,但是,當涉及到在線複製內容時,事情並不像您想像的那麼可怕。

雖然相當比例的內容在 URL 中重複,但這並不總是意味著它被複製或竊取。 大多數時候,重複的內容是許多因素的完全無辜的副產品。

重複內容和 SEO 問題是如何發生的?

有時,重複的內容是故意的,而有時則是偶然的。 儘管您可能認為您的文本都是原創的,所以您很清楚,但仍然可能出現重複的內容問題

事實上,大多數重複內容的案例都不是惡意的、欺騙性的,而且很多時候,它們甚至不是故意的。 讓我們回顧一下您的內容可能出現在多個地方的主要原因。

WWW 與非 WWW 和 HTTP 與 HTTPS

通常,重複內容問題是由配置站點時的簡單錯誤引起的。 被忽視的方面之一是您的網站是否可以作為 www 和非 www 版本使用。
HTTP 和 HTTPS 站點也會發生同樣的事情。

基本上,您的網站可以在以下位置之一訪問:

  • https://www.example.com
  • https://example.com
  • http://www.example.com
  • http://example.com

如果您的網站在其中一個以上可用,並且您未能正確說明它,則可以將其視為重複內容,而實際上它只是一頁。

尾隨斜杠

另一個類似的問題出現在尾部斜杠上。 通常,末尾的斜杠表示目錄,而缺少斜杠則表示文件。 無論您指向哪一個,您都可以:

  • http://example.com/foo/
  • http://example.com/foo

Google 將這些視為單獨的 URL,這意味著您可以在兩個頁面上擁有不同的內容。 就谷歌而言,這很好,但是,這對用戶體驗不利。 人們會發現這種配置令人困惑,因此最好讓兩個 URL 都指向同一個頁面。

這給我們帶來了重複問題。 如果兩個 URL 都具有相同的內容,則您複製了您的頁面。 從 Google 的角度來看,這是在兩個不同位置的完全相同的內容,如果不加以解決,可能會損害您的 SEO 排名。

URL 參數和分面導航

分面搜索系統是過濾產品的一種巧妙方法。 但是,如果不進行管理,他們可以通過多種組合創建不同的 URL,所有這些都具有相同的內容。 這會影響您的抓取預算和鏈接資產。

URL 參數也會出現類似的問題,例如會話 ID 或跟踪 ID,其中可以通過多個 URL 訪問同一頁面。

備用頁面版本

跟隨意外重複內容的趨勢,我們遇到了網站管理員的另一個常見疏忽——備用頁面。 諸如“example.com/page”之類的站點可以在不同的 URL 下顯示為:

  • 適合移動設備的頁面 - m.example.com/page
  • 適合打印的頁面——example.com/print/page
  • 加速移動頁面 (AMP) – example.com/amp/page

所有這些版本都複製了頁面的內容,如果不加以修改會導致問題。

分頁

當涉及到類別頁面、博客文章標題、用戶評論或評論時,可以使用分頁在頁面之間拆分內容。

同樣,如果處理不當,這可能會導致內容在 URL 之間重複。

刮板

如果有人竊取了您的內容並將其發佈到不同的網站上,您就會遇到重複內容問題。 谷歌通常可以確定哪個網站是原始網站,但是,您可能需要解決刮板問題。

辛迪加

如果您允許其他網站重新發布您的作品,您將創建跨域重複內容。 雖然聯合內容不應高於您的原始網站,但您可以採取預防措施以確保它不會發生。

為什麼重複內容對 SEO 來說是個問題?

雖然許多人一直在堅持Google 重複內容懲罰的想法,但這並不是您通常需要擔心的事情。

重複內容本身不是問題。 但是,如果跨域複製文本以操縱搜索引擎排名,則會成為問題。

無辜重複的內容和搜索引擎優化

谷歌向其用戶保證,只要內容是誠實的且不被操縱,重複的內容不會降低他們的搜索引擎排名。 雖然這可能是真的,但重複的內容可能會導致較差的 SEO 性能。

儘管谷歌對它選擇在搜索結果中顯示的頁面很有信心,但有時,搜索引擎會出錯。

假設同一頁面可在多個 URL 上使用。 在這種情況下,Google 會將重複的 URL 分組到一個集群中。 這可能會以多種方式影響您:

  1. Google 將選擇“最佳”URL 作為集群的代表。 有時,您和 Google 可能會在什麼是“最佳” URL 上存在分歧,從而導致您的品牌和用戶體驗問題;
  2. 儘管應該在集群的所有成員中合併鏈接流行度,但 Google 可能無法檢測到某些重複項。 這可能會導致鏈接稀釋並損害您的內容排名努力;

此外,請考慮這樣一個事實,即這種現象會導致抓取效率低下,從而使 Google 有更少的時間來瀏覽您更新和更新的內容。

抓取和聯合內容

無論您是否允許其他網站重新發布您的作品,或者您的內容已被抓取,該內容現在都會出現在多個域中。

這通常不會引起問題,但有時,儘管可能很少見,但被抓取或重新發布的內容可能會超過原始內容。

幸運的是,可以通過幾種不同的方式處理重複內容問題,從而幫助優化您的 SEO 性能。

如何檢查重複內容

在解決任何問題之前,您首先需要知道它們存在。 這將要求您在您的網站上搜索重複的內容。 您可以通過以下幾種方式做到這一點:

1.谷歌搜索控制台

Google Search Console 可以讓您深入了解您的網頁在搜索結果中的表現。 該服務還可以幫助您識別重複內容問題,例如,通過在搜索結果中查找相同頁面排名的不同 URL。

2.重複內容搜索

檢查重複內容的一種快速方法是從頁面中搜索文本塊——在搜索它們時,將單詞放在引號內。

理想情況下,應該只顯示您的頁面。 如果有其他結果,您可能會遇到問題,但並非總是如此。 你可以用多個句子來試試這個。

您還可以使用 Google 搜索欄查找您的網站。 輸入“site:”,後跟 URL,全部用引號括起來。 這將向您顯示 google 已編入索引並可能排名的頁面。

3. 重複內容檢查器

有各種抄襲檢查器,以及谷歌重複內容檢查器,可以幫助您找出您的內容是否非原創、是否存在內部重複內容問題或已重新發布。

如何解決重複內容

儘管谷歌在處理重複內容方面做得相當好,但您總是可以更多地參與並直接解決可能出現的問題,以達到最佳效果。

關於做什麼的一些提示包括:

  • 使用 301 重定向、規範 URL 或 noindex 重定向;
  • 在您的內部鏈接中保持一致;
  • 使用頂級域 - TLD - 處理特定國家/地區的內容;
  • 確保包含聯合內容的網站包含返回您頁面的鏈接或使用 noindex 標籤;
  • 合併具有相似內容的頁面;
  • 在內容被抓取的情況下提交DMCA 請求

重複內容的熊貓更新

Google 的 Panda 更新於 2011 年推出,對 Google 的算法來說是一個非常重要的變化。 雖然 Panda 並非專門針對網站上的重複內容,但該更新確實鼓勵獨特且信息豐富的文本,其中包括避免重複內容。

重複內容常見問題解答

重複內容在 SEO 中意味著什麼?

重複內容表示與其他在線內容完全匹配或明顯相似的實質性文本塊。 重複內容約佔互聯網的四分之一,而且大多數時候本質上不是欺騙性或惡意的。

谷歌是否有重複內容處罰?

谷歌對重複內容的處罰被歪曲了,以至於它幾乎成了一個神話。 重複內容不會受到處罰,除非它違反了 Google 的網站管理員指南並打算操縱搜索引擎結果。

重複的內容會損害 SEO 排名嗎?

重複的內容會對您的 SEO 策略產生負面影響。 谷歌確實嘗試合併多個指向同一頁面的 URL,並顯示原始結果高於重新發布的內容。 然而,它並不是一個完美的系統,因為不利的 URL 或跨域重新發布可能會比您的原始文章排名更高。 這就是為什麼還需要主動解決重複內容的原因。

可以接受多少重複內容?

沒有明確的衡量標準可以表明您可以復制多少內容。 但是,作為一般經驗法則,不超過 5% 的重複內容應該會進入您的網站。 要管理這個百分比,請使用在線抄襲檢查器。