중복 콘텐츠란 무엇입니까?

게시 됨: 2022-04-22

중복 콘텐츠는 둘 이상의 위치 또는 여러 URL에서 발견된 동일하거나 매우 유사한 웹 콘텐츠를 나타냅니다.

Google과 Raven Tools는 각각 25-30% 29% 로 상당한 양의 인터넷을 구성하는 중복 콘텐츠를 추정합니다 . 따라서 중복 콘텐츠 및 사이트 검색 엔진 순위와의 관계에 대해 알아야 할 사항이 있습니다.

이 기사에서는 중복 콘텐츠의 의미, 중복 콘텐츠 SEO 문제가 발생하는 방법 및 해결 방법에 대해 모두 설명합니다.

목차

  • SEO에서 중복 콘텐츠는 무엇을 의미합니까?
  • 중복 콘텐츠 및 SEO 문제는 어떻게 발생합니까?
  • 중복 콘텐츠가 SEO에 문제가 되는 이유는 무엇입니까?
  • 중복 콘텐츠 확인 방법
  • 중복 콘텐츠에 대한 Panda 업데이트
  • 중복 콘텐츠에 대한 FAQ

SEO에서 중복 콘텐츠는 무엇을 의미합니까?

SEO 중복 콘텐츠와 관련된 문제에 대해 이야기하기 전에 SEO 측면에서 이것이 의미하는 바를 명확히 해야 합니다. Google중복 콘텐츠 에 대해 말할 때 이를 동일하거나 상당히 유사하고 도메인 내 또는 전체에서 발견되는 실질적인 콘텐츠 블록으로 정의합니다.

이미 언급했듯이 여러 출처에 따르면 인터넷의 약 4분의 1이 반복적인 콘텐츠입니다.

이것은 큰 문제로 보일 수 있지만 온라인으로 콘텐츠를 복제하는 경우 상황은 생각 만큼 심각하지 않습니다.

상당한 비율의 콘텐츠가 URL에서 반복되지만 이것이 항상 복사되거나 도난당했다는 의미는 아닙니다. 대부분의 경우 중복 콘텐츠는 여러 요인의 완벽하게 무고한 부산물입니다.

중복 콘텐츠 및 SEO 문제는 어떻게 발생합니까?

때로는 중복 콘텐츠가 의도적이며 다른 경우에는 우발적입니다. 텍스트가 모두 원본이기 때문에 명확하다고 생각할 수 있지만 중복 콘텐츠 문제 는 여전히 발생할 수 있습니다.

사실 대부분의 중복 콘텐츠는 악의적이거나 기만적이지 않으며 많은 경우 의도적이지도 않습니다. 콘텐츠가 여러 위치에 나타날 수 있는 주된 이유를 살펴보겠습니다.

WWW 대 비 WWW 및 HTTP 대 HTTPS

종종 중복 콘텐츠 문제 는 사이트 구성의 단순한 실수로 인해 발생합니다. 간과되는 측면 중 하나는 사이트가 www 및 www가 없는 버전 모두로 제공되는 경우입니다.
HTTP 및 HTTPS 사이트에서도 동일한 일이 발생할 수 있습니다.

기본적으로 귀하의 사이트는 다음 위치 중 하나에서 액세스할 수 있습니다.

  • https://www.example.com
  • https://example.com
  • http://www.example.com
  • http://example.com

귀하의 사이트가 이들 중 하나 이상에서 사용 가능하고 이에 대해 제대로 설명하지 못하면 실제로는 한 페이지일 때 중복 콘텐츠로 간주될 수 있습니다.

후행 슬래시

또 다른 유사한 문제는 후행 슬래시에서 발생합니다. 일반적으로 끝에 슬래시가 있으면 디렉토리를 나타내고 슬래시가 없으면 파일을 나타냅니다. 어느 것을 가리키고 있는지에 관계없이 다음을 가질 수 있습니다.

  • http://example.com/foo/
  • http://example.com/foo

Google은 이를 별도의 URL로 취급하므로 두 페이지에 다른 콘텐츠가 있을 수 있습니다. Google에 관한 한 이것은 괜찮지만 사용자 경험에는 좋지 않습니다. 사람들은 이 구성이 혼란스럽다는 것을 알게 될 것이므로 두 URL이 동일한 페이지로 연결되는 것이 가장 좋습니다.

이것은 중복 문제를 야기합니다. 동일한 콘텐츠에 두 URL을 모두 사용할 수 있는 경우 페이지를 복사한 것입니다. Google의 관점에서 이것은 두 개의 개별 위치에 있는 완전히 동일한 콘텐츠이므로 해결되지 않은 상태로 두면 SEO 순위에 영향을 줄 수 있습니다.

URL 매개변수 및 패싯 탐색

패싯 검색 시스템은 제품을 필터링하는 깔끔한 방법입니다. 그러나 관리되지 않는 상태로 두면 모두 동일한 콘텐츠를 포함하는 수많은 조합의 결과로 다른 URL을 생성할 수 있습니다. 이는 크롤링 예산과 링크 자산에 큰 타격을 줍니다.

여러 URL을 통해 동일한 페이지에 액세스할 수 있는 세션 ID 또는 추적 ID와 같은 URL 매개변수에서도 유사한 문제가 발생합니다.

대체 페이지 버전

실수로 콘텐츠를 복제하는 추세에 따라 우리는 웹마스터를 위한 또 다른 일반적인 감독인 대체 페이지에 도달했습니다. "example.com/page"와 같은 사이트는 다음과 같이 다른 URL에 나타날 수 있습니다.

  • 모바일 친화적인 페이지 – m.example.com/page
  • 인쇄용 페이지 – example.com/print/page
  • AMP(Accelerated Mobile Page) – example.com/amp/page

이러한 모든 버전은 페이지의 콘텐츠를 복제하고 수정하지 않으면 문제를 일으킵니다.

쪽수 매기기

카테고리 페이지, 블로그 게시물 제목, 사용자 리뷰 또는 댓글과 관련하여 페이지 매김을 사용하여 콘텐츠를 여러 페이지로 나눌 수 있습니다.

다시 말하지만, 올바르게 처리되지 않으면 URL 간에 콘텐츠가 중복될 수 있습니다.

스크레이퍼

누군가 귀하의 콘텐츠를 도용하여 다른 웹사이트에 게시하는 경우 중복 콘텐츠 문제가 있는 것입니다. Google은 일반적으로 어느 사이트가 원본인지 알아낼 수 있지만 적절한 조치를 위해 스크레이퍼를 처리하는 것이 좋습니다.

신디케이션

다른 웹사이트에서 작업을 다시 게시하도록 허용하면 도메인 간 중복 콘텐츠가 생성됩니다. 신디케이트된 콘텐츠가 원래 사이트보다 순위가 높아서는 안 되지만 이러한 일이 발생하지 않도록 예방 조치를 취할 수 있습니다.

중복 콘텐츠가 SEO에 문제가 되는 이유는 무엇입니까?

많은 사람들 Google 중복 콘텐츠 패널티 에 대한 아이디어를 영속화했지만 이것은 일반적으로 걱정할 필요가 없습니다.

중복 콘텐츠 자체는 문제가 되지 않습니다. 그러나 검색 엔진 순위를 조작하기 위해 텍스트가 도메인 간에 중복되면 문제가 됩니다.

무고하게 복제된 콘텐츠 및 SEO

Google은 콘텐츠가 정직하고 조작적이지 않은 한 중복 콘텐츠가 검색 엔진 순위에 영향을 미치지 않는다고 사용자에게 확신합니다. 이것이 사실일 수도 있지만 중복된 콘텐츠는 SEO 성능을 저하시킬 수 있습니다.

Google은 검색 결과에 표시하기로 선택한 페이지에 대해 확신을 갖고 있지만 때때로 검색 엔진이 잘못 표시되는 경우가 있습니다.

여러 URL에서 동일한 페이지를 사용할 수 있다고 가정해 보겠습니다. 이러한 경우 Google은 중복 URL을 클러스터로 그룹화합니다. 이는 다음과 같은 몇 가지 방식으로 영향을 줄 수 있습니다.

  1. Google은 클러스터의 대표자로 "최상의" URL을 선택합니다. 때때로 귀하와 Google은 "최상의" URL이 무엇인지에 대해 의견이 일치하지 않아 브랜딩 및 UX 문제를 일으킬 수 있습니다.
  2. 링크 인기도는 클러스터의 모든 구성원에 걸쳐 통합되어야 하지만 일부 중복 항목은 Google에서 감지하지 못할 수 있습니다. 이는 링크 희석으로 이어질 수 있으며 콘텐츠 순위 지정 노력에 해를 끼칠 수 있습니다.

또한 이 현상으로 인해 비효율적인 크롤링이 발생하여 Google에서 최신 콘텐츠와 업데이트된 콘텐츠를 살펴보는 데 걸리는 시간이 줄어들 수 있다는 사실을 고려하십시오.

스크랩 및 신디케이트된 콘텐츠

다른 사이트에서 작업을 다시 게시하도록 허용했든 콘텐츠를 스크랩했든 이제 해당 콘텐츠가 여러 도메인에 표시됩니다.

이것은 일반적으로 문제를 일으키지 않아야 하지만 드물게 스크랩하거나 다시 게시한 콘텐츠가 원본보다 순위가 높을 수 있습니다.

다행히 중복 콘텐츠 문제 는 SEO 성능을 최적화하는 데 도움이 되는 몇 가지 다른 방법으로 처리할 수 있습니다.

중복 콘텐츠 확인 방법

문제를 해결하려면 먼저 문제가 있다는 것을 알아야 합니다. 이렇게 하려면 사이트에서 중복 콘텐츠를 검색 해야 합니다. 몇 가지 방법으로 이 작업을 수행할 수 있습니다.

1. 구글 서치 콘솔

Google Search Console은 검색 결과에서 웹페이지의 성능에 대한 통찰력을 제공할 수 있습니다. 또한 이 서비스는 검색 결과에서 동일한 페이지 순위의 다른 URL을 찾는 등 중복 콘텐츠 문제 를 식별하는 데 도움이 될 수 있습니다 .

2. 중복 콘텐츠 검색

중복된 콘텐츠를 확인하는 빠른 방법은 페이지에서 텍스트 블록을 검색하는 것입니다. 검색할 때 단어를 따옴표 안에 넣으십시오.

이상적으로는 귀하의 페이지만 표시되어야 합니다. 다른 결과가 있는 경우 항상 그런 것은 아니지만 문제가 있을 수 있습니다. 여러 문장으로 시도해 볼 수 있습니다.

Google 검색 창을 사용하여 사이트를 조회할 수도 있습니다. "site:" 뒤에 URL을 입력하고 모두 따옴표로 묶습니다. 이렇게 하면 Google에서 색인을 생성하고 잠재적으로 순위를 매길 수 있는 페이지가 표시됩니다.

3. 중복 콘텐츠 검사기

귀하의 콘텐츠가 독창적이지 않은지, 내부 중복 콘텐츠 문제 가 있는지 또는 다시 게시되었는지 확인하는 데 도움이 되는 Google 중복 콘텐츠 검사기 와 다양한 표절 검사기가 있습니다.

중복 콘텐츠를 해결하는 방법

Google은 중복 콘텐츠를 상당히 잘 처리하지만 최상의 결과를 얻으려면 항상 더 많이 관여하고 가능한 문제를 직접 해결할 수 있습니다.

수행할 작업에 대한 몇 가지 팁은 다음과 같습니다.

  • 301 리디렉션, 표준 URL 또는 noindex 리디렉션을 사용합니다.
  • 내부 연결에서 일관성을 유지하십시오.
  • 최상위 도메인(TLD)을 사용하여 국가별 콘텐츠를 처리합니다.
  • 신디케이트된 콘텐츠가 포함된 사이트에 귀하의 페이지로 돌아가는 링크가 포함되어 있는지 확인하거나 noindex 태그를 사용하십시오.
  • 유사한 콘텐츠가 있는 페이지를 통합합니다.
  • 스크랩 한 콘텐츠의 경우 DMCA 요청 을 제출합니다.

중복 콘텐츠에 대한 Panda 업데이트

Google의 Panda 업데이트는 2011년에 출시되었으며 Google 알고리즘에 매우 중요한 변화였습니다. Panda가 웹사이트의 중복 콘텐츠를 구체적으로 다루기 위한 것은 아니지만 업데이트는 반복 콘텐츠를 피하는 것을 포함하여 고유하고 유익한 텍스트를 권장합니다.

중복 콘텐츠에 대한 FAQ

SEO에서 중복 콘텐츠는 무엇을 의미합니까?

중복 콘텐츠는 완전히 일치하거나 다른 온라인 콘텐츠와 상당히 유사한 실질적인 텍스트 블록을 나타냅니다. 반복적인 콘텐츠는 인터넷의 약 4분의 1을 차지하며 대부분 기만적이거나 악의적이지 않습니다.

Google 중복 콘텐츠 패널티가 있습니까?

구글의 중복 콘텐츠 페널티 는 대부분 미신이 될 정도로 잘못 표현됐다. 중복 콘텐츠는 Google의 웹마스터 가이드라인 을 위반 하고 검색 엔진 결과를 조작하려는 의도가 아닌 한 처벌되지 않습니다.

중복 콘텐츠가 SEO 순위에 영향을 줍니까?

중복 콘텐츠는 SEO 전략에 부정적인 영향을 미칠 수 있습니다. Google은 동일한 페이지로 연결되는 여러 URL을 통합하려고 시도하고 다시 게시된 콘텐츠보다 더 높은 원본 결과를 표시합니다. 그러나 바람직하지 않은 URL이나 교차 도메인 재게시가 원본 기사보다 순위가 높을 수 있으므로 완벽한 시스템은 아닙니다. 이것이 중복 콘텐츠도 사전에 해결해야 하는 이유입니다.

얼마나 많은 중복 콘텐츠가 허용됩니까?

보유하고 있는 콘텐츠 중 복제할 수 있는 콘텐츠의 양을 제안하는 확실한 측정은 없습니다. 그러나 일반적으로 중복된 콘텐츠의 5% 이상이 사이트에 도달하지 않아야 합니다. 이 비율을 관리하려면 온라인에서 표절 검사기를 사용하십시오.