True Destination – Google Search Console의 적용 범위 보고에서 리디렉션에 대한 혼란스럽긴 하지만 종종 정확한 실제 도착 URL을 설명합니다.

게시 됨: 2022-11-03
이메일

Google이 리디렉션을 "robots.txt에 의해 차단됨", "soft 404s", "noindexed", "404s" 등과 같은 다른 카테고리로 보고할 때 혼란스럽다면 Google이 자동으로 리디렉션을 따라가 상태를 보고할 수 있습니다. 대신 실제 도착 URL입니다. 내 게시물은 상황을 자세히 다루며 야생에서 일어나는 일의 예를 제공합니다.

SEO 관점에서 웹사이트를 많이 분석하는 동안 의심할 여지 없이 Google Search Console(GSC) 보고에 깊이 빠져들게 될 것입니다. GSC에는 Google에서 직접 가져온 많은 양의 데이터가 포함되어 있으며 사이트 소유자와 SEO가 주요 통찰력을 표시하는 데 도움이 될 수 있습니다. 하지만 GSC 보고와 관련된 뉘앙스와 Google이 해당 보고서에서 제공하는 정보를 결정하는 방법을 이해하는 것이 중요합니다. SEO를 개선하기 위한 조치를 취할 때 데이터가 표시하는 내용을 명확하게 이해하는 것이 중요합니다.

그리고 GSC의 인덱스 커버리지 보고(및 URL 검사 도구)에서 리디렉션에 대한 두려운 실제 대상 URL보다 GSC 데이터 혼동에 대한 더 좋은 예는 없습니다. 나는 고객으로부터 이것에 대해 너무 많은 질문을 받았기 때문에 이 포스트를 쓰기로 결정했습니다. 그래서 나는 사람들을 여기에서 지적할 수 있고 반복해서 설명할 수 있습니다.

진정한 목적지 URL의 비밀을 파헤치는 GSC 모험에 저와 함께 하십시오. 이미 알고 계시는 분들도 계시겠지만 저는 잘 모르는 분들도 계실 텐데요. 그리고 그렇지 않은 사람들에게는 이 모든 것이 곧 이해될 것입니다. 이것이 작동하는 방식이 마음에 들지 않을 수도 있지만 적어도 URL이 GSC에서 특정 방식으로 분류되는 이유를 이해할 수 있을 것입니다(URL 검사 도구를 통해).

리디렉션에 대한 GSC의 두려운 실제 대상 URL 상황은 무엇입니까?
리디렉션되는 URL의 GSC에서 인덱싱 상태를 볼 때 Google은 실제 대상 URL (해당 URL이 귀하의 사이트 외부에 있더라도)에 대해 보고합니다. 예를 들어, URL을 다른 URL로 리디렉션하고 해당 URL을 어떤 이유로 인덱싱할 수 없는 경우 GSC는 리디렉션을 조용히 따라가며 최종 목적지의 상태를 보고합니다. 그리고 이것이 일어나고 있는지 모르는 사이트 소유자와 SEO에게는 매우 혼란스러울 수 있습니다.

예, 이는 URL이 "robots.txt에 의해 차단됨", "noindexed", "soft 404", "404" 등으로 표시되는 것을 볼 수 있음을 의미합니다(검사 중인 URL이 실제로 리디렉션되는 경우). 상상할 수 있듯이 많은 사이트 소유자는 URL이 리디렉션되고 있다는 것을 100% 알 때 "robots.txt에 의해 차단됨"이 표시되면 혼란스러워 합니다.

Google의 John Mueller는 이에 대해 여러 번 질문을 받았으며 위에서 설명한 내용으로 답변했습니다(그리고 약간 혼란스러울 수 있음을 인정합니다). 또한 Barry는 John의 의견을 기반으로 URL 검사 도구에서 이러한 일이 어떻게 발생하는지에 대한 게시물을 작성했습니다. 이것이 문서화되었지만 많은 사이트 소유자와 SEO에게 여전히 매우 혼란스러운 상황이라는 것을 알았습니다(이것이 내가 이 게시물을 쓰는 이유입니다).

다음은 Google이 리디렉션을 자동으로 따르는 방법(및 GSC에 표시되는 방법)을 설명하는 John에 대한 링크가 포함된 제 트윗입니다.

이제 이것이 일어나고 있다는 것을 알았으므로 이것이 실제로 GSC에서 어떻게 보이는지 궁금할 것입니다. 나는 이것을 야생에서 일어나는 예와 함께 다음에 다룰 것입니다.

리디렉션을 자동으로 추적하고 GSC에서 실제 도착 URL 상태를 보고하는 Google의 예:
아래에서 실제 도착 URL과 리디렉션에 대해 보고하는 Google의 스크린샷과 함께 예시를 제공하겠습니다. 다시 말하지만, 이것은 어떤 이유로 최종 도착 URL을 인덱싱할 수 없는 경우입니다.

robots.txt에 의해 차단됨:
URL은 사이트 외부에서 robots.txt에 의해 차단된 URL로 리디렉션됩니다. Google은 최종 목적지가 실제로 허용되지 않기 때문에 리디렉션 URL이 "robots.txt에 의해 차단됨"이라고 보고합니다.

robots.txt에 의해 차단된 트위스트:
이 URL은 먼저 robots.txt에 의해 차단된 추적 URL로 리디렉션됩니다. 최종 목적지는 차단 되지 않았지만 Google은 허용되지 않았기 때문에 최종 목적지 URL을 찾기 위해 첫 번째 리디렉션을 따를 수 없습니다. 체인의 첫 번째 URL이 차단되었음을 알고 GSC에서 이를 보고합니다. 아래에서 두 번째 단계에서 URL이 실제로 robots.txt에 의해 차단되었음을 알 수 있습니다(이것이 GSC에 보고됨).

소프트 404:
URL은 소프트 404 페이지로 리디렉션됩니다(제품을 사용할 수 없음). Google은 리디렉션 URL이 소프트 404라고 보고합니다(실제 대상 URL이 소프트 404로 표시되기 때문에).

다음은 URL이 리디렉션되는 페이지입니다(제품이 "현재 사용할 수 없음"). 따라서 소프트 404:

색인 생성되지 않음:
네, 짐작하셨군요. URL은 색인이 생성되지 않은 페이지로 리디렉션됩니다. Google은 리다이렉트되는 URL을 커버리지 보고에서 색인이 생성되지 않은 것으로 보고합니다.

크롤링됨, 색인 생성되지 않음:
언뜻 보면 리디렉션이 "크롤링됨, 색인이 생성되지 않음"으로 보고되고 있다고 생각할 수 있습니다. 사실이 아니다! Google에서 색인을 생성하지 않는 최종 도착 URL입니다. Google은 실제 도착 URL에 대해 "크롤링됨, 색인이 생성되지 않음"을 보고합니다.

최종 도착 URL은 실제로 색인이 생성되지 않았습니다.

404:
Google은 리디렉션을 404로 어떻게 볼 수 있습니까? 그렇지 않습니다. 404가 실제로 도착하는 URL이며 이것이 GSC에 보고된 것입니다.

404 도메인 이름 변경:
이것은 도메인 이름을 변경할 때 이것이 어떻게 작동하는지 설명하기 위한 404 상황의 변형일 뿐입니다. 이전 도메인의 URL은 새 도메인 이름의 URL로 리디렉션되지만 URL은 마이그레이션되지 않았습니다(404s). 따라서 Google은 리디렉션 URL이 404라고 보고합니다.

죄송합니다. 리디렉션과 혼동이 더 많습니다.
URL이 200 헤더 응답 코드로 확인되고 인덱싱된 페이지로 리디렉션되면 URL 검사 도구는 리디렉션에 대해 정확하게 보고하지만(초기 URL은 리디렉션이며 인덱싱되지 않음) Google은 표준을 다음과 같이 표시합니다. 실제 도착 URL(리디렉션이 연결되는 위치). 특히 리디렉션 URL이 리디렉션과 다른 것으로 보고되는 다른 예와 함께 위에서 설명한 모든 것을 기반으로 혼동에 대해 이야기하십시오.

혼란을 해결하기 위한 GSC의 가능한 솔루션:
그렇다면 이것이 어떻게 더 직관적일 수 있습니까? GSC가 실제 도착 URL에 대해 보고한다는 메시지를 실제로 제공했다면 사이트 소유자와 SEO에 대한 혼란을 해소할 수 있다고 생각합니다. 아래에서는 이것이 GSC에서 어떻게 보이는지 조롱했습니다. Daniel Waisberg가 읽고 있다면(그리고 당신이 읽기를 바랍니다), 이것을 추가하십시오!

요약: 리디렉션 및 도착 URL 보고와 관련된 혼란을 해결합니다.
이 게시물이 Google이 자동으로 리디렉션을 추적하고 GSC의 실제 도착 URL을 보고하는 방법을 이해하는 데 도움이 되었기를 바랍니다. 나는 그것이 많은 사이트 소유자와 SEO에게 혼란스러운 주제라는 것을 알고 있으며 그것이 많은 머리를 긁는 순간으로 이끌었다고 확신합니다. 현재로서는 URL이 리디렉션될 때 GSC가 실제 도착 URL에 대해 보고하고 있음을 명심하십시오. 따라서 GSC의 적용 범위 보고에서(또는 URL 검사 도구를 사용할 때) 다른 범주에서 리디렉션을 발견하더라도 놀라지 마십시오. 그리고 누가 알겠습니까, 아마도 GSC 제품 팀이 위에서 조롱한 그 메시지를 구현할 것입니다…

GG