True Destination – Desmistificando o URL de destino verdadeiro confuso, mas muitas vezes preciso, para redirecionamentos no relatório de cobertura do Google Search Console

Publicados: 2022-11-03
E-mail

Se você está confuso quando o Google relata redirecionamentos como outras categorias, como "bloqueado por robots.txt", "soft 404s", "noindexed", "404s" e outros, pode ser o Google seguindo silenciosamente o redirecionamento e relatando o status de o URL de destino verdadeiro em vez disso. Meu post cobre a situação em detalhes e fornece exemplos disso acontecendo na natureza.

Ao analisar fortemente os sites do ponto de vista de SEO, você sem dúvida se encontrará profundamente nos relatórios do Google Search Console (GSC). O GSC contém uma grande quantidade de dados diretamente do Google e pode ajudar os proprietários de sites e SEOs a obter insights importantes. Dito isso, é importante entender as nuances envolvidas nos relatórios do GSC e como o Google determina as informações que fornece nesses relatórios. Ter uma compreensão clara do que os dados estão mostrando é importante ao tomar medidas para melhorar o SEO.

E não há melhor exemplo de confusão de dados do GSC do que o temido URL de destino verdadeiro para redirecionamentos no relatório de cobertura de índice do GSC (e ferramenta de inspeção de URL). Recebi tantas perguntas sobre isso de clientes que decidi escrever este post para que eu possa apontar as pessoas aqui em vez de explicá-lo repetidamente.

Então, junte-se a mim em uma aventura GSC onde descobrimos os segredos do verdadeiro URL do destino. Alguns de vocês já devem saber disso, mas eu sei que alguns não. E para aqueles que não o fazem, tudo isso fará sentido muito em breve. Você pode não estar satisfeito com a forma como isso está funcionando, mas pelo menos você entenderá por que os URLs são categorizados de determinadas maneiras no GSC (e por meio da ferramenta de inspeção de URL).

Qual é a temida situação de URL de destino verdadeiro no GSC para redirecionamentos?
Ao visualizar o status de indexação no GSC de URLs que estão sendo redirecionados, o Google informa sobre o verdadeiro URL de destino (mesmo que esse URL esteja fora do seu próprio site). Por exemplo, se você redirecionar uma url para outra url e essa url não for indexável por algum motivo, o GSC seguirá silenciosamente o redirecionamento e informará o status do destino final. E isso pode ser muito confuso para proprietários de sites e SEOs que não sabem que isso está acontecendo.

Sim, isso significa que você pode ver urls aparecendo como "bloqueado por robots.txt", "noindexed", "soft 404", "404" e muito mais (quando o URL que você está inspecionando está realmente redirecionando). Como você pode imaginar, muitos proprietários de sites ficam confusos quando veem “bloqueado por robots.txt” quando sabem 100% que um URL está redirecionando.

John Mueller, do Google, foi questionado sobre isso muitas vezes e respondeu com o que expliquei acima (e admite que pode ser um pouco confuso). Além disso, Barry escreveu um post sobre como isso acontece com a ferramenta de inspeção de URL com base nos comentários de John. Mesmo que isso tenha sido documentado, acho que ainda é uma situação muito confusa para muitos proprietários de sites e SEOs (e é por isso que estou escrevendo este post).

Aqui está um tweet meu com um link para John explicando como o Google segue silenciosamente os redirecionamentos (e como isso aparece no GSC):

Agora que você sabe que isso está acontecendo, você pode estar se perguntando como isso realmente se parece no GSC. Vou cobrir isso a seguir com exemplos disso acontecendo na natureza.

Exemplos de como o Google segue silenciosamente os redirecionamentos e informa o verdadeiro status do URL de destino no GSC:
Abaixo, fornecerei exemplos com capturas de tela de relatórios do Google sobre os URLs de destino verdadeiros versus o redirecionamento. Novamente, isso ocorre quando os URLs de destino final não são indexáveis ​​por algum motivo.

Bloqueado por robots.txt:
O URL é redirecionado para fora do site para um URL bloqueado pelo robots.txt. O Google informa que o URL de redirecionamento está "bloqueado por robots.txt", pois o destino final não é permitido.

Uma reviravolta bloqueada pelo robots.txt:
Esse URL redireciona primeiro para um URL de rastreamento, que é bloqueado pelo robots.txt. O destino final não está bloqueado, mas o Google não pode seguir o primeiro redirecionamento para encontrar o URL de destino final, pois não é permitido. Ele apenas sabe que o primeiro URL da cadeia está bloqueado e informa isso no GSC. Abaixo, você pode ver que a segunda etapa mostra que o URL está realmente bloqueado pelo robots.txt (e é isso que é relatado no GSC).

Suave 404:
O URL redireciona para uma página que é um soft 404 (um produto não está disponível). O Google relata que o URL de redirecionamento é um soft 404 (já que o verdadeiro URL de destino está sendo visto como um soft 404).

Aqui está a página para a qual o URL redireciona (com o produto “atualmente indisponível”). Daí o 404 suave:

Não indexado:
Sim, você adivinhou. O URL redireciona para uma página que não é indexada. O Google relata o URL que está redirecionando como não indexado no relatório de cobertura:

Rastreado, não indexado:
À primeira vista, você pode pensar que o redirecionamento está sendo relatado como “Rastreado, não indexado”. Não é verdade! É o URL de destino final que não está sendo indexado pelo Google. O Google está relatando "Rastreado, não indexado" para o URL de destino verdadeiro.

O URL de destino final não está indexado:

404:
Como o Google pode ver um redirecionamento como um 404? Não. É o verdadeiro URL de destino que 404s e é isso que é relatado no GSC.

404 com alteração de nome de domínio:
Esta é apenas uma variação da situação 404 para explicar como isso funciona ao alterar nomes de domínio. A url no domínio antigo redireciona para uma url no novo nome de domínio, mas a url nunca foi migrada (é 404s). Portanto, o Google informa que o URL de redirecionamento é um 404.

Desculpe, mais confusão com redirecionamentos:
Quando um URL redireciona para uma página que resolve com um código de resposta de 200 cabeçalhos e é indexado, a ferramenta de inspeção de URL informa com precisão sobre o redirecionamento (e diz que o URL inicial é um redirecionamento e não indexado), mas o Google mostra o canônico como o URL de destino verdadeiro (onde o redirecionamento leva). Fale sobre confuso, especialmente com base em tudo que expliquei acima com os outros exemplos em que os URLs de redirecionamento estão sendo relatados como algo diferente de um redirecionamento…

Uma possível solução no GSC para esclarecer a confusão:
Então, como isso pode ser mais intuitivo? Acho que se o GSC realmente fornecesse uma mensagem informando que está informando o verdadeiro URL de destino, isso poderia esclarecer a confusão para os proprietários de sites e SEOs. Abaixo, eu fiz uma simulação de como isso pode ser no GSC. Se Daniel Waisberg estiver lendo (e espero que você esteja), por favor, adicione isso!

Resumo: Esclarecendo a confusão com redirecionamentos e relatórios de URL de destino.
Espero que esta postagem tenha ajudado você a entender como o Google está seguindo silenciosamente os redirecionamentos e relatando os verdadeiros URLs de destino no GSC. Eu sei que é um tópico confuso para muitos donos de sites e SEOs e tenho certeza que isso levou a muitos momentos difíceis. Lembre-se de que, a partir de agora, o GSC está relatando os URLs de destino verdadeiros quando um URL é redirecionado. Portanto, não se surpreenda ao notar redirecionamentos em outras categorias nos relatórios de cobertura do GSC (ou ao usar a ferramenta de inspeção de url). E quem sabe, talvez a equipe de produto do GSC implemente essa mensagem que eu zombei acima…

GG