O que são páginas órfãs e como corrigi-las

Publicados: 2022-06-14

Páginas órfãs são páginas dentro de um domínio sem links internos apontando para elas.  

Ter páginas órfãs em seu site traz consequências negativas:

  • Páginas com potencial de classificação que não estão vinculadas à estrutura do seu site provavelmente não serão descobertas e indexadas e não fornecerão os benefícios esperados (ou seja, tráfego orgânico) para seu site,
  • Páginas órfãs de baixa qualidade podem ser rastreadas e indexadas devido a outros sinais de SEO, como backlinks (links provenientes de outros sites). Isso seria um desperdício do orçamento de rastreamento do seu site que pode afetar a indexação de outras páginas mais valiosas em seu site.

As páginas órfãs são onipresentes, e abordá-las não é simples — elas podem aparecer por vários motivos. Você pode simplesmente esquecer de adicionar links internos a algumas páginas, enquanto em outras situações, você pode criar páginas órfãs de propósito. Dependendo do papel que uma página órfã desempenha em seu site, ela exigirá um tratamento diferente.

Neste artigo, explicarei como vários tipos de páginas órfãs afetam seu SEO, como você pode descobrir páginas órfãs em seu site e o que fazer para resolvê-las.

Conteúdo ocultar
1 Como as páginas órfãs afetam o SEO?
1.1 Como as páginas órfãs afetam os mecanismos de pesquisa?
1.2 Como as páginas órfãs afetam os usuários?
2 Tipos de páginas órfãs
3 Como encontrar páginas órfãs
3.1 Obtenha uma lista de páginas rastreáveis
3.2 Descubra quais páginas estão sendo acessadas
3.2.1 Obter dados do Google Analytics
3.2.2 Obter dados do Google Search Console
3.2.3 Usar arquivos de log do servidor
3.3 Referência cruzada dos dados
4 Como analisar páginas órfãs
5 Otimizar páginas órfãs
5.1 Link para a página de outras páginas internas
5.2 Redirecionar a página
5.3 Remova a página
5.4 Deixe a página como está
6 Procure regularmente novas páginas órfãs
7 Conclusão

Como as páginas órfãs afetam o SEO?

As páginas órfãs não têm links internos apontando para elas, tornando-as problemáticas para rastreadores e usuários de mecanismos de pesquisa. Eles não serão encontrados navegando em seu site; se eles forem encontrados de outras maneiras, pode ser difícil entender como eles se relacionam com o restante do seu domínio. Isto é particularmente verdadeiro para os motores de busca.

Como as páginas órfãs afetam os mecanismos de pesquisa?

A falta de links internos influencia negativamente como os rastreadores dos mecanismos de pesquisa descobrem o conteúdo do seu site.

estrutura do site com todas as páginas vinculadas vs. estrutura do site com uma página órfã

Os mecanismos de pesquisa encontram novas páginas por:

  • Seguir links internos ou externos para URLs em seu site, ou
  • Examinando seus arquivos de sitemap XML .

As páginas órfãs podem ser incluídas no mapa do site ou ter links de outros domínios . Elas ainda serão consideradas páginas órfãs, mas suas chances de serem rastreadas e indexadas aumentam – o que não é necessariamente bom.

Embora o Google possa indexar um URL encontrado em um mapa do site sem links de entrada, ele terá dificuldades para colocar esse URL na hierarquia do site e pode não considerá-lo valioso o suficiente devido à falta de links. A indexação de páginas órfãs em sitemaps depende de muitos fatores, como o tamanho do site (com sites maiores, o Google normalmente deixa muitas páginas não rastreadas e não indexadas, e as páginas órfãs provavelmente recebem pouca prioridade).

Como resultado, as páginas órfãs geralmente não são indexadas e não são classificadas no Google , não gerando tráfego orgânico para seu site.

Se uma página órfã for indexada devido a outros fatores, as complicações não param por aí. Sem links internos, o PageRank não poderá fluir para a página órfã . Isso significa que qualquer autoridade de link que outras páginas do domínio ganhem por ter backlinks relevantes e de alta qualidade não será transferida para as páginas órfãs.

Além disso, sem links internos, os mecanismos de pesquisa não têm contexto semântico ou estrutural para avaliar a página . Os mecanismos de pesquisa podem se esforçar para determinar para quais consultas a página é relevante sem saber onde ela se encaixa na estrutura geral do site.

Se você tiver páginas órfãs de baixa qualidade e o rastreamento não for restrito em arquivos robots.txt ou a indexação não for bloqueada por meio de uma tag noindex , os mecanismos de pesquisa poderão desperdiçar o orçamento de rastreamento ao rastreá-las. Isso é especialmente prejudicial se você tiver um site grande que pode sofrer com problemas de orçamento de rastreamento.

Em casos raros, as páginas órfãs de baixa qualidade também podem levar ao inchaço do índice , que ocorre quando um mecanismo de pesquisa indexa páginas em um domínio de maneira descontrolada, indexando qualquer conteúdo que possa encontrar, incluindo conteúdo fino ou duplicado.

E, para piorar as coisas, se os mecanismos de pesquisa determinarem que a página não é valiosa o suficiente para ser indexada, mas você a tornar indexável, isso poderá impedir que eles indexem outras páginas em seu site . Isso porque essas páginas de baixa qualidade podem influenciar negativamente a ideia geral da qualidade do seu site.

Lembre-se de que se uma página tiver um link interno, ela não será mais considerada uma página órfã. Mas, se uma página tiver apenas um link e for essencial para o seu site, considere criar mais links para fortalecer sua posição na hierarquia do site. Dessa forma, você também pode evitar que a página fique órfã acidentalmente se o único link for removido.

Como as páginas órfãs afetam os usuários?

Páginas órfãs também são problemáticas para os usuários.

Se suas páginas órfãs contiverem conteúdo de alta qualidade que deve direcionar tráfego significativo para seu site e resultar em conversões, os usuários terão dificuldade em encontrá-las se elas não estiverem incluídas na estrutura de seu site. Isso também leva a um desperdício de tempo e recursos dedicados à criação do conteúdo dessas páginas.

É diferente se suas páginas órfãs não foram vinculadas intencionalmente, mas permaneceram localizáveis ​​para os usuários. Os visitantes que chegam a essas páginas podem encontrar conteúdo desatualizado ou irrelevante, levando a uma experiência de usuário ruim.

Tipos de páginas órfãs

Causas comuns de páginas órfãs incluem:

  • Uma migração de site — como quando algumas das páginas antigas não são incluídas na nova navegação principal e não são redirecionadas para a nova página de destino ,
  • Arquitetura de site não otimizada , em que algumas páginas ficam desvinculadas porque não há estratégia de arquitetura de site. Também pode haver mecanismos no site que não incluam automaticamente os novos tipos de páginas na navegação,
  • Um CMS criando URLs adicionais que você não conhece,
  • Páginas desatualizadas ou irrelevantes, onde os links para elas são removidos, mas as páginas permanecem publicadas - isso pode ocorrer com produtos fora de estoque,
  • Não adicionar links para determinadas páginas de propósito – por exemplo, páginas de destino para campanhas promocionais ou pagas.

Muitos deles ocorrem devido à falta de processos coerentes e universais para realizar migrações de sites, mover sites de um ambiente de teste para produção, fazer alterações significativas no site etc.

Como pode haver muitas razões diferentes para a existência de páginas órfãs , abordá-las não é apenas adicionar links a essas páginas.

Nem todas as páginas devem ter links apontando para elas . Adicionar links significa que você deseja ativamente que os mecanismos de pesquisa e os usuários visualizem essas páginas.

Mantê-los fora da estrutura do seu site é um dos sinais que indicam aos mecanismos de pesquisa que eles não são valiosos para você. Isso, combinado com outros aspectos, como restringir o rastreamento no robots.txt ou torná-los não indexáveis ​​com uma tag noindex, os manterá fora do índice do Google.

Como encontrar páginas órfãs

O primeiro passo antes de consertar qualquer coisa é encontrar suas páginas órfãs. Normalmente, uma excelente maneira de encontrar todas as páginas do seu site é usar um rastreador de SEO, mas, nesse caso, os rastreadores provavelmente não serão suficientes. Esse é o problema das páginas órfãs – os rastreadores não as encontrarão seguindo os links do seu site.

As fontes de dados que você pode usar para encontrar páginas órfãs em seu site são:

  1. Seus sitemaps ou outras listas de URLs que você possa ter.
  2. Bancos de dados de links (como Ahrefs.com) que encontram links para suas páginas em outros sites.
  3. Serviços de análise da web, como o Google Analytics.
  4. Análise de pesquisa como o Google Search Console.
  5. Seus arquivos de log do servidor.

Algumas ferramentas combinam essas fontes de dados. Por exemplo, o site Audit da Ahrefs mostra uma seção no Page Explorer com páginas órfãs encontradas por meio de backlinks e sitemaps. A limitação é que o Ahrefs não mostrará páginas órfãs que não estejam nos mapas do site ou não tenham backlinks.

Da mesma forma, você pode encontrar páginas órfãs usando várias fontes de dados com o Site Audit da SEMrush . Dá-lhe duas opções:

  1. Visualize as páginas encontradas em seus sitemaps sem links internos.
  2. Visualize páginas com acessos recentes no Google Analytics que não possuem links internos.

Screaming Frog tem um guia legal sobre como descobrir páginas órfãs usando seu SEO Spider . O processo deles gira em torno da análise de seus sitemaps XML para páginas rastreáveis ​​e do uso das integrações com o Google Analytics e o Google Search Console para fornecer os dados para o rastreamento .

Você poderá visualizar URLs órfãos para cada uma das três fontes de dados – sitemaps, Google Analytics e Google Search Console. Você pode usar o relatório Páginas órfãs para exportar uma lista de todas as páginas órfãs encontradas.

Você também pode ver o Sitebulb, que, da mesma forma, oferece uma opção para conectar várias fontes de dados, incluindo Google Analytics e Google Search Console – confira o guia do Sitebulb para encontrar páginas órfãs .

Para acessar dados mais abrangentes sobre seu site, você precisa se aprofundar em sua estrutura. A solução mais comum seria fazer referência cruzada de conjuntos de dados por conta própria.

Obtenha uma lista de páginas rastreáveis

Você pode recuperar uma lista de páginas de seu arquivo de mapa de site XML, pois ele deve conter apenas seus URLs rastreáveis ​​e indexáveis. A melhor abordagem é usar um rastreador.

Qualquer rastreador que você usar deve ser definido apenas para rastrear páginas indexáveis . Ele deve pular páginas de rastreamento que são:

  • Bloqueado de indexação usando a tag noindex,
  • Não rastreável devido às diretivas do robots.txt.

Lembre-se apenas de rastrear os URLs canônicos, incluindo o protocolo correto (HTTP ou HTTPS) e o subdomínio (www ou não www).

Descubra quais páginas estão sendo acessadas

Depois de ter uma lista de suas páginas rastreáveis, você precisa encontrar as páginas que são visitadas por usuários ou rastreadores.

Obter dados do Google Analytics

O Google Analytics pode ajudar você a encontrar páginas que usuários ou rastreadores acessam seguindo links externos (incluindo mídias sociais) ou digitando diretamente o endereço.

No Google Analytics, navegue até Comportamento > Conteúdo do site > Todas as páginas.

Você verá todos os URLs que foram visitados anteriormente. Ajuste as datas para ir o mais longe possível. Em seguida, exporte a lista recebida.

Obter dados do Google Search Console

Você também pode encontrar dados úteis no Google Search Console, e é bom combiná-los com os dados encontrados no Google Analytics. O Google Search Console pode conter dados sobre URLs que o rastreador do Google acessou por outros meios que não seus links internos.

No GSC, selecione Desempenho > Páginas.

Certifique-se de que as Impressões estejam incluídas nos dados apresentados. Altere o intervalo de datas para voltar o máximo possível no tempo, o que mostrará todos os URLs que receberam impressões no período selecionado.

Usar arquivos de log do servidor

Como alternativa, em vez do Google Analytics e do Google Search Console, você pode adquirir os dados mais abrangentes dos arquivos de log do seu servidor . Os arquivos de log contêm informações sobre quem visitou seu site – incluindo rastreadores e usuários de mecanismos de pesquisa e quais páginas eles visitaram. Para usá-lo, você precisará de acesso ao servidor — consulte seus desenvolvedores para saber se é possível.

Cruze os dados

Você precisa procurar as páginas encontradas no conjunto de dados do Google Analytics e do Google Search Console ou os arquivos de log que estão faltando na lista exportada de páginas conhecidas, pois essas serão suas páginas órfãs.

Você pode comparar os conjuntos de dados no Planilhas Google, Excel ou qualquer outra ferramenta.

Depois de identificar todas as suas páginas órfãs, exporte-as para um arquivo ou planilha separada para a próxima parte da otimização.

Como analisar páginas órfãs

Depois de ter uma lista de páginas órfãs em seu site, você precisa examinar as páginas descobertas e fazer a si mesmo algumas perguntas que o ajudarão a determinar o que fazer com elas :

  • Esta página é valiosa para o seu site? Tem um objetivo importante relacionado a direcionar tráfego ou conversões?
  • Esta página é classificada para alguma palavra-chave, apesar de ser uma página órfã?
  • Onde a página deve existir na taxonomia do seu site?
  • Esta página é duplicada ou quase duplicada? Você pode mover o conteúdo para outra página relacionada que não tenha ficado órfã?
  • Esta página está otimizada? Você deve melhorá-lo de alguma forma?
  • A página tem muitos backlinks de qualidade?

Além disso, é bom considerar por que as páginas ficaram órfãs em primeiro lugar . Isso ajudará você a estar ciente de tais problemas no futuro e possivelmente evitá-los.

Otimizar páginas órfãs

Depois de entender a finalidade da página órfã e como ela ajuda a direcionar seu site e as metas de marketing, você pode determinar qual etapa, se houver, a ser seguida com a página.

Link para a página de outras páginas internas

Quando você deseja que uma página órfã seja encontrada e visitada porque é imprescindível para os visitantes do site, você deve adicionar links internos a ela de outras páginas do seu site . Dessa forma, você cria uma oportunidade para que a página seja encontrada por rastreadores de pesquisa e usuários.

Você precisa pensar no local mais adequado para criar um link para ele – você pode considerar o seguinte:

  • Você deve adicionar links a ele de outros artigos relacionados ao tema?
  • Você precisa reestruturar a arquitetura do seu site para abrir espaço para esta página?
  • Você deve reescrever algum de seu conteúdo para que os links se encaixem melhor?
  • Deve haver um link para ele na navegação principal ou no rodapé?
  • Qual texto âncora você deve escolher para dar contexto aos mecanismos de pesquisa e aos usuários que o visitam?

Se você não tiver certeza de como abordá-los, nós o cobrimos com nosso artigo sobre links internos .

Redirecionar a página

Outro método é configurar um redirecionamento de URL para um novo local – idealmente, uma página equivalente relevante que ainda será útil para os visitantes e complementará a jornada do usuário sem interrupções.

Se você redirecionar permanentemente a página, use um redirecionamento 301 para reter o máximo de PageRank possível e indicar corretamente a mudança para os mecanismos de pesquisa.

Remover a página

Se você encontrou uma página órfã que não é valiosa e necessária para seu site e é impossível redirecioná-la, você pode removê-la .

A abordagem mais típica é alterar seu código de status para 404.

Deixe a página como está

Mantenha a página desvinculada se estiver atendendo a uma necessidade comercial que não exija links internos para a página.

Esse pode ser o caso se, por exemplo, você tiver uma página de destino para uma campanha que deseja mostrar aos usuários apenas em determinados momentos.

Procure regularmente novas páginas órfãs

Dependendo do tamanho do seu site, você deve configurar um processo de monitoramento para capturar quaisquer futuras páginas órfãs antes que elas tenham a chance de impactar seu SEO.

Por exemplo, você pode configurar um rastreamento recorrente para localizar páginas órfãs no futuro .

A melhor maneira de evitar que páginas órfãs apareçam no futuro é identificar o que as causa e resolver o problema em seu núcleo . Por exemplo, se você definir um mecanismo em seu site que gera URLs desnecessários sem links, corrija-o agora para evitar que mais páginas órfãs apareçam com o passar do tempo.

Sempre que você publicar uma nova página, certifique-se de que os links estejam apontando para ela, a menos que você conscientemente não queira que a página seja vinculada. Se possível, implemente soluções que gerem automaticamente links internos, como páginas de categorias e itens relacionados.

Empacotando

A otimização de páginas órfãs em seu site pode ajudá-lo a:

  • Adicione contexto a eles e a outras páginas na estrutura do seu site,
  • Torne as páginas rastreáveis ​​e indexáveis, dando a elas uma chance maior de classificação para palavras-chave apropriadas,
  • Transfira o PageRank entre mais páginas do seu site.

Tenha em mente que pequenas quantidades de páginas órfãs são padrão para qualquer site e não devem ser tratadas como um grande problema.

O problema se torna mais grave à medida que você obtém mais páginas órfãs, o que pode fazer com que você perca classificações, tráfego e conversões em potencial, prejudicando sua receita e sucesso nos negócios.

Priorize ter um processo regular para capturar quaisquer páginas órfãs indesejadas e resolvê-las imediatamente.