¿Qué son las páginas huérfanas y cómo solucionarlas?

Publicado: 2022-06-14

Las páginas huérfanas son páginas dentro de un dominio sin ningún enlace interno que apunte a ellas.  

Tener páginas huérfanas en su sitio tiene consecuencias negativas:

  • Es poco probable que las páginas con potencial de clasificación que no están vinculadas desde la estructura de su sitio se descubran e indexen y no proporcionarán los beneficios esperados (es decir, tráfico orgánico) para su sitio.
  • Las páginas huérfanas de baja calidad pueden rastrearse e indexarse ​​debido a otras señales de SEO, como backlinks (enlaces provenientes de otros sitios web). Esto sería una pérdida del presupuesto de rastreo de su sitio que puede afectar la indexación de otras páginas más valiosas en su sitio web.

Las páginas huérfanas son omnipresentes y abordarlas no es sencillo : pueden aparecer por numerosas razones. Es posible que simplemente se olvide de agregar enlaces internos a algunas páginas, mientras que en otras situaciones, puede crear páginas huérfanas a propósito. Según el papel que desempeñe una página huérfana en su sitio, requerirá un tratamiento diferente.

En este artículo, explicaré cómo varios tipos de páginas huérfanas afectan su SEO, cómo puede descubrir páginas huérfanas en su sitio y qué hacer para abordarlas.

ocultar contenido
1 ¿Cómo impactan las páginas huérfanas en el SEO?
1.1 ¿Cómo afectan las páginas huérfanas a los motores de búsqueda?
1.2 ¿Cómo afectan las páginas huérfanas a los usuarios?
2 Tipos de páginas huérfanas
3 Cómo encontrar páginas huérfanas
3.1 Obtener una lista de páginas rastreables
3.2 Descubre a qué páginas se accede
3.2.1 Obtener datos de Google Analytics
3.2.2 Obtener datos de Google Search Console
3.2.3 Usar archivos de registro del servidor
3.3 Referencia cruzada de los datos
4 Cómo analizar páginas huérfanas
5 Optimizar páginas huérfanas
5.1 Enlace a la página desde otras páginas internas
5.2 Redirigir la página
5.3 Eliminar la página
5.4 Dejar la página como está
6 Busque regularmente nuevas páginas huérfanas
7 Resumiendo

¿Cómo impactan las páginas huérfanas en el SEO?

Las páginas huérfanas no tienen enlaces internos que apunten a ellas, lo que las hace problemáticas para los rastreadores y los usuarios de los motores de búsqueda. No se encontrarán al navegar por su sitio web; si se encuentran de otras formas, puede ser difícil entender cómo se relacionan con el resto de su dominio. Esto es particularmente cierto para los motores de búsqueda.

¿Cómo afectan las páginas huérfanas a los motores de búsqueda?

La falta de enlaces internos influye negativamente en cómo los rastreadores de los motores de búsqueda descubren contenido en su sitio web.

estructura del sitio con todas las páginas enlazadas frente a la estructura del sitio con una página huérfana

Los motores de búsqueda encuentran nuevas páginas ya sea por:

  • Seguir enlaces internos o externos a URL en su sitio web, o
  • Examinando sus archivos de mapa de sitio XML .

Las páginas huérfanas pueden estar incluidas en el mapa del sitio o tener enlaces de otros dominios . Todavía se considerarán páginas huérfanas, pero sus posibilidades de ser rastreadas e indexadas aumentan, lo que no es necesariamente bueno.

Si bien Google puede indexar una URL que se encuentra en un mapa del sitio sin enlaces entrantes, tendrá dificultades para colocar dicha URL en la jerarquía del sitio y es posible que no la considere lo suficientemente valiosa debido a la falta de enlaces. El hecho de que las páginas huérfanas en los sitemaps se indexen depende de muchos factores, como el tamaño del sitio web (con sitios web más grandes, Google generalmente deja muchas páginas sin rastrear ni indexar, y es probable que las páginas huérfanas tengan muy poca prioridad).

Como resultado, las páginas huérfanas generalmente no se indexan y no se clasifican en Google , por lo que no generan tráfico orgánico a su sitio web.

Si una página huérfana se indexa debido a otros factores, las complicaciones no terminan ahí. Sin enlaces internos, PageRank no podrá fluir a la página huérfana . Esto significa que cualquier autoridad de enlace que obtengan otras páginas dentro del dominio al tener backlinks relevantes y de alta calidad no se transferirá a las páginas huérfanas.

Además, sin enlaces internos, los motores de búsqueda no tienen un contexto semántico o estructural para evaluar la página . Los motores de búsqueda pueden tener dificultades para determinar para qué consultas es relevante la página sin saber dónde encaja en la estructura general de su sitio.

Si tiene páginas huérfanas de baja calidad y su rastreo no está restringido en archivos robots.txt o su indexación no está bloqueada mediante una etiqueta noindex , los motores de búsqueda pueden desperdiciar el presupuesto de rastreo al rastrearlas. Esto es especialmente perjudicial si tiene un sitio web grande que puede sufrir problemas de presupuesto de rastreo.

En raras ocasiones, las páginas huérfanas de baja calidad también pueden conducir a un aumento del índice , que ocurre cuando un motor de búsqueda indexa páginas en un dominio de manera no controlada, indexando cualquier contenido que pueda encontrar, incluido el contenido delgado o duplicado.

Y, para empeorar las cosas, si los motores de búsqueda determinan que la página no es lo suficientemente valiosa para ser indexada, pero usted la hace indexable, puede evitar que indexen otras páginas en su sitio . Eso es porque estas páginas de baja calidad pueden influir negativamente en la idea general de la calidad de su sitio web.

Recuerda que si una página tiene aunque sea un enlace interno, ya no se considera una página huérfana. Pero, si una página solo tiene un enlace y es esencial para su sitio web, considere crear más enlaces para fortalecer su posición dentro de la jerarquía del sitio. De esta manera, también puede evitar que la página quede huérfana accidentalmente si se elimina el único enlace.

¿Cómo afectan las páginas huérfanas a los usuarios?

Las páginas huérfanas también son problemáticas para los usuarios.

Si sus páginas huérfanas contienen contenido de alta calidad que debería atraer un tráfico significativo a su sitio web y generar conversiones, los usuarios tendrán dificultades para encontrarlas si no están incluidas en la estructura de su sitio. Esto también conduce a una pérdida de tiempo y recursos dedicados a crear el contenido de dichas páginas.

Es diferente si sus páginas huérfanas no se vincularon a propósito pero permanecieron localizables para los usuarios. Los visitantes que acceden a estas páginas pueden encontrar contenido desactualizado o irrelevante, lo que genera una experiencia de usuario deficiente.

Tipos de páginas huérfanas

Las causas comunes de las páginas huérfanas incluyen:

  • Una migración del sitio, como cuando algunas de las páginas antiguas no se incluyen en la nueva navegación principal y no se redirigen a la nueva página de destino.
  • Arquitectura del sitio no optimizada , donde algunas páginas se desvinculan porque no hay una estrategia de arquitectura del sitio. También podría haber mecanismos en el sitio que no incluyan automáticamente los nuevos tipos de páginas en la navegación,
  • Un CMS que crea URL adicionales que usted desconoce,
  • Páginas que se vuelven obsoletas o irrelevantes, donde los enlaces a ellas se eliminan pero las páginas permanecen publicadas; podría ocurrir con productos agotados,
  • No agregar enlaces a ciertas páginas a propósito, por ejemplo, páginas de destino para campañas promocionales o pagas.

Muchos de estos ocurren debido a la falta de procesos coherentes y universales para realizar migraciones de sitios, mover sitios de un entorno de prueba a producción, realizar cambios significativos en el sitio, etc.

Debido a que puede haber tantas razones diferentes para la existencia de páginas huérfanas , abordarlas no se trata solo de agregar enlaces a estas páginas.

No todas las páginas deben tener enlaces que apunten a ellas . Agregar enlaces significa que desea activamente que los motores de búsqueda y los usuarios vean estas páginas.

Mantenerlos fuera de la estructura de su sitio es una de las señales que indican a los motores de búsqueda que no son valiosos para usted. Esto, combinado con otros aspectos, como restringir su rastreo en robots.txt o hacerlos no indexables con una etiqueta noindex, los mantendrá fuera del índice de Google.

Cómo encontrar páginas huérfanas

El primer paso antes de arreglar algo es encontrar tus páginas huérfanas. Por lo general, una excelente manera de encontrar todas las páginas de su sitio web es usar un rastreador SEO, pero en este caso, es probable que los rastreadores no sean suficientes. Ese es el problema con las páginas huérfanas: los rastreadores no las encontrarán siguiendo los enlaces de su sitio.

Las fuentes de datos que puede usar para encontrar páginas huérfanas en su sitio son:

  1. Sus mapas de sitio u otras listas de URL que pueda tener.
  2. Bases de datos de enlaces (como Ahrefs.com) que encuentran enlaces a sus páginas en otros sitios web.
  3. Servicios de análisis web, como Google Analytics.
  4. Análisis de búsqueda como Google Search Console.
  5. Los archivos de registro de su servidor.

Algunas herramientas combinan estas fuentes de datos. Por ejemplo, Site Audit de Ahrefs te muestra una sección en Page Explorer con páginas huérfanas encontradas a través de backlinks y sitemaps. La limitación es que Ahrefs no mostrará páginas huérfanas que no estén en los mapas del sitio o que no tengan backlinks.

Del mismo modo, puedes encontrar páginas huérfanas usando varias fuentes de datos con Site Audit de SEMrush . Te da dos opciones:

  1. Vea las páginas que se encuentran en sus mapas de sitio sin ningún enlace interno.
  2. Ver páginas con visitas recientes en Google Analytics que no tienen enlaces internos.

Screaming Frog tiene una guía ordenada para descubrir páginas huérfanas usando su SEO Spider . Su proceso gira en torno al análisis de sus mapas de sitio XML en busca de páginas rastreables y el uso de las integraciones con Google Analytics y Google Search Console para proporcionar los datos para el rastreo .

Podrá ver las URL huérfanas para cada una de las tres fuentes de datos: mapas del sitio, Google Analytics y Google Search Console. A continuación, puede utilizar el informe de páginas huérfanas para exportar una lista de todas las páginas huérfanas encontradas.

También puede consultar Sitebulb, que, de manera similar, ofrece una opción para conectar múltiples fuentes de datos, incluidos Google Analytics y Google Search Console; consulte la guía de Sitebulb para encontrar páginas huérfanas .

Para acceder a datos más completos sobre su sitio, debe profundizar en su estructura. La solución más común sería hacer referencias cruzadas de conjuntos de datos por su cuenta.

Obtener una lista de páginas rastreables

Puede recuperar una lista de páginas de su archivo de mapa de sitio XML, ya que debe contener solo sus URL rastreables e indexables. El mejor enfoque es utilizar un rastreador.

Cualquiera que sea el rastreador que utilice , debe configurarse únicamente para rastrear páginas indexables . Debe omitir las páginas de rastreo que son:

  • Bloqueado de indexación usando la etiqueta noindex,
  • No rastreable debido a las directivas de robots.txt.

Recuerde rastrear solo las URL canónicas, incluido el protocolo correcto (HTTP o HTTPS) y el subdominio (www o no www).

Descubre a qué páginas se accede

Una vez que tenga una lista de sus páginas rastreables, necesita encontrar páginas que sean visitadas por usuarios o rastreadores.

Obtener datos de Google Analytics

Google Analytics puede ayudarlo a encontrar páginas a las que acceden los usuarios o rastreadores siguiendo enlaces externos (incluidas las redes sociales) o escribiendo directamente la dirección.

En Google Analytics, vaya a Comportamiento > Contenido del sitio > Todas las páginas.

A continuación, verá todas las URL que se han visitado antes. Ajuste las fechas para ir lo más atrás posible. Luego, exporte la lista recibida.

Obtener datos de Google Search Console

También puede encontrar datos útiles en Google Search Console, y es bueno combinarlos con los datos que se encuentran en Google Analytics. Google Search Console puede contener datos sobre las URL a las que accedió el rastreador de Google por medios distintos a sus enlaces internos.

En GSC, seleccione Rendimiento > Páginas.

Asegúrese de que las impresiones estén incluidas en los datos presentados. Cambie el rango de fechas para retroceder lo más posible en el tiempo, lo que le mostrará todas las URL que recibieron impresiones en el período de tiempo seleccionado.

Usar archivos de registro del servidor

Alternativamente, en lugar de Google Analytics y Google Search Console, puede adquirir los datos más completos de los archivos de registro de su servidor . Los archivos de registro contienen información sobre quién ha visitado su sitio, incluidos los rastreadores y usuarios de motores de búsqueda y qué páginas visitaron. Para usarlo, necesitará acceso al servidor; consulte a sus desarrolladores para saber si es posible.

Cruzar los datos

Debe buscar las páginas que se encuentran en el conjunto de datos de Google Analytics y Google Search Console o los archivos de registro que faltan en la lista exportada de páginas conocidas, ya que estas serán sus páginas huérfanas.

Puede comparar los conjuntos de datos en Hojas de cálculo de Google, Excel o cualquier otra herramienta.

Una vez que identifique todas sus páginas huérfanas, expórtelas a un archivo u hoja de cálculo por separado para la siguiente parte de la optimización.

Cómo analizar páginas huérfanas

Una vez que tenga una lista de páginas huérfanas en su sitio web, debe mirar las páginas descubiertas y hacerse algunas preguntas que lo ayudarán a determinar qué hacer con ellas :

  • ¿Esta página es valiosa para su sitio? ¿Tiene un objetivo importante relacionado con generar tráfico o conversiones?
  • ¿Está clasificada esta página para alguna palabra clave, a pesar de ser una página huérfana?
  • ¿Dónde debería existir la página dentro de la taxonomía de su sitio web?
  • ¿Esta página es un duplicado o casi un duplicado? ¿Puede mover el contenido a otra página relacionada que no haya quedado huérfana?
  • ¿Está optimizada esta página? ¿Deberías mejorarlo de alguna manera?
  • ¿La página tiene muchos backlinks de calidad?

Aparte de eso, es bueno considerar por qué las páginas quedaron huérfanas en primer lugar . Esto le ayudará a estar al tanto de tales problemas en el futuro y posiblemente evitarlos.

Optimizar páginas huérfanas

Una vez que comprenda para qué sirve la página huérfana y cómo ayuda a impulsar su sitio web y sus objetivos de marketing, puede determinar qué paso, si corresponde, dar con la página.

Enlace a la página desde otras páginas internas

Cuando desee encontrar y visitar una página huérfana porque es imprescindible para los visitantes del sitio, debe agregarle enlaces internos desde otras páginas de su sitio web . De esta manera, crea una oportunidad para que los rastreadores de búsqueda y los usuarios encuentren la página.

Debe pensar en el lugar más adecuado para vincularlo desde; es posible que desee considerar lo siguiente:

  • ¿Deberías agregarle enlaces desde otros artículos relacionados temáticamente?
  • ¿Necesita reestructurar la arquitectura de su sitio para hacer espacio para esta página?
  • ¿Deberías reescribir algo de tu contenido para que los enlaces encajen mejor?
  • ¿Debería haber un enlace a él en la navegación principal o en el pie de página?
  • ¿Qué texto de anclaje debería elegir para dar contexto a los motores de búsqueda y a los usuarios que lo visitan?

Si no está seguro de cómo abordarlos, lo tenemos cubierto con nuestro artículo sobre enlaces internos .

Redirigir la página

Otro método es configurar una redirección de URL a una nueva ubicación ; idealmente, una página equivalente relevante que seguirá siendo útil para los visitantes y complementará su viaje de usuario sin interrupciones.

Si redirige la página de forma permanente, utilice una redirección 301 para retener la mayor cantidad de PageRank posible e indicar correctamente el movimiento a los motores de búsqueda.

Quitar la página

Si encontró una página huérfana que no es valiosa y necesaria para su sitio, y es imposible redirigirla, puede eliminarla .

El enfoque más típico es cambiar su código de estado a 404.

Dejar la página como está

Mantenga la página desvinculada si satisface una necesidad comercial que no requiere un vínculo interno a la página.

Este podría ser el caso si, por ejemplo, tiene una página de destino para una campaña que solo desea mostrar a los usuarios en determinados momentos.

Busque regularmente nuevas páginas huérfanas

Dependiendo del tamaño de su sitio, debe configurar un proceso de monitoreo para detectar futuras páginas huérfanas antes de que tengan la oportunidad de afectar su SEO.

Por ejemplo, podría configurar un rastreo recurrente para encontrar páginas huérfanas en el futuro .

La mejor manera de evitar que aparezcan páginas huérfanas en el futuro es identificar qué las causa y abordar el problema de raíz . Por ejemplo, si identifica un mecanismo en su sitio que genera direcciones URL innecesarias sin enlaces, corríjalo ahora para evitar que aparezcan más páginas huérfanas a medida que pasa el tiempo.

Cada vez que publique una nueva página, asegúrese de que los enlaces apunten a ella, a menos que conscientemente no desee que se enlace a la página. Si es posible, implemente soluciones que generen automáticamente enlaces internos, como páginas de categorías y artículos relacionados.

Terminando

La optimización de las páginas huérfanas en su sitio web puede ayudarlo a:

  • Agregue contexto a ellos y otras páginas en la estructura de su sitio,
  • Haga que las páginas se puedan rastrear e indexar, dándoles una mayor probabilidad de clasificarse para las palabras clave adecuadas,
  • Transfiera PageRank entre más páginas dentro de su sitio web.

Tenga en cuenta que pequeñas cantidades de páginas huérfanas son estándar para cualquier sitio y no deben tratarse como un gran problema.

El problema se vuelve más grave a medida que obtiene más páginas huérfanas que pueden hacer que se pierda clasificaciones, tráfico y conversiones potenciales, lo que dificulta sus ingresos y el éxito comercial.

Priorice tener un proceso regular para detectar cualquier página huérfana no deseada y abordarla de inmediato.