Cómo arreglar "Rastreado - Actualmente no indexado" en Google Search Console

Publicado: 2021-12-28

La documentación de Google define el estado Rastreado, actualmente no indexado como:

La página fue rastreada por Google, pero no indexada. Puede o no ser indexado en el futuro; no es necesario volver a enviar esta URL para el rastreo.
fuente: Google

Leer esta explicación puede resultar frustrante, especialmente si el estado afecta a una página importante para su negocio. La definición de Google no aclara qué sucedió y qué podría hacer a continuación. Todo lo que dice es que Googlebot rastreó su página pero, por alguna razón, decidió no indexarla.

Según nuestra investigación, el estado Rastreado: actualmente no indexado es el problema más común informado en el informe de Cobertura del índice. Significa que probablemente ya lo haya experimentado, o es probable que lo experimente en el futuro.

Es crucial solucionar el problema lo antes posible. Después de todo, si su página no está indexada, no aparecerá en los resultados de búsqueda y no obtendrá ningún tráfico orgánico de Google.  

Este artículo presenta las posibles causas del estado Rastreado: actualmente no indexado y formas de solucionarlo .

ocultar contenido
1 ¿Dónde puede encontrar el estado Rastreado, actualmente no indexado?
1.1 Informe de cobertura del índice
1.2 Herramienta de inspección de URL
2 Informe de error: su página podría estar indexada
3 Causas y soluciones para Rastreado: estado actualmente no indexado
3.1 Retardo de indexación
3.1.1 Solución
3.2 La página no cumple con los estándares de calidad
3.2.1 Solución
3.2.2 Contenido generado por el usuario
3.3 La página se desindexó
3.3.1 Solución
3.4 Problema de arquitectura del sitio web
3.4.1 Solución
3.5 Contenido duplicado
3.5.1 Solución
4 Rastreado: actualmente no indexado frente a Descubrido: actualmente no indexado
5 Resumiendo

¿Dónde puede encontrar el estado Rastreado, actualmente no indexado?

Puede encontrar el estado en el informe de cobertura del índice y la herramienta de inspección de URL en Google Search Console.

Informe de cobertura del índice

Rastreado: actualmente no indexado pertenece a la categoría "Excluido", lo que indica que Google no cree que sea un error que la página no esté indexada.  

Por lo general, estas páginas no están indexadas y creemos que eso es apropiado. Estas páginas son duplicados de páginas indexadas, o su indexación está bloqueada por algún mecanismo en su sitio, o no están indexadas por una razón que creemos que no es un error.
fuente: Google
Captura de pantalla del informe de cobertura del índice

Después de hacer clic en el estado Rastreado: actualmente no indexado, verá una lista de las URL afectadas. Debe examinarlo y priorizar la solución del problema para las páginas más valiosas para usted.

El informe también está disponible para exportar. Sin embargo, solo puede exportar hasta 1000 URL. Si se ven afectadas más páginas, puede aumentar la cantidad de URL exportadas filtrando páginas específicas de mapas de sitio. Por ejemplo, si tiene dos mapas de sitio, cada uno con 1000 URL, puede exportarlos por separado.

Herramienta de inspección de URL

La herramienta de inspección de URL en Google Search Console también puede informarle sobre las URL que se rastrean, actualmente no indexadas.

La herramienta de inspección de URL en Google Search Console informa sobre el estado de cobertura del índice de URL específicas, como Rastreado, actualmente no indexado.

La sección superior de la herramienta le informa si la URL se puede encontrar en Google o no. Si la URL inspeccionada pertenece a la categoría Excluida en el informe de cobertura del índice, la herramienta de inspección de URL informará lo siguiente: "La página no está en el índice, pero no por un error".

A continuación, puede encontrar información más específica sobre el estado de Cobertura actual de la URL inspeccionada; en el caso anterior, la URL fue Rastreada, actualmente no indexada.

Informe de error: su página podría estar indexada

Después de notar el estado Rastreado: actualmente no indexado, lo primero que debe hacer es investigar si su página realmente no está indexada.

No es raro ver una página marcada como rastreada, actualmente no indexada en el informe de cobertura de índice, mientras que la herramienta de inspección de URL indica que la página sí está indexada.

La herramienta de inspección de URL le permite comprobar los detalles de una URL específica, incluidos:

  • problemas de indexación,
  • errores de datos estructurados,
  • usabilidad móvil,
  • Ver recursos cargados (por ejemplo, JavaScript).

También puede solicitar la indexación de una URL o ver una versión renderizada de una página.

John Muller de Google abordó el problema con las diferencias entre el informe de cobertura de índice y la herramienta de inspección de URL durante el horario de oficina de SEO de Google:

Recientemente he visto algunos hilos como este en Twitter donde las personas vieron URL que estaban marcadas como no indexadas en Search Console. Y luego, cuando los revisa individualmente, en realidad están indexados. No sé exactamente lo que está sucediendo allí todavía. […] Mi sospecha es que es más una cuestión de tiempo: los mostramos en el informe de Search Console y luego se indexan con el tiempo. Luego, en algún momento, volverían a salir del informe. Y por alguna razón, la deserción está tomando un poco más de tiempo de lo que debería.
fuente: John Müller

Como dijo John, podría ser simplemente un problema de retraso y sincronización de datos entre estas dos herramientas, y el estado podría actualizarse en el informe de cobertura del índice con el tiempo.

Sin embargo, no siempre es solo un retraso. A veces es un error de informe.

En septiembre, notamos que algunos de nuestros artículos indexados se reportaban como Rastreados, actualmente no indexados.

Eso definitivamente no fue un problema de demora ya que los artículos antiguos también se vieron afectados.  

Poco después, otros SEO, incluida Lily Ray, comenzaron a notar este mismo problema.

¿Qué hacer en esta situación? ¿En qué informe confiar?

Por lo general, la herramienta de inspección de URL muestra datos más actualizados que el informe de cobertura del índice. Es por eso que siempre debe confiar más en la herramienta de inspección de URL cuando se ve obligado a elegir entre estos informes.

Causas y soluciones para Rastreado: estado actualmente no indexado

Ahora, vayamos al fondo del problema: qué hace que aparezca el estado y qué puede hacer para solucionarlo.

Google no le da una respuesta clara de por qué su página fue rastreada pero no indexada, pero hay algunas razones posibles por las que puede aparecer el estado, que incluyen:

  • Retardo de indexación,
  • La página no cumple con los estándares de calidad,
  • La página se desindexó,
  • Problema de arquitectura del sitio web,
  • Problemas de contenido duplicado.

Retraso de indexación

No es raro que Google visite una página, pero lleva un tiempo indexarla. Internet es infinitamente grande y Google necesita priorizar qué páginas se indexan primero.

En mi Guía definitiva para la indexación de SEO, mostré cuánto tardan en indexarse ​​las páginas de sitios web populares. Estos son algunos de los resultados de mi investigación:

  • Google indexa solo el 56% de las URL indexables después de 1 día de su publicación.
  • Después de 2 semanas, solo el 87% de las URL están indexadas.

fuente: Tomek Rudzki

Si acaba de publicar su página, es perfectamente normal que aún no esté indexada y que deba esperar un poco más para que Google indexe su contenido.

Solución

No puede influir en el rastreo y la indexación de su página a corto plazo, pero hay algunas cosas que puede hacer para ayudar a su sitio web a largo plazo:

  • Cree una estrategia de indexación para ayudar a Google a priorizar las páginas correctas en su sitio. Para hacerlo, debe decidir qué páginas deben indexarse ​​y el mejor método para comunicárselo a Google.
  • Asegúrese de que haya enlaces internos a las páginas que le interesan. Ayudará a Google a encontrar las páginas y aprender más sobre su contexto.
  • Cree un mapa del sitio bien optimizado. Es un archivo de texto simple que enumera sus URL valiosas. Google lo usará como hoja de ruta para encontrar las páginas más rápido.

La página no cumple con los estándares de calidad.

Google no puede indexar todas las páginas de Internet. Su espacio de almacenamiento es limitado y por eso necesita filtrar el contenido de baja calidad.

El objetivo de Google es proporcionar páginas de la más alta calidad que respondan mejor a la intención de los usuarios. Significa que si una página es de menor calidad, lo más probable es que Google la ignore para dejar el espacio de almacenamiento disponible para contenido de mayor calidad. Y podemos esperar que los estándares de calidad sean cada vez más estrictos en el futuro.

Solución

Como propietario de un sitio web, debe asegurarse de que su página proporcione contenido de alta calidad. Compruebe si es probable que satisfaga la intención de sus usuarios y agregue contenido de buena calidad si es necesario. Google ofrece una lista de preguntas para ayudarte a determinar el valor de tu contenido. Éstos son algunos de ellos:

  • ¿El contenido proporciona información, informes, investigaciones o análisis originales?
  • ¿El contenido proporciona un análisis perspicaz o información interesante que va más allá de lo obvio?
  • ¿Es este el tipo de página que le gustaría marcar, compartir con un amigo o recomendar?
  • Si el contenido se basa en otras fuentes, ¿evita simplemente copiar o reescribir esas fuentes y, en cambio, proporciona un valor y una originalidad adicionales sustanciales?

fuente: Google

Además, puede utilizar los consejos sobre contenido de calidad de las Directrices para evaluadores de calidad de Google. Aunque el documento está destinado principalmente a los evaluadores de calidad de búsqueda para evaluar la calidad de un sitio web, los webmasters pueden usarlo para obtener información sobre cómo mejorar sus propios sitios. Si desea obtener más información, consulte nuestra guía sobre las pautas de los evaluadores de calidad.

Contenido generado por el usuario

El contenido generado por el usuario puede ser un problema desde el punto de vista de la calidad.

Por ejemplo, supongamos que tiene un foro y alguien hace una pregunta. Aunque puede haber muchas respuestas valiosas en el futuro, en el momento del rastreo no había ninguna, por lo que Google puede clasificar la página como contenido de baja calidad.

¿Qué hacer para protegerse de esta situación?

Quora ideó una excelente estrategia para el problema. Cada pregunta sin respuesta tiene el prefijo "/sin respuesta/" en la URL.

Aquí hay un ejemplo: https://www.quora.com/unanswered/Are-you-really-happy-with-your-results  

El archivo robots.txt bloquea todas las páginas con /sin respuesta/ en sus URL. Significa que Googlebot no puede rastrearlos.

Una vez que hay una respuesta a la pregunta, la URL cambia y pasa a estar disponible para el rastreo. De esta forma, Quora bloquea el acceso al contenido de baja calidad generado por los usuarios.

La página se desindexó

Una URL puede sufrir el estado Rastreado: actualmente no indexado porque se indexó en el pasado, pero Google decidió desindexarlo con el tiempo.

Si se pregunta por qué algunas cosas pueden desaparecer del índice, es probable que simplemente sean reemplazadas por contenido de mayor calidad.

Además, debe prestar atención a las actualizaciones de algoritmos. Es posible que se haya implementado un nuevo algoritmo y que su página se haya visto afectada por él.

Desafortunadamente, la desindexación también puede ser causada por un error del lado de Google. Por ejemplo, Search Engine Land una vez fue desindexado porque Google asumió erróneamente que el sitio había sido pirateado.

Solución

La solución a las páginas desindexadas está muy relacionada con su calidad. Siempre debe asegurarse de que su página ofrezca contenido de la mejor calidad y esté actualizada. No asuma que una vez que se indexa una página, no necesita hacer nada con ella nunca más. Siga monitoreándolo e implemente cambios y mejoras si es necesario.

[…]las páginas que caen después de una actualización principal no tienen nada malo que arreglar. Dicho esto, entendemos que aquellos a los que les va peor después de un cambio de actualización principal pueden sentir que necesitan hacer algo. Le sugerimos que se concentre en asegurarse de ofrecer el mejor contenido posible. Eso es lo que nuestros algoritmos buscan recompensar.
fuente: Google

Después de solucionar los problemas, puede enviar esas URL a Google Search Console para ayudar a Google a notar los cambios más rápido.

Problema de arquitectura del sitio web

Cuando se le preguntó a John Mueller sobre las posibles razones por las que una página se marcó con el estado Rastreado (actualmente no indexado), mencionó otra posible causa: la estructura deficiente del sitio web.

Imaginemos una situación en la que tiene una página de buena calidad, pero la única forma en que Google la encontró es porque la puso en su mapa del sitio.

Google podría mirar la página y rastrearla, pero dado que no hay enlaces internos, asumiría que la página tiene menos valor que otras páginas. No hay información semántica o estructural que lo ayude a evaluar la página. Esa podría ser una de las razones por las que Google decidió centrarse en otras páginas y dejar esta fuera del índice después de rastrearla.

Solución

Una buena arquitectura del sitio web es clave para ayudarlo a maximizar las posibilidades de ser indexado. Permite que los robots de los motores de búsqueda descubran su contenido y comprendan mejor la relación entre las páginas.

Por eso es crucial proporcionar una buena arquitectura de sitio web y asegurarse de que haya enlaces internos a la página que desea indexar.

Si desea obtener más información sobre la estructura del sitio web, consulte nuestro artículo sobre cómo crear un sitio web que clasifique y convierta.  

Contenido duplicado

Adam Gent, un profesional independiente de SEO, compartió un caso interesante con la comunidad de SEO. Su página estaba siendo rastreada, actualmente no está indexada porque Google pensó que era una página duplicada.

Google quiere presentar contenido único y valioso a los usuarios. Es por eso que cuando se da cuenta durante el rastreo de que algunas páginas son idénticas o casi idénticas, podría indexar solo una de ellas.

Por lo general, el otro se etiqueta como "Duplicado" en el informe de cobertura del índice. Sin embargo, no siempre es el caso y, a veces, Google asigna el estado Rastreado, actualmente no indexado.

No está del todo claro por qué Google podría elegir Rastreado, actualmente no indexado en lugar de un estado dedicado para contenido duplicado. Una de las posibles explicaciones es que el estado cambiará después de que Google decida si hay uno más adecuado para la página.

Otra opción podría ser un error de informe . Google podría simplemente cometer un error al asignar los estados. Desafortunadamente, la situación es más desafiante porque Rastreado, actualmente no indexado, no le brinda tanta información como un estado dedicado para contenido duplicado.

¿Cómo verificar si se muestra una página duplicada en los resultados de búsqueda?

  1. Vaya a la página que no está indexada y copie un fragmento de texto aleatorio.
  2. Pegue el texto en la Búsqueda de Google entre comillas.
  3. Analiza los resultados. Si aparece una URL diferente con su texto copiado, podría significar que su página no está indexada porque Google eligió una URL diferente para indexar.

Solución

En primer lugar, debe asegurarse de crear páginas originales. Si es necesario, agregue contenido único.

Desafortunadamente, el contenido duplicado puede ser inevitable (por ejemplo, tiene una versión móvil y de escritorio). No tienes mucho control sobre lo que aparece en los resultados de búsqueda, pero puedes darle a Google algunas pistas sobre la versión original.

Si nota mucho contenido duplicado indexado, evalúe los siguientes elementos:

  • Etiquetas canónicas: estas etiquetas HTML le dicen a los motores de búsqueda qué versiones son las originales.
  • Enlaces internos: asegúrese de que los enlaces internos apunten a su contenido original. Google podría usarlo como un indicador de qué página es más importante.
  • Mapas de sitio XML: asegúrese de que solo la versión canónica esté en su mapa de sitio.

Recuerda que estos son solo consejos y Google no está obligado a seguirlos. En el caso descrito por Adam Gent, Google eligió la versión de fuente RSS para indexar, a pesar de que muchas señales de canonicalización apuntaban a una URL original diferente. Adam resolvió el problema configurando un 404 para asegurarse de que solo se mantuviera la versión original. También sugirió configurar un encabezado HTTP de X-robots en todas las URL de alimentación para evitar que se indexen.

Rastreado: actualmente no indexado vs. Descubierto: actualmente no indexado

El estado Rastreado: actualmente no indexado se suele confundir con otro problema de indexación en el informe de cobertura del índice: Descubierto: actualmente no indexado.

Ambos estados indican que la página no está indexada. Sin embargo, en el caso de Rastreado, actualmente no indexado, Google ya ha visitado la página. Mientras tanto, en Descubierto, actualmente no indexado, Google conoce la URL, pero, por alguna razón, aún no se rastreó.

Rastreado: actualmente no indexado Descubierto: actualmente no indexado
Página descubierta por Google
Página visitada por Google No
Página indexada No No

Algunas de las razones de estos estados pueden ser similares, incluidas las páginas de baja calidad y los problemas de enlaces internos. Sin embargo, cuando vea un estado Descubierto: actualmente no indexado, debe investigar adicionalmente por qué Google no pudo o no quiso acceder a la página. Por ejemplo, podría indicar problemas con la calidad general de todo el sitio web, problemas de presupuesto de rastreo o sobrecarga del servidor.

Terminando

Rastreado: actualmente no indexado se asocia principalmente con la calidad de la página, pero en realidad, puede indicar muchos más problemas, como la arquitectura del sitio web o el contenido duplicado.

Estos son los puntos clave del artículo que pueden ayudarlo a lidiar con el estado Rastreado, actualmente no indexado:

  • Agregue contenido único y valioso a sus páginas. Una vez que lo haya hecho, envíe esas URL a Google Search Console. De esta manera, Google puede notar los cambios más rápido.
  • Revise la arquitectura de su sitio web y asegúrese de que haya enlaces internos a sus páginas valiosas.
  • Decida qué páginas deben y no deben indexarse ​​para ayudar a Google a priorizar las URL más valiosas.

Si necesita ayuda para abordar el estado Rastreado, actualmente no indexado en su sitio web, nuestros servicios técnicos de SEO son lo que está buscando.