¿Qué son los Soft 404 en SEO?
Publicado: 2022-02-17Soft 404 no es un código de estado HTTP oficial, sino un algoritmo avanzado que ayuda a Google a detectar si una página no existe (o tiene poco o ningún contenido), incluso si el código de estado HTTP no lo indica.
Sin embargo, el algoritmo no es perfecto y Google podría cometer un error al clasificar una página.
No importa el motivo de los 404 blandos, tienen un impacto negativo en su sitio web y disminuyen su visibilidad en la búsqueda orgánica.
En este artículo, aprenderá cómo afectan los 404 leves a su sitio, qué puede causarlos y qué puede hacer para solucionarlos.
¿Qué es un 404 suave?
Los servidores se comunican con los clientes (por ejemplo, navegadores o bots de motores de búsqueda) a través de códigos de estado HTTP.
Si la solicitud de una página tiene éxito, el servidor devuelve un código de estado HTTP 200. Si falta la página, el servidor responde con un estado 404 (No encontrado).
Cuando los usuarios solicitan una página que no existe, ven un mensaje en su navegador que indica que algo salió mal. Sin embargo, el mensaje que muestra el navegador no siempre se corresponde con el código de estado HTTP.
Ahí es donde entra en juego el suave 404.
Soft 404 es una etiqueta que Google le da a una página cuando parece que la página no existe y, al mismo tiempo, devuelve un código de estado HTTP 200 exitoso.
Si Google decide que una página es un 404 suave, ralentiza su rastreo.
Si vemos [una página] como un 404 suave, sería como un 404, y ralentizaríamos el rastreo de esa URL en particular porque no hay nada aquí. ¿Por qué tenemos que rastrearlo todos los días?fuente: John Müller
La detección de 404 suaves es esencial desde la perspectiva del motor de búsqueda por dos razones:
- Google tiene recursos limitados. La web es infinitamente grande y es simplemente imposible rastrear todas las páginas. Es por eso que Google necesita priorizar y elegir qué páginas vale la pena rastrear. Omitir los 404 blandos le permite centrarse en páginas más valiosas, lo que aumenta su eficiencia de rastreo.
- Google quiere presentar páginas de calidad a sus usuarios. Si Google sospecha que una página no existe, es obvio que nadie quiere encontrarla y no debería aparecer en la página de resultados de búsqueda.
Cómo afectan los Soft 404 a su sitio web
Las consecuencias para su sitio web pueden variar según el tipo de páginas que Google clasificó como 404 suaves.
Si Google estaba en lo correcto y la página realmente no existe, la principal consecuencia es desperdiciar su presupuesto de rastreo .
Su presupuesto de rastreo indica la cantidad de páginas que Google puede y desea rastrear en su sitio web. Si tiene, por ejemplo, 100 000 páginas y su presupuesto de rastreo le permite rastrear 50 000, es esencial asegurarse de que el presupuesto se gaste en páginas valiosas. Si Google desperdicia su presupuesto de rastreo rastreando 404 suaves, es posible que no haya suficiente para las páginas que más le importan y le traen tráfico.
La otra cara de la moneda es cuando Google comete un error al asignar el estado y piensa que una página valiosa es un 404 suave. En este caso, la página no se indexará y no traerá tráfico orgánico.
¿Cómo se pueden detectar los 404 blandos?
Puede verificar qué páginas Google informa como 404 suaves en Google Search Console en el informe de Cobertura de índice.
Acceda al informe haciendo clic en la opción "Cobertura" en la barra lateral.

Si Google cree que una página es un 404 suave, puede asignarle uno de estos dos estados:
- Soft 404 (categoría excluida), o
- La URL enviada parece ser un Soft 404 (categoría de error).
La única diferencia entre estos estados es la forma en que Google descubrió la URL.
En el caso del estado "La URL enviada parece ser un Soft 404", Google lo encontró dentro de su mapa del sitio (archivo de texto creado por los propietarios del sitio web que debe enumerar solo las páginas que desea indexar). Mientras tanto, en el caso del estado "Soft 404", Google encontró esta URL por su cuenta.
Puede ver una lista de URL individuales que informan 404 leves haciendo clic en cualquiera de estos estados. Estos datos están disponibles para exportar, pero hay un límite de 1000 URL. Si desea exportar más y tiene más de un mapa del sitio, puede descargar las URL para cada mapa del sitio por separado.
El informe de cobertura de índice no es el único lugar donde puede ver el estado de una URL.
En la herramienta de inspección de URL en Google Search Console, puede verificar las URL individuales. Si desea inspeccionar más de una URL, puede usar la API de inspección de URL y verificar hasta 2000 URL a la vez.
Si ve una diferencia entre los estados en el informe de cobertura de índice y la herramienta de inspección de URL, podría ser solo un retraso en el informe de cobertura de índice. En este caso, confíe en la herramienta de inspección de URL, ya que muestra datos más recientes.
Esto se debe a que los datos del informe de cobertura del índice se actualizan a una velocidad diferente (y más lenta) que la inspección de URL. Los resultados que se muestran en la inspección de URL son más recientes y deben tomarse como autorizados cuando entran en conflicto con el informe de cobertura del índice. (2/4)
– Central de búsqueda de Google (@googlesearchc) 11 de octubre de 2021
Detección suave de 404 en dispositivos móviles y computadoras de escritorio
En 2021, Google proporcionó una actualización sobre cómo detecta los 404 suaves en teléfonos móviles y dispositivos de escritorio.
Resultó que el estado podría asignarse de manera diferente a las versiones móvil y de escritorio. Sin embargo, debido a que Google Search Console informa los estados en función de la versión móvil, no se mostrará si solo su versión de escritorio está etiquetada como 404 suave.

Esencialmente, lo que sucede es que a veces vemos páginas que en los escritorios parecen una página 404, entonces decimos que es un 404 suave en el escritorio, no necesitamos indexarlo. Y en dispositivos móviles, parece una página normal, por lo que la indexaremos allí.[…] en Search Console, mostramos 404 suaves, pero lo mostramos para la versión móvil. Entonces , si en la versión móvil todo está bien desde su lado, entonces en Search Console, parecerá que está indexado normalmente […], mientras que para el escritorio, si lo vemos como un 404 suave allí, no podrá ver eso directamente en Search Console.
fuente: John Müller
Qué puede causar un 404 suave y cómo solucionarlo
Hay algunas razones diferentes por las que Google podría clasificar una página como 404 suave, que incluyen:
- Página 404 que responde con un código de estado HTTP 200,
- Redirecciones irrelevantes,
- Páginas con poco o ningún contenido,
- Páginas que contienen palabras similares a 404,
- Problemas de renderizado.
Página 404 que responde con un código de estado HTTP 200
Si una página es, de hecho, una página 404, pero devuelve un código de estado HTTP 200, Google la clasificará como 404 suave.
Esto es algo que debe tener especialmente en cuenta si tiene una página 404 personalizada.
Una página 404 personalizada puede ser útil para sus usuarios y permitirles explorar el sitio web aunque la página a la que intentaban acceder no exista. Sin embargo, no es raro que estas páginas devuelvan un código de estado HTTP 200.
Debe evitar esta situación porque Google continúa rastreando estas páginas, lo que desperdicia su presupuesto de rastreo.
La solución a este problema es configurar su servidor para que devuelva el código de estado correcto para las páginas que no existen (404 No encontrado).
Redirecciones irrelevantes
Redirigir a una página irrelevante es una mala práctica que puede confundir a los usuarios. Es por eso que si Google detecta que una redirección apunta a una página no relacionada, es posible que el motor de búsqueda no la siga y trate la página como un 404 suave.
Sí, no es una gran práctica (confunde a los usuarios), y en su mayoría los tratamos como 404 de todos modos (son 404 blandos), por lo que no hay ventajas. No está críticamente roto/malo, pero es una complejidad adicional sin una buena razón; en su lugar, haga una mejor página 404.
— Juan (@JohnMu) 8 de enero de 2019
Para resolver el problema, redirija siempre a las páginas relevantes.
Mire el contenido desde la perspectiva de los usuarios. Por ejemplo, si un usuario estaba buscando algo específico, ¿tendría sentido que terminara en la página a la que lo estás redirigiendo? ¿Es temáticamente relevante? Si no, tal vez haya una página mejor que pueda responder a su intención, o tal vez debería configurar una página 404 en lugar de una redirección.
Páginas con poco o ningún contenido
Poco o ningún contenido en una página puede hacer que Google piense que la página está vacía y la clasifique como un 404 suave.
Un ejemplo puede ser un sitio web de comercio electrónico con productos que se agotan y se agotan con frecuencia, lo que genera categorías de productos vacías.
La solución a este problema no es tan sencilla como en los dos casos anteriores.
Una forma de lidiar con ese problema es bloquear la indexación de páginas vacías. Después de todo, si es una página vacía, no es útil para los usuarios y no debe indexarse. Puede hacerlo agregando una metaetiqueta noindex (una etiqueta HTML que le indica a los motores de búsqueda que no desea que se indexe esta página).
Además, vale la pena repensar la estructura de todo su sitio web.
¿Tiene muchas categorías de productos que tienen, por ejemplo, un solo producto? Si ese es el caso, debe reconsiderar si estas categorías son necesarias en su sitio web. Las páginas como esta pueden considerarse contenido delgado y pueden afectar negativamente a su sitio web de dos maneras:
- Pueden desperdiciar su presupuesto de rastreo y
- Si tiene muchas páginas indexables de baja calidad, Google podría pensar que todo su sitio web carece de calidad y decidir dejar de rastrear su sitio web con tanta frecuencia.
Si desea obtener más información sobre qué páginas deben y no deben indexarse, lea nuestro artículo sobre cómo crear una estrategia de indexación para su sitio web.
Páginas que contienen palabras similares a 404
A veces, los algoritmos de Google identifican erróneamente una página si contiene palabras que normalmente aparecen en una página 404. Puede ocurrir, por ejemplo, en sitios web de comercio electrónico cuando la página de un producto utiliza términos como "agotado", "producto no disponible" o "no realizamos entregas en su ubicación".
Todas las páginas de categoría tenían "Lo sentimos, no realizamos envíos a esta ubicación". Esto se mostraba a los clientes que ingresaban un código PIN que no entregamos, pero que formaba parte de la página de manera predeterminada. ¡Eliminé este texto de la página y eso arregló el soft 404! #seo @JohnMu @methode @rustybrick https://t.co/j3UEsXXb3U
— Nikhil Raj. R (@nikhilrajr) 30 de diciembre de 2021
El autor de la publicación anterior solucionó el problema simplemente eliminando las palabras que indican que la entrega no está disponible.
Problema de renderizado
La renderización es un paso necesario para que Google vea tu contenido. Si el motor de búsqueda no puede verlo, podría pensar que la página está vacía y clasificarla como un 404 blando.
Una de las causas de los problemas de renderizado es el bloqueo de recursos como CSS o JavaScript en robots.txt. Robots.txt es un archivo que le permite especificar qué páginas pueden rastrear los robots de los motores de búsqueda y cuáles no. Si Google no puede acceder a los recursos necesarios para renderizar, no podrá ver el contenido.
Para saber si Google presenta su contenido correctamente, utilice la herramienta de inspección de URL en Google Search Console. Puede inspeccionar URL individuales y ver cómo Google ve sus páginas. Si falta el contenido, indica un problema de representación.
Para solucionar el problema, asegúrese de que Google tenga acceso a los recursos necesarios para el procesamiento. Revise su archivo robots.txt y asegúrese de que se permita el rastreo de CSS y JavaScript.
Si desea obtener más información sobre cómo funciona el renderizado, consulte nuestro manifiesto Rendering SEO: por qué JavaScript SEO no es suficiente.
Terminando
Es importante monitorear los 404 suaves para garantizar que no dañen su sitio web al desperdiciar su presupuesto de rastreo o dejar páginas valiosas fuera del índice.
Estos son los puntos clave del artículo para ayudarlo a evitar los 404 blandos:
- Si una página no existe, asegúrese de que devuelva un código de estado HTTP 404,
- Al crear una redirección, asegúrese siempre de redirigir a contenido relevante,
- No bloquee recursos esenciales para renderizar archivos como CSS o JavaScript en su archivo robots.txt,
- Si tiene páginas vacías, agregue la metaetiqueta noindex o elimine estas páginas de su sitio.
- Tenga cuidado con el uso de frases similares a 404. Si nota que su página, por ejemplo, con un producto agotado, está marcada como 404 suave, intente eliminar las palabras o usar términos diferentes.
