¿Qué es el contenido duplicado?
Publicado: 2022-04-22El contenido duplicado se refiere a contenido web idéntico o muy similar que se encuentra en más de un lugar, o en varias URL diferentes.
Tanto Google como Raven Tools estiman que el contenido duplicado representa una buena parte de Internet: 25-30% y 29% respectivamente. Por lo tanto, hay ciertas cosas que deberá saber sobre el contenido duplicado y su relación con la clasificación de los motores de búsqueda de su sitio.
En este artículo, hablaremos sobre el significado del contenido duplicado, cómo surgen los problemas de SEO de contenido duplicado y cómo puede solucionarlos.
Tabla de contenido
- ¿Qué significa contenido duplicado en SEO?
- ¿Cómo suceden los problemas de contenido duplicado y SEO?
- ¿Por qué tener contenido duplicado es un problema para el SEO?
- Cómo comprobar el contenido duplicado
- Actualización de Panda para contenido duplicado
- Preguntas frecuentes sobre contenido duplicado
¿Qué significa contenido duplicado en SEO?
Antes de hablar sobre los problemas relacionados con el contenido duplicado de SEO, debemos aclarar qué significa en términos de SEO. Cuando se habla de contenido duplicado, Google lo define como bloques sustantivos de contenido que son idénticos o apreciablemente similares y se encuentran dentro o entre dominios.
Como ya se mencionó, varias fuentes estiman que aproximadamente una cuarta parte de Internet es contenido repetitivo.
Esto puede parecer un gran problema, sin embargo, cuando se trata de contenido duplicado en línea, las cosas no son tan terribles como crees.
Si bien un buen porcentaje del contenido se repite en las URL, esto no siempre significa que haya sido copiado o robado. La mayoría de las veces, el contenido duplicado es un subproducto perfectamente inocente de muchos factores.
¿Cómo suceden los problemas de contenido duplicado y SEO?
A veces, el contenido duplicado es intencional y otras veces es accidental. Si bien puede pensar que está limpio porque sus textos son todos originales, aún puede surgir un problema de contenido duplicado .
De hecho, la mayoría de los casos de contenido duplicado no son maliciosos, engañosos y, muchas veces, ni siquiera son intencionales. Repasemos la razón principal por la que su contenido puede aparecer en más de un lugar.
WWW frente a no WWW y HTTP frente a HTTPS
A menudo, los problemas de contenido duplicado son causados por simples errores en la configuración de su sitio. Uno de los aspectos que se pasan por alto es si su sitio está disponible tanto en una versión con www como sin ella.
Lo mismo puede suceder con los sitios HTTP y HTTPS.
Esencialmente, se podrá acceder a su sitio en una de las siguientes ubicaciones:
- https://www.ejemplo.com
- https://ejemplo.com
- http://www.ejemplo.com
- http://ejemplo.com
Si su sitio está disponible en más de uno de estos y no lo registra correctamente, puede considerarse contenido duplicado cuando, en realidad, es solo una página.
Barras inclinadas
Otro problema similar surge con las barras inclinadas. Convencionalmente, una barra inclinada al final denota un directorio, mientras que la falta de una denota un archivo. Independientemente de cuál esté señalando, podría tener:
- http://ejemplo.com/foo/
- http://ejemplo.com/foo
Google las trata como URL separadas, lo que significa que podría tener contenido diferente en ambas páginas. Esto está bien en lo que respecta a Google, sin embargo, es malo para la experiencia del usuario. Las personas encontrarán esa configuración confusa, por lo que es mejor que ambas URL lleven a la misma página.
Esto nos lleva al problema de la duplicación. Si ambas URL están disponibles con el mismo contenido, ha copiado su página. Desde la perspectiva de Google, este es exactamente el mismo contenido en dos ubicaciones separadas, lo que puede dañar su clasificación de SEO si no se resuelve.
Parámetros de URL y navegación por facetas
Los sistemas de búsqueda por facetas son una forma ordenada de filtrar productos. Sin embargo, cuando no se administran, pueden crear diferentes URL como resultado de numerosas combinaciones, todas con el mismo contenido. Esto afecta su presupuesto de rastreo y la equidad de los enlaces.
Un problema similar surge con los parámetros de URL, como los ID de sesión o los ID de seguimiento, donde se puede acceder a la misma página a través de varias URL.
Versiones de página alternativas
Siguiendo la tendencia del contenido duplicado accidentalmente, llegamos a otro descuido común para los webmasters: las páginas alternativas. Un sitio, como "example.com/page" puede aparecer en una URL diferente como:
- Página optimizada para dispositivos móviles: m.example.com/page
- Página fácil de imprimir: ejemplo.com/print/page
- Página móvil acelerada (AMP) – example.com/amp/page
Todas estas versiones duplican el contenido de la página y causan problemas si no se reparan.
Paginación
Cuando se trata de páginas de categoría, títulos de publicaciones de blog, reseñas de usuarios o comentarios, el contenido se puede dividir en páginas mediante la paginación.
Nuevamente, si no se maneja correctamente, esto puede llevar a que el contenido se duplique en las URL.
Raspadores
Si alguien roba su contenido y lo publica en un sitio web diferente, tiene un problema de contenido duplicado. Google generalmente puede determinar qué sitio es el original, sin embargo, es posible que desee abordar los raspadores por si acaso.
Sindicaciones
Si permite que otro sitio web vuelva a publicar su trabajo, crea contenido duplicado entre dominios. Si bien el contenido sindicado no debe clasificarse por encima de su sitio original, puede tomar precauciones para asegurarse de que no suceda.
¿Por qué tener contenido duplicado es un problema para el SEO?
Si bien muchos han perpetuado la idea de una penalización por contenido duplicado de Google , esto no es algo de lo que generalmente deba preocuparse.

El contenido duplicado no es un problema en sí mismo. Sin embargo, si un texto se duplica entre dominios para manipular la clasificación del motor de búsqueda, se convierte en un problema.
Contenido inocentemente duplicado y SEO
Google asegura a sus usuarios que el contenido duplicado no afectará su clasificación en los motores de búsqueda, siempre que el contenido sea honesto y no manipulador. Si bien esto puede ser cierto, el contenido duplicado puede resultar en un rendimiento de SEO más bajo.
Aunque Google confía en la página que elige mostrar en los resultados de búsqueda, a veces, el motor de búsqueda se equivoca.
Digamos que la misma página está disponible en varias URL. En tal caso, Google agrupará las URL duplicadas en un grupo. Esto puede afectarte de varias maneras:
- Google seleccionará la "mejor" URL como representante del clúster. A veces, usted y Google pueden estar en desacuerdo sobre cuál es la "mejor" URL, lo que le causa problemas de marca y UX;
- Aunque la popularidad de los enlaces debe consolidarse entre todos los miembros de un clúster, es posible que Google no detecte algunos duplicados. Esto puede conducir a la dilución de enlaces y perjudicar sus esfuerzos de clasificación de contenido;
Además, considere el hecho de que este fenómeno puede conducir a un rastreo ineficiente, lo que deja a Google menos tiempo para revisar su contenido más nuevo y actualizado.
Contenido extraído y sindicado
Ya sea que haya permitido que otro sitio vuelva a publicar su trabajo o que haya eliminado su contenido, ese contenido ahora aparece en múltiples dominios.
Por lo general, esto no debería causar problemas, pero a veces, por raro que sea, el contenido copiado o republicado puede superar al original.
Afortunadamente, los problemas de contenido duplicado se pueden tratar de diferentes maneras que ayudan a optimizar su rendimiento de SEO.
Cómo comprobar el contenido duplicado
Antes de que pueda resolver cualquier problema, primero debe saber que existen. Esto requerirá que busque contenido duplicado en su sitio. Puedes hacer esto de varias maneras:
1. Consola de búsqueda de Google
Google Search Console puede proporcionar información sobre el rendimiento de su página web en los resultados de búsqueda. Este servicio también puede ayudarlo a identificar problemas de contenido duplicado , por ejemplo, al encontrar diferentes URL del mismo rango de página en los resultados de búsqueda.
2. Búsqueda de contenido duplicado
Una forma rápida de comprobar si hay contenido duplicado es buscar bloques de texto en tu página; cuando los busques, coloca las palabras entre comillas.
Idealmente, solo debería aparecer tu página. Si hay otros resultados, es posible que tenga un problema, aunque no siempre. Puedes probar esto con varias oraciones.
También puede usar la barra de búsqueda de Google para buscar su sitio. Escriba "sitio:" seguido de la URL, todo entre comillas. Esto le mostrará las páginas que Google ha indexado y que potencialmente puede clasificar.
3. Comprobadores de contenido duplicado
Hay varios verificadores de plagio, así como verificadores de contenido duplicado de Google , que pueden ayudarlo a descubrir si su contenido no es original, tiene un problema interno de contenido duplicado o se ha vuelto a publicar.
Cómo abordar el contenido duplicado
Aunque Google es bastante bueno para lidiar con el contenido duplicado, siempre puede involucrarse más y abordar los posibles problemas directamente para lograr los mejores resultados.
Algunos consejos sobre qué hacer incluyen:
- Use una redirección 301, una URL canónica o una redirección sin índice;
- Sea consistente en sus enlaces internos;
- Use dominios de nivel superior (TLD) para manejar contenido específico del país;
- Asegúrese de que los sitios que contienen contenido sindicado incluyan un enlace a su página o use la etiqueta noindex;
- Consolidar páginas con contenido similar;
- Presente una solicitud de DMCA en el caso de contenido extraído;
Actualización de Panda para contenido duplicado
La actualización Panda de Google se lanzó en 2011 y fue un cambio increíblemente importante en el algoritmo de Google. Si bien Panda no estaba destinado a abordar específicamente el contenido duplicado en los sitios web, la actualización fomenta el texto único e informativo, lo que incluye evitar el contenido repetitivo.
Preguntas frecuentes sobre contenido duplicado
¿Qué significa contenido duplicado en SEO?
El contenido duplicado representa bloques sustantivos de texto que coinciden por completo o son apreciablemente similares a otros contenidos en línea. El contenido repetitivo constituye aproximadamente una cuarta parte de Internet y la mayoría de las veces no es de naturaleza engañosa o maliciosa.
¿Existe una penalización por contenido duplicado de Google?
La penalización por contenido duplicado de Google se ha tergiversado hasta el punto de que se ha convertido en un mito. El contenido duplicado no se penaliza a menos que infrinja las Directrices para webmasters de Google y tenga la intención de manipular los resultados del motor de búsqueda.
¿El contenido duplicado daña las clasificaciones de SEO?
El contenido duplicado puede afectar negativamente su estrategia de SEO. Google intenta consolidar varias URL que conducen a la misma página y mostrar resultados originales más altos que el contenido vuelto a publicar. Sin embargo, no es un sistema perfecto, ya que una URL desfavorable o una republicación entre dominios pueden clasificarse más alto que su artículo original. Esta es la razón por la cual el contenido duplicado también debe abordarse de manera proactiva.
¿Cuánto contenido duplicado es aceptable?
No existe una medida definitiva que sugiera cuánto del contenido que tiene se puede duplicar. Sin embargo, como regla general, no más del 5% del contenido duplicado debe llegar a su sitio. Para gestionar este porcentaje, recurre a los detectores de plagio online.
