O que é conteúdo duplicado?
Publicados: 2022-04-22Conteúdo duplicado refere-se a conteúdo da Web idêntico ou muito semelhante encontrado em mais de um lugar – ou em vários URLs diferentes.
Tanto o Google quanto a Raven Tools estimam que o conteúdo duplicado representa uma boa parte da internet – 25-30% e 29% , respectivamente. Assim, há certas coisas que você precisa saber sobre conteúdo duplicado e sua relação com as classificações do mecanismo de pesquisa do seu site.
Neste artigo, falaremos sobre o significado de conteúdo duplicado, como surgem os problemas de SEO de conteúdo duplicado e como você pode corrigi-los.
Índice
- O que significa conteúdo duplicado em SEO?
- Como o conteúdo duplicado e os problemas de SEO acontecem?
- Por que ter conteúdo duplicado é um problema para SEO?
- Como verificar conteúdo duplicado
- Atualização do Panda para conteúdo duplicado
- Perguntas frequentes sobre conteúdo duplicado
O que significa conteúdo duplicado em SEO?
Antes de falarmos sobre os problemas ligados ao conteúdo duplicado de SEO, precisamos esclarecer o que isso significa em termos de SEO. Ao falar sobre conteúdo duplicado, o Google o define como blocos substantivos de conteúdo idênticos ou sensivelmente semelhantes e encontrados dentro ou entre domínios.
Como já mencionado, várias fontes avaliam que cerca de um quarto da internet é conteúdo repetitivo.
Isso pode parecer um grande problema, no entanto, quando se trata de duplicar conteúdo online, as coisas não são tão terríveis quanto você imagina.
Embora uma boa porcentagem do conteúdo seja repetida em URLs, isso nem sempre significa que foi copiado ou roubado. Na maioria das vezes, o conteúdo duplicado é um subproduto perfeitamente inocente de muitos fatores.
Como o conteúdo duplicado e os problemas de SEO acontecem?
Às vezes, o conteúdo duplicado é intencional e outras vezes é acidental. Embora você possa pensar que está limpo porque seus textos são todos originais, um problema de conteúdo duplicado ainda pode surgir.
Na verdade, a maioria dos casos de conteúdo duplicado não são maliciosos, enganosos e, muitas vezes, nem são intencionais. Vamos analisar o principal motivo pelo qual seu conteúdo pode aparecer em mais de um lugar.
WWW vs Não WWW e HTTP vs HTTPS
Muitas vezes, problemas de conteúdo duplicado são causados por erros simples na configuração do seu site. Um dos aspectos negligenciados é se o seu site está disponível na versão www e não www.
A mesma coisa pode acontecer com sites HTTP e HTTPS.
Essencialmente, seu site estará acessível em um dos seguintes locais:
- https://www.exemplo.com
- https://example.com
- http://www.example.com
- http://example.com
Se o seu site estiver disponível em mais de um deles e você não o contabilizar corretamente, ele pode ser considerado conteúdo duplicado, quando, na verdade, é apenas uma página.
Barras à direita
Outro problema semelhante surge com barras à direita. Convencionalmente, uma barra final no final denota um diretório, enquanto a falta de uma denota um arquivo. Independentemente de qual você está apontando, você pode ter:
- http://example.com/foo/
- http://example.com/foo
O Google os trata como URLs separados, o que significa que você pode ter conteúdo diferente nas duas páginas. Isso é bom no que diz respeito ao Google, no entanto, é ruim para a experiência do usuário. As pessoas acharão essa configuração confusa, então é melhor que os dois URLs levem à mesma página.
Isso nos leva ao problema da duplicação. Se ambos os URLs estiverem disponíveis com o mesmo conteúdo, você copiou sua página. Do ponto de vista do Google, este é exatamente o mesmo conteúdo em dois locais separados, o que pode prejudicar seus rankings de SEO se não for resolvido.
Parâmetros de URL e navegação facetada
Os sistemas de pesquisa facetada são uma maneira elegante de filtrar produtos. No entanto, quando não gerenciados, eles podem criar URLs diferentes como resultado de várias combinações, todas com o mesmo conteúdo. Isso afeta seu orçamento de rastreamento e o patrimônio do link.
Um problema semelhante surge com parâmetros de URL, como IDs de sessão ou IDs de rastreamento, em que a mesma página pode ser acessada por meio de vários URLs.
Versões de página alternativas
Seguindo a tendência de conteúdo duplicado acidentalmente, chegamos a outro descuido comum para webmasters – páginas alternativas. Um site, como “example.com/page” pode aparecer em um URL diferente como:
- Página compatível com dispositivos móveis – m.example.com/page
- Página amigável para impressão – example.com/print/page
- Página móvel acelerada (AMP) – example.com/amp/page
Todas essas versões duplicam o conteúdo da página e causam problemas se não forem corrigidas.
Paginação
Quando se trata de páginas de categorias, títulos de postagens de blogs, resenhas de usuários ou comentários, o conteúdo pode ser dividido em páginas usando paginação.
Novamente, se não for tratado corretamente, isso pode levar à duplicação do conteúdo em URLs.
Raspadores
Se alguém roubar seu conteúdo e publicá-lo em um site diferente, você terá um problema de conteúdo duplicado. O Google geralmente pode descobrir qual site é o original, no entanto, você pode querer abordar os raspadores para uma boa medida.
Distribuição
Se você permitir que outro site republique seu trabalho, você cria conteúdo duplicado entre domínios. Embora o conteúdo distribuído não deva ser classificado acima do seu site original, você pode tomar precauções para garantir que isso não aconteça.
Por que ter conteúdo duplicado é um problema para SEO?
Embora muitos tenham perpetuado a ideia de uma penalidade de conteúdo duplicado do Google , isso não é algo com o qual você geralmente precisa se preocupar.

Conteúdo duplicado não é um problema por si só. No entanto, se um texto for duplicado em domínios para manipular a classificação do mecanismo de pesquisa, isso se tornará um problema.
Conteúdo duplicado inocentemente e SEO
O Google garante a seus usuários que o conteúdo duplicado não prejudicará sua classificação nos mecanismos de pesquisa, desde que o conteúdo seja honesto e não manipulador. Embora isso possa ser verdade, conteúdo duplicado pode resultar em pior desempenho de SEO.
Embora o Google esteja confiante na página que escolhe exibir nos resultados da pesquisa, às vezes o mecanismo de pesquisa erra.
Digamos que a mesma página esteja disponível em vários URLs. Nesse caso, o Google agrupará os URLs duplicados em um cluster. Isso pode afetá-lo de duas maneiras:
- O Google selecionará o "melhor" URL como representante do cluster. Às vezes, você e o Google podem discordar sobre qual é o “melhor” URL, causando problemas de branding e UX;
- Embora a popularidade do link deva ser consolidada em todos os membros de um cluster, algumas duplicatas podem não ser detectadas pelo Google. Isso pode levar à diluição de links e prejudicar seus esforços de classificação de conteúdo;
Além disso, considere o fato de que esse fenômeno pode levar a um rastreamento ineficiente, deixando o Google menos tempo para analisar seu conteúdo mais recente e atualizado.
Conteúdo copiado e distribuído
Se você permitiu que outro site republicasse seu trabalho ou se seu conteúdo foi copiado, esse conteúdo agora aparece em vários domínios.
Isso geralmente não deve causar problemas, mas às vezes, por mais raro que seja, o conteúdo copiado ou republicado pode superar o original.
Felizmente, problemas de conteúdo duplicado podem ser tratados de algumas maneiras diferentes que ajudam a otimizar seu desempenho de SEO.
Como verificar conteúdo duplicado
Antes de poder resolver quaisquer problemas, você precisa saber que eles existem em primeiro lugar. Isso exigirá que você pesquise conteúdo duplicado em seu site. Você pode fazer isso de algumas maneiras:
1. Google Search Console
O Google Search Console pode fornecer informações sobre o desempenho da sua página da web nos resultados de pesquisa. Esse serviço também pode ajudá-lo a identificar problemas de conteúdo duplicado , por exemplo, encontrando URLs diferentes da mesma classificação de página nos resultados de pesquisa.
2. Pesquisa de conteúdo duplicada
Uma maneira rápida de verificar se há conteúdo duplicado é pesquisar blocos de texto da sua página – ao pesquisá-los, coloque as palavras entre aspas.
O ideal é que apenas sua página apareça. Se houver outros resultados, você pode ter um problema, embora nem sempre. Você pode tentar isso com várias frases.
Você também pode usar a barra de pesquisa do Google para pesquisar seu site. Digite “site:” seguido do URL, tudo entre aspas. Isso mostrará as páginas que o Google indexou e podem classificar potencialmente.
3. Verificadores de conteúdo duplicados
Existem vários verificadores de plágio, bem como verificadores de conteúdo duplicado do Google , que podem ajudar você a descobrir se seu conteúdo não é original, tem um problema interno de conteúdo duplicado ou foi republicado.
Como lidar com conteúdo duplicado
Embora o Google seja bastante bom em lidar com conteúdo duplicado, você sempre pode se envolver mais e resolver possíveis problemas diretamente para obter os melhores resultados.
Algumas dicas sobre o que fazer incluem:
- Use um redirecionamento 301, um URL canônico ou um redirecionamento noindex;
- Seja consistente em sua vinculação interna;
- Use domínios de primeiro nível – TLDs – para lidar com conteúdo específico do país;
- Certifique-se de que os sites com conteúdo sindicado contenham um link para sua página ou use a tag noindex;
- Consolidar páginas com conteúdo semelhante;
- Faça uma solicitação de DMCA no caso de conteúdo copiado;
Atualização do Panda para conteúdo duplicado
A atualização do Google Panda foi lançada em 2011 e foi uma mudança incrivelmente importante no algoritmo do Google. Embora o Panda não tenha como objetivo abordar especificamente o conteúdo duplicado em sites, a atualização incentiva o texto exclusivo e informativo, o que inclui evitar conteúdo repetitivo.
Perguntas frequentes sobre conteúdo duplicado
O que significa conteúdo duplicado em SEO?
Conteúdo duplicado representa blocos substantivos de texto que são uma correspondência completa ou sensivelmente semelhante a outro conteúdo online. O conteúdo repetitivo compõe cerca de um quarto da internet e na maioria das vezes não é enganoso ou malicioso por natureza.
Existe uma penalidade de conteúdo duplicado do Google?
A penalidade de conteúdo duplicado do Google foi deturpada na medida em que se tornou um mito. Conteúdo duplicado não é penalizado, a menos que viole as Diretrizes para webmasters do Google e pretenda manipular os resultados do mecanismo de pesquisa.
O conteúdo duplicado prejudica os rankings de SEO?
Conteúdo duplicado pode impactar negativamente sua estratégia de SEO. O Google tenta consolidar vários URLs que levam à mesma página e mostrar resultados originais superiores ao conteúdo republicado. No entanto, não é um sistema perfeito, pois uma URL desfavorável ou uma republicação entre domínios pode ter uma classificação mais alta do que seu artigo original. É por isso que o conteúdo duplicado também precisa ser abordado de forma proativa.
Quanto conteúdo duplicado é aceitável?
Não há uma medida definitiva para sugerir quanto do conteúdo que você tem pode ser duplicado. No entanto, como regra geral, não mais de 5% do conteúdo duplicado deve chegar ao seu site. Para gerenciar essa porcentagem, recorra a verificadores de plágio online.
