Veja a seguir a definição de conteúdo duplicado, tipos comuns (várias URLs no mesmo site, cópia entre sites, sindicação), como o Google trata a duplicação, causas frequentes e como evitar com canonical, redirecionamento e conteúdo único. Inclui checklist e perguntas frequentes.
O que é conteúdo duplicado
Conteúdo duplicado é conteúdo que aparece em mais de um lugar na web de forma idêntica ou quase idêntica. Pode ser:
- No mesmo site: a mesma página acessível por URLs diferentes (com ou sem www, com parâmetros, com barra final ou sem). Ex.: seusite.com/artigo e seusite.com/artigo?utm_source=email com o mesmo texto.
- Entre sites: texto seu copiado em outro domínio (com ou sem sua autorização). Ou você republicou em outro site sem indicar a origem.
- Sindicado ou republicado: artigo publicado no seu site e também em parceiros, agregadores ou redes. O mesmo conteúdo em várias URLs da web.
Boilerplate (rodapé, menu, avisos legais) repetido em todas as páginas não é tratado como “conteúdo duplicado” no sentido que prejudica SEO — o Google espera esse tipo de repetição. O problema é quando o bloco principal de conteúdo (o artigo, a descrição do produto) é o mesmo em várias URLs ou em vários sites.
O Google penaliza conteúdo duplicado?
Na maioria dos casos, não há penalidade manual (ação humana do Google) por conteúdo duplicado. O que acontece é:
- Consolidação: o algoritmo escolhe uma versão para indexar e exibir (geralmente a que considera mais completa ou com mais autoridade). As outras podem ser filtradas da SERP ou indexadas com menos destaque.
- Diluição: se várias URLs do seu site têm o mesmo conteúdo, links e sinais podem se dispersar; a “melhor” URL pode não ser a que você quer. O ranqueamento pode piorar porque o Google não sabe qual URL priorizar.
- Não indexação: páginas vistas como cópia de outra podem ficar “Descobertas – atualmente não indexadas” ou ser deixadas de fora do índice.
Penalidade manual (aviso no Search Console) costuma ocorrer em situações graves: conteúdo copiado em massa com intenção de manipular, sites que só republicam de outros ou cloaking. Para duplicação técnica (www vs não-www, parâmetros), a solução é canonical ou 301, não esperar punição — mas corrigir evita confusão e perda de posição.
Causas comuns de conteúdo duplicado
Conhecer as causas ajuda a prevenir e a corrigir.
Várias URLs para a mesma página
O mesmo conteúdo acessível por https://seusite.com/pagina, https://www.seusite.com/pagina, https://seusite.com/pagina/ ou https://seusite.com/pagina?ordenar=novos. Cada URL é um endereço diferente para o Google; sem sinalização, ele pode indexar mais de uma e tratar como duplicado.
Parâmetros de rastreamento, filtro e ordenação
E-commerce e sites com filtros geram dezenas de URLs com o mesmo conteúdo base (ex.: mesma lista de produtos com ?cor=azul, ?ordem=preco). Se todas forem indexáveis, o índice fica inflado com duplicação.
HTTP e HTTPS, ou www e não-www sem consolidar
Se o site responde 200 tanto em HTTP quanto em HTTPS (ou em www e não-www) sem redirecionamento, o Google vê duas versões. Sem 301 ou canonical, ambas podem ser indexadas e competir.
Conteúdo copiado de outro site
Publicar texto de outro domínio sem adaptação ou sem indicar a fonte. O Google tende a priorizar a versão que considera original ou mais relevante; a cópia pode não ranquear ou ser filtrada.
Paginação e listas
Blog ou listagem em várias páginas (página 2, 3…) com trechos repetidos (título do site, descrição). Cada URL é diferente, mas o Google pode ver conteúdo muito parecido. A solução é canonical ou noindex conforme a estratégia (cada página com canonical para si, ou páginas 2+ com noindex em alguns casos).
Como evitar conteúdo duplicado e penalização
Use canonical, redirecionamento e noindex para indicar ao Google qual versão conta.
Canonical URL
Coloque em cada página duplicada (ou variante) a tag <link rel="canonical" href="URL_preferida"> apontando para a URL que deve ser indexada e ranqueada. Assim o Google agrupa as variantes e concentra sinais na URL canônica. Use para parâmetros, www vs não-www (junto com 301 quando possível), barra final e paginação quando cada página tiver conteúdo distinto. Detalhes em canonical URL: o que é e como usar no SEO. O gerador de meta tags do Senior SEO gera a tag canonical.
Redirecionamento 301
Quando uma URL não deve mais existir e a outra é a definitiva, use redirecionamento 301 da antiga para a nova. O Google transfere o valor para a URL de destino e deixa de indexar a antiga. Ideal para consolidar www/não-www, HTTP/HTTPS e mudanças de slug. Veja redirecionamento 301 e 302.
Noindex para variantes que não devem aparecer
Em páginas que precisam existir (ex.: resultado de busca interna, impressão) mas não devem ser indexadas, use noindex (meta robots ou cabeçalho HTTP). O Google não as inclui no índice. Combine com canonical quando a página tiver uma “versão principal” em outra URL.
Conteúdo único
Para evitar duplicação entre sites ou entre páginas do mesmo site: escreva (ou adapte) o texto de forma única. Não copie blocos inteiros de outros domínios. Se republicar em parceiros, peça que usem canonical apontando para a sua URL original. No mesmo site, evite duas URLs com o mesmo artigo; se precisar de variantes (ex.: impressão), use noindex na variante.
Robots.txt para variantes em massa
Em sites com muitas URLs geradas por parâmetros (filtros, ordenação), você pode bloquear o rastreamento desses padrões no robots.txt para que o Google não gaste crawl nelas. Isso não remove do índice URLs já descobertas por links; para não indexar, use noindex. Robots.txt é complementar a canonical e noindex.
Checklist: evitar conteúdo duplicado
- Definir uma URL preferida por página (HTTPS ou HTTP, www ou não-www, com ou sem barra final) e usar 301 ou canonical para consolidar.
- Em páginas com parâmetros (utm, filtro, ordem), usar canonical apontando para a URL limpa (sem parâmetros) ou para a versão que deve ranquear.
- Paginação: canonical autorreferente em cada página da lista (página 2 aponta para si) ou noindex em páginas 2+ conforme a estratégia; evite canonical de todas para a página 1 se o conteúdo for diferente.
- Não publicar conteúdo copiado de outros sites sem reescrever ou sem syndication com canonical para a origem.
- Conteúdo sindicado: quem republica deve usar canonical para a URL original no seu site.
- Revisar no Search Console o relatório de Indexação para ver se há muitas URLs “Duplicada” ou “Alternativa com canonical definida pelo usuário” e confirmar que a canonical está correta.
O gerador de meta tags inclui a tag canonical; a análise de SEO ajuda a checar se a página tem os meta tags corretos.
Erros comuns com conteúdo duplicado
- Canonical apontando para URL errada: a tag deve apontar para a URL que você quer no índice (geralmente a própria página ou a versão “limpa”). Canonical para outra página faz a atual não ser priorizada.
- Várias canonicais na mesma página: use uma única tag link rel="canonical" por página. Múltiplas tags confundem o Google.
- Deixar HTTP e HTTPS ambos ativos sem 301: escolha HTTPS (ou HTTP) e redirecione a outra versão com 301. Duas versões 200 geram duplicação.
- Copiar conteúdo de concorrentes: texto idêntico ou quase idêntico de outro site tende a não ranquear ou a ser filtrado. Produza conteúdo original ou adapte com valor próprio.
Perguntas frequentes sobre conteúdo duplicado
Conteúdo duplicado gera penalidade manual?
Em geral não. O Google costuma consolidar (escolher uma versão) ou filtrar duplicatas sem aplicar ação manual. Penalidade manual é mais comum em esquemas deliberados (conteúdo copiado em massa, sites que só republicam). Mesmo sem penalidade, a duplicação pode diluir autoridade e fazer páginas não ranquear — por isso vale corrigir com canonical e 301.
Canonical ou 301 para resolver duplicação?
Use 301 quando a URL antiga não deve mais existir e o usuário deve ser levado à nova (mudança de domínio, de slug, consolidação www/HTTPS). Use canonical quando as duas URLs continuam acessíveis mas você quer que apenas uma seja a “principal” para o Google (ex.: mesma página com parâmetros diferentes). Em muitos casos os dois se complementam: 301 para consolidar versões do site, canonical para variantes com parâmetros.
O que fazer se meu conteúdo foi copiado por outro site?
O Google tende a priorizar a versão que considera original (geralmente a mais antiga ou a do domínio com mais autoridade). Se você publicou primeiro, pode manter a sua URL como canônica; em alguns casos o outro site pode usar canonical apontando para você. Para uso indevido em grande escala, existe o recurso de remoção por direitos autorais nas ferramentas do Google; para casos pontuais, muitas vezes o algoritmo já não exibe a cópia em destaque.
Conclusão
Conteúdo duplicado é o mesmo texto (ou muito parecido) em mais de uma URL — no seu site (parâmetros, www, HTTP/HTTPS, paginação) ou entre sites (cópia, sindicação). O Google em geral não aplica penalidade manual por isso, mas consolida ou filtra versões e pode desvalorizar ou não indexar duplicatas. Para evitar: use canonical URL para indicar a versão preferida, use redirecionamento 301 para consolidar URLs que não devem mais existir, use noindex em páginas que não devem ser indexadas e priorize conteúdo único. Evite canonical errada, várias canonicais na mesma página e deixar HTTP e HTTPS (ou www e não-www) ativos sem 301. Use o gerador de meta tags para a tag canonical e a análise de SEO para revisar a página.
Quer ver se sua página tem canonical e meta tags corretos? Faça uma análise de SEO gratuita no Senior SEO.