Comment réparer "Dupliquer, Google a choisi un canonique différent de l'utilisateur" dans Google Search Console
Publié: 2022-02-11De nombreux sites Web ne parviennent pas à optimiser leur contenu dupliqué d'une manière conviviale pour le référencement. En fait, selon les recherches de Tomek Rudzki, les statuts liés au contenu dupliqué sont le deuxième problème le plus courant dans Google Search Console pour les sites Web de toutes tailles.
Un problème de référencement de contenu en double qui prévaut est lorsque Google n'est pas d'accord avec les utilisateurs sur la version de la page qui est la principale. Dans ce cas, vous pourriez voir un statut "Dupliquer, Google a choisi un canonique différent de l'utilisateur" dans Google Search Console.
Voici ce que dit la documentation de Google à propos de "Dupliquer, Google a choisi un canonique différent de l'utilisateur":
Cette page est marquée comme canonique pour un ensemble de pages, mais Google pense qu'une autre URL en fait une meilleure canonique. Google a indexé la page que nous considérons comme canonique plutôt que celle-ci. Nous vous recommandons de marquer explicitement cette page comme un doublon de l'URL canonique. Cette page a été découverte sans demande d'exploration explicite. L' inspection de cette URL doit afficher l'URL canonique sélectionnée par Google.source : Google
Les conséquences de l'indexation par Google d'un contenu différent de celui que vous souhaitiez varient selon les cas individuels. Le plus grave est de décourager les utilisateurs de visiter ou de rester sur votre page en leur montrant des résultats qui, par exemple, manquent des informations essentielles qui sont présentes sur votre version préférée.
Cet article présente les causes possibles et les solutions pour le statut "Dupliquer, Google a choisi un statut canonique différent de celui de l'utilisateur".
Où pouvez-vous trouver le statut "Dupliquer, Google a choisi un canonique différent de l'utilisateur" ?
Vous pouvez vérifier l'état de votre page dans le rapport Index Coverage de Google Search Console.
Le rapport Index Coverage comprend quatre groupes de problèmes :
- Erreur,
- Valable avec Avertissements,
- Valide,
- Exclu.
"Dupliquer, Google a choisi un canonique différent de celui de l'utilisateur" appartient à la catégorie Exclus . Les URL exclues ne sont pas indexées et Google ne pense pas que ce soit une erreur.
Vous pouvez voir une liste d'URL indiquant "Dupliquer, Google a choisi un canonique différent de l'utilisateur" après avoir cliqué sur le statut dans la section Détails.

La liste est disponible pour l'exportation, mais il y a une limite de 1000 URL. Toutefois, si vous disposez de plusieurs sitemaps, vous pouvez télécharger le rapport pour chaque sitemap séparément et augmenter le nombre d'URL exportées.
Comment vérifier quelle page Google a choisie comme page canonique ?
Le statut "Dupliquer, Google a choisi un canonique différent de l'utilisateur" ne vous montre pas quelle page Google a choisie. Tout ce que vous pouvez voir, c'est qu'il s'agit d'une page différente de la page que vous vouliez indexer.
Pour voir quelle page Google a choisie, vous devez accéder à l' outil d'inspection d'URL.
Après avoir entré l'URL que vous souhaitez vérifier, vous verrez de nombreuses informations différentes, y compris l' état de la couverture. Vous pouvez développer cette option pour voir le canonique sélectionné par Google et le canonique déclaré par l'utilisateur.
Grâce à l' API d'inspection d'URL, vous pouvez désormais vérifier en masse jusqu'à 2000 URL par jour à l'aide de l'outil d'inspection d'URL et obtenir les informations sur le canonique sélectionné par Google dans un fichier JSON.
L'accès à l'API ajouté est très utile pour tous ceux qui ont du mal avec Google à choisir un canonique différent de celui sélectionné par l'utilisateur. Sans l'API, il est extrêmement long de vérifier le canonique sélectionné par Google sur un large échantillon d'URL.
Comment Google choisit-il la page canonique ?
Avant de passer aux méthodes utilisées par Google pour choisir la page canonique, laissez-moi vous expliquer pourquoi il est essentiel pour Google de déterminer quelles pages sont les pages d'origine :
Premièrement, les directives de Google stipulent que le moteur de recherche « s'efforce d'indexer et d'afficher des pages avec des informations distinctes. ” C'est pourquoi après avoir rencontré du contenu dupliqué, il choisit celui canonique qu'il identifie comme le plus utile à ses utilisateurs. Sinon, les utilisateurs verraient de nombreux résultats différents conduisant à un contenu identique.
Deuxièmement, selon la documentation de Google, « les doublons sont crawlés moins fréquemment » que les pages canoniques. Cela permet à Google d' économiser ses ressources pour explorer des pages plus importantes et de réduire sa charge d'exploration sur votre serveur.
Voyons maintenant comment Google choisit la page canonique.
Nous essayons de choisir l'URL canonique en suivant deux directives générales : premièrement, quelle URL le site semble-t-il vouloir que nous utilisions ; alors, quelle est la préférence du site ? Et deuxièmement, quelle URL serait la plus utile pour l'utilisateur ?source : John Muller
Certains des signaux que Google examine lors de la détermination de la version canonique incluent :
- Balises canoniques,
- Plans de site,
- Structure de maillage interne,
- HTTPS sur protocole HTTP,
- URL plus attrayante,
- Redirections.
Ces facteurs sont des indices que vous pouvez utiliser pour aider Google à comprendre quelle page vous souhaitez indexer. Cependant, le moteur de recherche n'est pas obligé de les respecter.
Balises canoniques
<link rel="canonical" href="https://example.com/original-page">Une balise canonique est un morceau de code HTML placé dans la section <head>. Son attribut href inclut un lien vers la version canonique d'une page. Si la page en question est une version dupliquée et non canonique de votre contenu, vous devez placer un lien vers la version canonique dans l'attribut href.
Mais vous pouvez également ajouter une balise canonique auto-référencée. Une page auto-référençante contient une balise canonique avec l'attribut href pointant vers elle-même. Pendant les heures de bureau SEO de Google, John Mueller a recommandé d'utiliser les balises canoniques d'auto-référence, même s'il n'y a qu'une seule version de la page.
Je recommande de faire ce canonique auto-référentiel car cela nous indique vraiment quelle page vous souhaitez indexer, ou quelle doit être l'URL lorsqu'elle est indexée.Même si vous avez une seule page, il existe parfois différentes variantes de l'URL qui peuvent faire remonter cette page. Par exemple, avec des paramètres à la fin, peut-être avec des majuscules minuscules ou www et non-www, et toutes ces choses peuvent être en quelque sorte nettoyées avec une balise canonique rel.
source : John Muller
Plans de site
Les sitemaps sont de simples fichiers texte répertoriant les URL que vous, en tant que propriétaire du site, souhaitez indexer. Il sert de feuille de route aux robots des moteurs de recherche, leur permettant de trouver rapidement des URL précieuses, sans parcourir tout le site Web au préalable.
Les sitemaps ne doivent inclure que des URL canoniques. Mettre des pages en double dans un plan de site peut gaspiller votre budget d'exploration (le nombre d'URL que Google peut et veut explorer sur votre site Web) et confondre les moteurs de recherche.
Cependant, mettre une URL dans un sitemap ne garantit pas que les moteurs de recherche indexeront cette URL. C'est juste un indice qui les aide à comprendre quelles pages vous intéressent le plus. Dans notre Guide ultime des sitemaps XML, vous pouvez en savoir plus sur la création et l'optimisation de votre sitemap.
Maillage interne
La façon dont les pages sont liées entre elles aide les moteurs de recherche à trouver toutes les pages utiles et à déterminer leur importance.
Plus la page est précieuse, plus les liens doivent pointer vers elle.
Imaginons qu'il y ait deux pages de valeur égale. L'un d'eux n'est lié qu'à partir du plan du site. L'autre se trouve facilement dans la navigation et contient des liens pointant vers d'autres pages du site Web. Dans ce cas, Google suppose que la page avec des liens a plus de valeur que celle qui se trouve uniquement dans le sitemap.
La structure des liens internes fait partie d'un problème plus complexe appelé architecture de site Web. Si vous souhaitez en savoir plus à ce sujet, je vous recommande de lire notre guide complet sur l'architecture du site, qui explique en détail ce que c'est et comment en concevoir un parfait pour votre site Web.
HTTPS sur HTTP
HTTP est un protocole définissant le transfert de données entre un serveur et un client. HTTPS est la version cryptée du protocole. Grâce à la couche de sécurité supplémentaire, la transmission des données est plus sûre et le risque de manipulation des données est moindre.
HTTPS influence le classement de vos pages.
Si vous avez une page accessible à la fois en version HTTP et HTTPS, Google choisira d'indexer la version HTTPS.
URL plus attrayantes
Les URL aident à la fois les utilisateurs et les moteurs de recherche à voir le contenu d'une page. En tant que propriétaire de site Web, vous contrôlez l'apparence de vos URL. Comme l' a dit John Mueller, si plusieurs URL mènent à la même page, Google pourrait choisir "les plus belles".
Que signifie exactement une URL plus attrayante ? Google dit que "la structure d'URL d'un site doit être aussi simple que possible".
Regardons les exemples de deux URL :
- https://www.example.com/index.php?id_sezione=360&sid=sdr3bc
- https://www.example.com/été/robe
La deuxième URL est définitivement "plus belle". C'est parce qu'il est plus court et indique clairement ce que contient cette page. Si vous souhaitez en savoir plus sur la structure des URL, je vous recommande de lire notre article sur Comment créer une URL optimisée pour le référencement.

Redirections
L'utilisation de la redirection 301 est l'un des moyens de consolider le contenu dupliqué sur votre site. Si un utilisateur ou un robot de moteur de recherche accède à une page, il les redirigera automatiquement vers une nouvelle.
Vous pouvez l'utiliser lorsque vous souhaitez qu'une seule version de votre page reste disponible sur votre site Web. Par exemple, si vous avez une version www et non-www, vous pouvez utiliser la redirection 301 pour spécifier laquelle vous devez rester disponible et être indexée.
Causes et solutions pour le statut "Dupliquer, Google a choisi un statut canonique différent de celui de l'utilisateur"
Dans certains cas, le choix d'une URL canonique différente de celle de l'utilisateur peut ne pas avoir de conséquences. Si deux pages sont identiques, celle que Google a choisie peut être aussi bien classée que celle que vous avez choisie.
Mais il y a de fortes chances que vous ayez choisi une page canonique pour une raison. Si les pages ne sont pas identiques, il se peut que celle choisie par Google manque de détails essentiels, ce qui peut décourager les utilisateurs de visiter votre site Web.
Examinons donc les causes possibles pour lesquelles Google pourrait être en désaccord avec vous sur la version canonique et les moyens de résoudre le problème.
Google peut choisir une page canonique différente de celle de l'utilisateur pour diverses raisons, notamment :
- Signaux incohérents,
- Balise canonique auto-référençante sans contenu unique,
- Problèmes de rendu,
- Cibler différents pays avec la même langue/langue similaire.
Signaux incohérents
Comme mentionné dans la section "Comment Google choisit-il la page canonique ?" chapitre, vous pouvez utiliser plusieurs signaux pour indiquer quelle page est la page d'origine. Cependant, si vous les utilisez de manière incohérente, Google risque de semer la confusion et de choisir la mauvaise URL à indexer.
Imaginons une situation où vous avez trois pages en double :
- Toutes les pages ont des balises canoniques pointant vers la page A,
- La page B est dans le plan du site,
- La page C a le plus de liens internes pointant vers elle.
En cas de signaux contradictoires, Google doit deviner laquelle des pages est la vraie page canonique.
Plus vos signaux sont clairs, plus il est facile de leur faire confiance :). Par exemple, si les liens internes, les sitemaps, hreflang, rel-canonical, etc. sont tous alignés, il n'y a pas grand-chose à deviner. Souvent, c'est assez incohérent et plus difficile à choisir.
– John (personnel) (@JohnMu) 28 février 2018
Solution
Il existe une solution à cette cause du statut « Duplique, Google a choisi un statut canonique différent de celui de l'utilisateur » : soyez cohérent !
Voici quelques conseils à garder à l'esprit lors de la configuration des signaux canoniques :
- Évitez de mettre des pages non canoniques ou des pages avec des redirections dans votre sitemap,
- Assurez-vous que vos liens internes sont cohérents et que chaque lien pointe vers la version canonique,
- Les balises canoniques doivent pointer vers la version finale, ne pas inclure de page redirigeant vers une autre page,
- Évitez les boucles canoniques (la page A a une balise canonique pointant vers la page B et la page B a une balise canonique pointant vers la page A) et les chaînes canoniques (la page A a une balise canonique pointant vers la page B et la page B a une balise canonique pointant vers la page C).
Balise canonique auto-référençante sans contenu unique
Si vous avez plusieurs pages avec des balises canoniques auto-référencées, mais que Google décide qu'elles ne contiennent pas de valeur unique, il se peut qu'il ne sélectionne qu'une seule page à indexer.
Cela se produit généralement sur les sites de commerce électronique lorsque plusieurs produits ont la même description.
Si vous vendez le même modèle de lit dans différentes tailles, vous souhaiterez peut-être que toutes les pages de tailles différentes soient indexées afin que les utilisateurs puissent facilement trouver ce qu'ils recherchent. Après tout, s'ils recherchent un lit king-size et qu'ils ne voient que de petits lits destinés aux enfants dans les résultats de recherche, ils pourraient ignorer votre page et visiter le site Web de votre concurrent à la place.
Si quelqu'un recherche un morceau de texte qui se trouve dans cette description dupliquée sur vos pages, alors nous reconnaîtrons que ce morceau de texte se trouve sur un tas de pages sur votre site Web, et nous essaierons de choisir peut-être une ou deux pages de votre site Web à afficher.source : John Muller
Solution
Ajoutez du contenu unique à vos pages.
Ne vous fiez pas uniquement aux balises canoniques auto-référencées. Au lieu de cela, assurez-vous que chaque page a une valeur unique.
John Mueller a abordé le problème des descriptions en double pendant les heures de bureau SEO de Google. Il a déclaré que vous devriez au moins avoir des informations textuelles supplémentaires indiquant que les produits sont différents.
[…]si vous n'avez rien dans le contenu textuel qui couvre l'élément visuel de vos produits, il nous est alors très difficile de les afficher correctement dans les résultats de recherche. […]C'est donc l'angle que je prendrais ici, c'est bien d'avoir des parties de la description dupliquées. Mais je m'assurerais certainement que vous ayez au moins quelque chose là-dedans qui contienne vraiment du texte sur les éléments visuels qui sont uniques à ces produits individuels que vous vendez.
source : John Muller
Problème de rendu
Les moteurs de recherche ne sont toujours pas parfaits pour rendre JavaScript. Donc, si vous comptez beaucoup sur lui pour afficher votre contenu, Google pourrait avoir des problèmes pour voir chaque élément de votre page.
Le rendu est essentiel pour que Google et les autres moteurs de recherche puissent voir et comprendre le contenu et la mise en page de notre site Web. Sans rendu, votre contenu n'existe pas en ligne. Nous sommes bien au-delà de l'époque où vous pouviez voir votre contenu en regardant simplement dans le code HTML du site Web.source : Manifeste du rendu SEO – pourquoi le référencement JavaScript ne suffit pas
Google peut penser que certaines pages sont des doublons car il ne peut pas restituer le contenu qui les rend uniques.
Disons que vous avez trois pages uniques. Chacun a une balise canonique auto-référençante. JavaScript génère leur contenu principal et, pour une raison quelconque, Google ne le rend pas. Au lieu de cela, il ne voit qu'un espace vide et quelques éléments supplémentaires comme une barre de navigation qui sont les mêmes pour chaque page. Pour Google, ces pages ressemblent à des doublons, et c'est pourquoi il n'en sélectionne qu'une seule à indexer.
Vous pouvez vérifier comment Google affiche votre page dans l'outil d'inspection d'URL de Google Search Console. L'outil fournit des captures d'écran de votre page rendue qui vous permettent d'avoir un aperçu de la façon dont Google voit votre page. Si votre contenu manque sur les captures d'écran, cela indique qu'il peut y avoir des problèmes de rendu.
Solution
Tout d'abord, vous devez vous assurer que Google a accès à tous les scripts nécessaires. Assurez-vous que vos ressources JavaScript ne sont pas bloquées par robots.txt (un fichier que vous pouvez créer pour spécifier quelles pages peuvent être explorées).
Si vos ressources sont accessibles à Google, vous devrez évaluer les scripts. Vous devez tenir compte d'aspects tels que la taille de votre script et si vous en avez besoin pour générer la page.
Le sujet du rendu SEO est vaste, et si vous n'avez pas d'expérience en matière de codage, vous aurez peut-être besoin de l'aide de vos développeurs pour résoudre certains des problèmes les plus complexes. Pour plus d'informations, consultez notre manifeste sur le rendu SEO, où nous avons expliqué le sujet en détail.
Cibler différents pays avec la même langue/langue similaire
Si vous avez des pages ciblant des pays spécifiques qui parlent la même langue ou une langue similaire (par exemple, les États-Unis et le Royaume-Uni), il peut arriver que Google n'en choisisse qu'une seule à indexer.
Supposons que la seule solution que vous utilisez pour indiquer que vous ciblez différents pays avec la même langue est une balise canonique auto-référençante. Dans ce cas, Google pourrait ne pas comprendre le but et penser que ce sont toutes des pages en double. Par conséquent, il n'en choisira qu'un seul à indexer, et vos utilisateurs pourraient trouver des pages dédiées à différents pays dans leurs résultats de recherche.
Cela pourrait être un problème particulièrement important pour les sites de commerce électronique, car cela pourrait entraîner l'incapacité des clients à effectuer un achat.
Solution
Vous devez toujours vous assurer que vous avez des balises hreflang en place.
Une balise hreflang est un morceau de code HTML qui vous aide à spécifier la langue et le pays ciblés par la page.
<link rel="alternate" hreflang=" en-gb " href="https://en-gb.example.com/item"> <link rel="alternate" hreflang=" en-us " href="https://en-us.example.com/item">
La balise hreflang vous permet de spécifier non seulement la langue (en – anglais) mais aussi le pays (gb – Grande-Bretagne, us – États-Unis).
Une autre chose que vous pouvez faire est de vous assurer que votre contenu est non seulement traduit mais également localisé. Même si la langue est la même, différents pays ont des cultures différentes. Assurez-vous d'adapter vos pages aux utilisateurs d'un pays spécifique. Non seulement cette pratique offre une meilleure expérience utilisateur à vos clients, mais elle pourrait également convaincre Google que ces pages sont uniques.
Enfin et surtout, vous devriez avoir un plan de secours au cas où les techniques mentionnées ci-dessus échoueraient. Créez une bannière JavaScript qui s'affiche en fonction de l'emplacement de l'utilisateur. S'il détecte que, par exemple, un utilisateur britannique saisit une version américaine, il suggérera une version plus appropriée et laissera le client décider s'il souhaite rester ou visiter une page désignée pour sa région.
"Dupliquer, Google a choisi un canonique différent de celui de l'utilisateur" par rapport à "Dupliquer, URL soumise non sélectionnée comme canonique" par rapport à "Dupliquer sans canonique sélectionné par l'utilisateur"
"Dupliquer, Google a choisi un canonique différent de l'utilisateur" peut facilement être confondu avec deux statuts différents dans le rapport de couverture de l'index :
- "URL soumise en double non sélectionnée comme canonique" et
- "Dupliquer sans canonique sélectionné par l'utilisateur."
Ces statuts indiquent la même chose : la page n'est pas indexée car Google pense qu'elle n'est pas canonique.
La différence réside dans la façon dont Google a découvert la page et si l'utilisateur a déclaré une balise canonique ou non.
La principale différence entre eux est que "Dupliquer, Google a choisi un canonique différent de l'utilisateur" avait déjà spécifié une balise canonique que Google n'a pas récupérée. En revanche, les deux autres statuts n'avaient pas de balises canoniques définies par l'utilisateur.
De plus, vous avez explicitement demandé que l'URL signalant "URL soumise en double non sélectionnée comme canonique" soit indexée en la soumettant dans votre sitemap.
Emballer
Si vous voyez un statut "Dupliquer, Google a choisi un statut canonique différent de celui de l'utilisateur" et que vous pensez que Google n'a pas choisi la bonne page à indexer, vous pouvez faire plusieurs choses pour donner à votre page préférée les meilleures chances d'être indexée :
- Soyez cohérent dans l'envoi des signaux canoniques : assurez-vous que seule la page canonique est dans votre sitemap et que les liens internes pointent vers elle,
- Assurez-vous que chaque page a une valeur unique. Si vos pages produits ont la même description, ajoutez un contenu textuel indiquant que les produits sont différents,
- Assurez-vous que votre contenu s'affiche correctement dans l'outil d'inspection d'URL,
- Ne traduisez pas seulement le contenu dans différentes langues, mais localisez -le également pour le pays spécifique que vous ciblez,
- N'oubliez pas d'ajouter des balises hreflang pour le contenu ciblant plusieurs pays.
