Guide ultime des balises canoniques pour le référencement

Publié: 2022-01-28

Les balises canoniques vous permettent de spécifier laquelle, parmi plusieurs pages en double, est la version principale préférée d'une page.

Tout site Web peut souffrir de problèmes de contenu en double - et vous ne savez peut-être pas qu'une partie de votre contenu est considérée comme dupliquée.

Sans la balise canonique, vous êtes à la merci des moteurs de recherche – ils sélectionneront eux-mêmes la version canonique. Et, ils peuvent très bien en choisir un que vous ne considérez pas comme représentatif du contenu donné. Cela peut avoir un impact important sur la visibilité et le classement de votre recherche.  

Ce guide explique les caractéristiques et les meilleures pratiques d'utilisation des balises canoniques pour résoudre les problèmes de contenu dupliqué sur votre site Web.

Masquer le contenu
1 Que sont les balises canoniques ?
2 Moteurs de recherche et contenu dupliqué
2.1 Comment Google choisit-il les pages canoniques ?
3 Quand utiliser des balises canoniques ?
3.1 Les avantages de l'utilisation des balises canoniques
3.2 Types de contenu à baliser avec des balises canoniques
3.3 Comment les balises canoniques se comparent aux balises noindex et aux redirections 301
4 Comment ajouter des balises canoniques à une page
4.1 Balise HTML
4.2 En-tête HTTP
5 bonnes pratiques pour utiliser les balises canoniques
5.1 Utiliser des URL absolues
5.2 Utiliser des balises canoniques autoréférentielles
5.3 Envoyer des signaux clairs aux moteurs de recherche
5.4 Assurez-vous d'utiliser la bonne URL lorsque vous créez un lien en interne
5.5 Ne pointez pas la balise canonique sur la première page de la pagination
5.6 Pointer vers la version bureau d'une page
5.7 Identifier une page canonique lors de l'utilisation de balises hreflang
5.8 Prévenir les problèmes de budget de crawl
6 Comment auditer les balises canoniques
6.1 Comment utiliser Google Search Console pour analyser les balises canoniques
6.2 Effectuer un crawl de site pour auditer les balises canoniques
7 Conclusion

Que sont les balises canoniques ?

Une balise canonique est un extrait de code qui indique la version principale (canonique) d'une page lorsqu'il existe plusieurs versions de cette page.

À l'aide de la balise canonique, vous pouvez indiquer aux moteurs de recherche quelle URL doit être indexée et apparaître dans les résultats de recherche.

La technique la plus courante pour implémenter des balises canoniques consiste à ajouter l'extrait de code suivant au code HTML d'une page :

 <link rel="canonical" href="https://example.com/sample-page/" />

Le code signifie que la page canonique se trouve à l'URL spécifiée.

Les balises canoniques sont utilisées pour résoudre les problèmes de contenu dupliqué - mais quel contenu les moteurs de recherche considèrent-ils comme dupliqué et comment le traitent-ils ?

Moteurs de recherche et contenu dupliqué

Les problèmes de contenu dupliqué proviennent du simple fait que les robots des moteurs de recherche regardent les pages différemment des utilisateurs.  

Pour un robot d'exploration de moteur de recherche, chacune des URL suivantes est différente :

  • http://site.com
  • https://site.com  
  • https://site.com/index.php
  • http://site.com/index.php  
  • http://www.site.com  

Alors qu'un utilisateur prête attention au contenu d'une page, les robots d'exploration perçoivent chaque adresse URL comme une entité distincte, même lorsque plusieurs pages ont un contenu identique.

Les problèmes de contenu en double ont tendance à être particulièrement graves pour les sites de commerce électronique, mais ne se limitent pas à eux. De nombreux sites Web modernes ajoutent automatiquement des balises et des paramètres aux URL, par exemple pour trier ou filtrer les pages, et ils utilisent souvent de nombreux chemins menant au même contenu.

Plusieurs versions de vos URL peuvent également exister si vous utilisez différentes structures d'URL - par exemple, vos URL sont à la fois www et non-www, avec et sans barres obliques finales, avec les protocoles HTTP et HTTPS, et dans tout autre format.

Cela peut conduire à un contenu dupliqué, que les moteurs de recherche hésitent à indexer.

Plus précisément, lorsque les moteurs de recherche rencontrent du contenu en double, ils ont du mal à décider :

  • Quelle page doit être indexée,
  • Quelle page doit être classée pour les mots clés pertinents, et
  • S'ils doivent consolider les signaux de classement sous une seule URL ou les répartir sur plusieurs pages.

Bien que les moteurs de recherche puissent dédupliquer les pages à des fins de classement, il est risqué de les laisser choisir l'URL canonique - ils peuvent sélectionner une page qui n'est pas la version la plus représentative de votre contenu.

Comment Google choisit-il les pages canoniques ?

Il est important de noter que Googlebot ne suivra pas toujours vos balises canoniques, car elles ne servent que de suggestions sur la manière dont une URL donnée doit être traitée.

Google examine de nombreux autres facteurs sur la page lors du choix de la version canonique.

Ces facteurs comprennent, entre autres :

  • redirections ,
  • Maillage interne et externe,
  • Plans du site ,
  • Nettoyer la structure des URL,
  • L'utilisation du protocole HTTPS.

Vous pouvez vérifier si Google a respecté votre balise canonique ou en a sélectionné une autre à l'aide de l' outil d'inspection d'URL .

Google utilise les pages canoniques comme principales sources pour évaluer le contenu et la qualité. Un résultat de recherche Google pointe généralement vers la page canonique, sauf si l'un des doublons est explicitement mieux adapté à un utilisateur. Par exemple, le résultat de la recherche pointera probablement vers la page mobile si l'utilisateur est sur un appareil mobile, même si la page de bureau est marquée comme canonique.
source : documentation de Google

Regardez cette vidéo qui explique comment Google choisit les URL canoniques.

Quand utiliser des balises canoniques ?

N'oubliez pas que le simple fait d'ajouter des balises canoniques ne résoudra pas tous les problèmes de contenu dupliqué ou léger.

Votre objectif principal devrait être d'éliminer les problèmes de base qui causent ces problèmes. Concentrez-vous sur l'analyse de la possibilité de supprimer ou d'améliorer le contenu des pages en double pour le rendre plus unique et peut-être offrir plus de valeur à l'utilisateur.

Néanmoins, le balisage précis de vos pages avec des balises canoniques est un pas en avant dans la gestion du contenu dupliqué.

Analysons comment vous pouvez bénéficier des balises canoniques et quand les utiliser.

Les avantages de l'utilisation des balises canoniques

En ajoutant des balises canoniques, vous pouvez :

Spécifiez quelle page doit apparaître dans les résultats de recherche

Les moteurs de recherche visent à offrir la meilleure expérience utilisateur - c'est pourquoi ils affichent rarement plus d'une version du même contenu dans les résultats de recherche.

Les balises canoniques vous permettent d'améliorer la visibilité de la recherche de la version de page la plus représentative, ce qui peut augmenter le trafic organique vers cette page et se traduire par des avantages commerciaux.

Consolider les signaux de classement pour les pages en double

D'autres sites peuvent créer des liens vers différentes versions en double de vos pages, diluant les signaux que les moteurs de recherche prennent en compte lors du classement.

Lorsque vous utilisez une balise canonique, vous indiquez aux moteurs de recherche que les signaux de classement des URL en double doivent être transmis à la page canonique.

Décourager l'exploration des pages en double

Si vous implémentez des balises canoniques, il est moins probable que les moteurs de recherche continuent d'explorer les pages canonisées en sachant qu'il s'agit de copies.

Dans le même temps, la version canonique devrait être crawlée plus régulièrement.  

C'est une opportunité pour vos pages canoniques d'être explorées plus efficacement, ce qui peut affecter positivement le statut d' indexation de votre site Web .

Types de contenu à baliser avec des balises canoniques

Passons en revue le contenu spécifique pour lequel vous devez sélectionner une page canonique.

Les types et aspects de contenu suivants n'ajoutent généralement aucune valeur à votre site Web et peuvent entraîner une augmentation des quantités de contenu dupliqué.

Contenu syndiqué

La syndication de contenu signifie qu'un élément de contenu a été republié sur un autre domaine.

L' implémentation d'une balise canonique peut aider à attribuer la propriété de l'article à l'éditeur d'origine.

Filtrage et tri des produits

Les options de filtrage et de tri, typiques des sites de commerce électronique, utilisent généralement des chaînes de requête ajoutées aux URL, ce qui peut créer d'énormes quantités de contenu en double. La canonisation des pages de filtrage et de tri aidera votre version canonique à se classer plus haut et empêchera les moteurs de recherche d'explorer inutilement le contenu en double,

Paramètres redondants dans les URL

Les paramètres peuvent être redondants pour une page s'ils ne sont pas utilisés pour le suivi, ne modifient pas le contenu et n'ajoutent aucune information significative à l'URL.

Au lieu de cela, ils peuvent conduire à une exploration inefficace de votre site.

Variantes de produit

Un produit peut se présenter sous différentes variantes, où la seule caractéristique qui change est sa couleur, sa taille ou tout autre attribut applicable. La canonisation peut vous aider à sélectionner la variante principale du produit.

Cependant, considérez si le produit reste le même. Par exemple, dans le créneau technologique, différentes variantes de produits, comme les smartphones, peuvent en fait contenir d'autres fonctionnalités et devraient donc toutes apparaître dans les résultats de recherche.

Paramètres de suivi et identifiants de session

Les paramètres de suivi peuvent suivre une campagne ou un parcours utilisateur, et ils ne modifient pas le contenu d'une page, ils doivent donc également être canonisés.

Comment les balises canoniques se comparent aux balises noindex et aux redirections 301

Vous vous demandez peut-être comment les balises canoniques se comparent à d'autres solutions qui peuvent affecter la façon dont les moteurs de recherche indexent les pages et s'ils les indexent ou non.

Comparons les caractéristiques et les cas d'utilisation SEO des balises canoniques, des balises noindex et des redirections 301.

Utiliser des balises canoniques par rapport aux balises noindex

Les balises Noindex sont utilisées pour exclure des pages de l'index, pas pour gérer quelle page doit être choisie comme canonique.  

Vous ne devez jamais utiliser la balise noindex pour empêcher les moteurs de recherche de sélectionner une page canonique.

Les pages canonisées regroupent généralement les signaux de classement sous une seule URL, contrairement aux balises noindex - cela est dû au fait que Google traite les noindex à long terme, suivez les balises comme noindex, nofollow .

La règle générale est qu'une page ne doit pas être à la fois non indexée et canonisée. Par exemple, les pages canonisées en URL non indexées seront supprimées de l'index.

John Mueller a précisé pendant les heures de bureau SEO qu'il n'y a aucun risque qu'une page non indexée et canonisée transfère le noindex vers sa destination canonique, ce qui supprimerait par la suite les deux adresses de l'index.

Cependant, l'utilisation à la fois de balises noindex et canoniques envoie des signaux mitigés à Google. Cela signifie que Google peut interpréter les balises comme bon lui semble, et le résultat pourrait vous être indésirable.

Utiliser des balises canoniques par rapport aux redirections 301

Les moteurs de recherche et les utilisateurs perçoivent les balises canoniques et les redirections 301 très différemment.

Si vous utilisez une redirection 301, les utilisateurs seront automatiquement redirigés vers la page de destination et ne verront pas la page d'origine. Les redirections 301 vous aident également à économiser votre budget de crawl car elles limitent le nombre d'URL à crawler.

Pendant ce temps, avec une balise canonique, les utilisateurs pourront toujours visiter les deux URL. De plus, les URL en double sont toujours explorées par les moteurs de recherche, de sorte que le nombre de pages explorables ne diminue pas.

Bien que les balises canoniques aient tendance à transmettre les signaux de classement à la version principale d'une page, les redirections 301 sont une indication plus forte pour Google que les signaux de classement doivent être transférés à l'URL de destination. Cela se produit parce que Google ne voit aucun contenu intermittent, comme c'est le cas avec les balises canoniques.

Précisons quand une redirection 301 sera plus appropriée qu'une balise canonique.

Il est préférable d' utiliser des redirections 301 pour consolider les URL :

  • Contenant des lettres minuscules et majuscules,
  • Avec et sans barres obliques finales,
  • protocoles HTTP ou HTTPS,
  • Existant à la fois avec et sans www.

Si vous apportez des modifications à votre contenu, par exemple lors de la migration du site , et que vos URL changent, vous devez rediriger les anciennes URL vers les nouvelles en 301. Outre la redirection, assurez-vous que la nouvelle URL de destination comporte une balise canonique autoréférentielle.

Une autre situation où les redirections 301 seront optimales est lorsque les produits sont accessibles sous de nombreuses URL.  

Dans ce cas, modifiez la structure de votre URL afin qu'elle n'inclue pas le nom de la catégorie à laquelle les produits ont été attribués. Ensuite, 301 redirige l'ancienne URL. Si des catégories sont redondantes, vous pouvez les supprimer et les rediriger vers des pages alternatives pertinentes.

Dans l'ensemble, utilisez une redirection 301 si une seule URL doit encore être accessible aux utilisateurs.

Comment ajouter des balises canoniques à une page

Il existe deux méthodes principales pour spécifier les pages canoniques - dans les en-têtes HTML ou HTTP d'une page. Vous pouvez les implémenter manuellement ou utiliser l'un des outils qui peuvent vous aider à l'automatiser.

Par exemple, vous pouvez opter pour un plugin SEO si vous utilisez un CMS. Les plugins avec la fonctionnalité de spécifier des pages canoniques incluent Yoast SEO ou All in One SEO.  

Si vous utilisez Shopify , vous pouvez définir des URL canoniques personnalisées si nécessaire. Le paramètre par défaut de Shopify consiste à ajouter des URL canoniques auto-référencées pour les produits et les articles de blog.

Quelle que soit la méthode que vous choisissez, n'oubliez pas de n'implémenter les balises canoniques qu'à un seul endroit - n'utilisez pas ces méthodes simultanément. Si Google découvre plusieurs déclarations de la balise canonique, il les ignorera probablement toutes.

Balise HTML

L'ajout d'une balise canonique dans votre code HTML est le moyen le plus courant de l'implémenter.

Ajoutez le code suivant à la section <head> d'une page en double du code HTML et collez l'URL de la version canonique :

 <link rel="canonical" href="https://example.com" />

Cette méthode ne fonctionne que pour les pages HTML, utilisez donc l'en-tête HTTP si vous souhaitez canoniser d'autres types de fichiers.

En-tête HTTP

Vous pouvez implémenter l' en-tête HTTP "rel=canonical" pour indiquer la version canonique d'une URL :

 Lien : <http://www.example.com/downloads/white-paper.pdf> ; rel="canonique"

Utilisez l'en-tête HTTP pour spécifier un canonique pour les documents non HTML, tels que les fichiers PDF.

Pour utiliser cette solution, vous devez avoir accès au serveur de votre site Web. Cela nécessite également des compétences techniques, car cette méthode est plus sujette aux erreurs et difficile à mettre en œuvre que le HTML.

Bonnes pratiques d'utilisation des balises canoniques

Le respect des meilleures pratiques en matière de balises canoniques permet d'atténuer le risque que les moteurs de recherche considèrent la mauvaise version de la page comme canonique.

Voici ma liste de recommandations pour les balises canoniques :

Utiliser des URL absolues

En théorie, Google devrait reconnaître les URL relatives et absolues. Cependant, les versions absolues des URL sont moins sujettes aux erreurs et plus faciles à déboguer.

En d'autres termes, utilisez une URL complète dans une balise canonique :

 <link rel="canonical" href="https://example.com/sample-page/" />

Et évitez d'inclure uniquement le chemin de l'URL :

 <link rel="canonical" href="/sample-page/" />

Utiliser des balises canoniques auto-référentielles

Bien que ce ne soit pas obligatoire, il est recommandé d'utiliser des balises canoniques qui pointent vers les pages sur lesquelles elles se trouvent.

Il est essentiel de l'implémenter si vous utilisez des paramètres pour suivre les campagnes. Cela devrait rendre toutes les URL avec un paramètre de campagne canonisées en URL statique par défaut et les empêcher d'être indexées.

Voici ce que John Mueller de Google a dit pendant les heures de bureau SEO concernant les canoniques autoréférentiels :

Il n'est pas essentiel d'avoir une balise canonique auto-référençante sur une page, mais cela nous permet de choisir plus facilement l'URL que vous souhaitez avoir choisie comme canonique.

Nous utilisons un certain nombre de facteurs pour choisir une URL canonique, et rel=canonical joue un rôle à cet égard.

Ainsi, en particulier, des choses comme les paramètres d'URL, ou si l'URL est étiquetée d'une manière particulière - peut-être que vous avez des liens vers cette page qui sont étiquetés pour l'analyse, par exemple - alors il peut arriver que nous choisissions cette URL étiquetée comme un canonique […]

source : John Muller

Envoyez des signaux clairs aux moteurs de recherche

L'envoi de signaux clairs consiste à spécifier un seul canonique par page.  

Évitez de spécifier une URL comme canonique et, en même temps, de rediriger ladite URL vers une autre destination.

Un autre cas concerne les canoniques ajoutés à l'aide de JavaScript.  

Si aucune page canonique n'est spécifiée dans le HTML et qu'une balise canonique est ajoutée avec JavaScript, Google doit la respecter lors du rendu. Mais, si un canonique est défini dans le HTML et que JavaScript le modifie, vous envoyez des signaux mitigés à Google.

L'envoi de signaux mitigés peut amener les moteurs de recherche à interpréter incorrectement vos canoniques ou à choisir la mauvaise version comme canonique.

Assurez-vous d'utiliser la bonne URL lorsque vous créez un lien en interne

Lorsque vous placez des liens internes sur votre site, assurez-vous de créer un lien vers l'URL canonique plutôt que vers les doublons.

Comme mentionné, Google peut ne pas respecter le canonique si des signaux plus forts pointent vers une autre URL . L'un de ces signaux pourrait être un lien accru vers une URL en double que Google pourrait considérer comme la version principale à la place.

Ne faites pas pointer la balise canonique vers la première page de la pagination

C'est une erreur courante de viser uniquement à indexer la première page de pagination. Vous voudrez peut-être l'utiliser pour empêcher les utilisateurs d'accéder aux pages suivantes à partir des résultats de recherche, mais ce n'est pas la bonne approche. Les moteurs de recherche peuvent ignorer la canonisation car ces pages ne sont généralement pas des doublons. Mais s'ils respectent les balises canoniques, la pagination peut être canonisée.

Si la pagination contient des liens vers des produits uniques et qu'il n'y a pas d'autre lien entre les pages de produits, les liens vers les pages de produits dans la pagination peuvent être ignorés. En d'autres termes, les pages de produits indexables n'auront pas de liens internes provenant d'autres pages.

Au lieu de cela, les pages paginées doivent avoir des balises canoniques auto-référentielles. Le contenu de ces pages n'est pas identique et, en incluant des balises auto-référentielles, vous indiquez aux moteurs de recherche que chaque page est unique. Si vous ne souhaitez pas que ces pages soient indexées, utilisez des balises noindex.

Pointer vers la version de bureau d'une page

Si votre site mobile est situé sur un sous-domaine, la balise canonique doit pointer vers la version de bureau de la page.

Identifier une page canonique lors de l'utilisation de balises hreflang

Bien que Google ne considère pas les différentes versions du même contenu traduites dans d'autres langues comme des doublons, vous devez toujours utiliser des balises canoniques.

Indiquez aux moteurs de recherche quelle est la page canonique dans la même langue ou dans la meilleure langue de substitution. Les variantes linguistiques doivent être auto-canoniques.

Prévenir les problèmes de budget de crawl

Les URL canonisées peuvent toujours utiliser votre budget de crawl, même si les balises canoniques sont correctement implémentées.

Bien que le taux d'exploration des URL canonisées devrait diminuer avec le temps, les moteurs de recherche peuvent toujours se concentrer sur la récupération des doublons au lieu d'explorer et d'indexer de nouvelles pages.

Vérifiez les journaux de votre serveur pour voir comment Googlebot se comporte sur votre site et identifiez tout problème d'exploration potentiel.

Pour atténuer les problèmes de budget de crawl, vous devez généralement :

  • Réduire les liens internes vers des versions d'URL non canoniques,
  • Utilisez l' outil Paramètre d'URL dans Google Search Console pour indiquer à Googlebot d'explorer les versions statiques des URL.

Mais gardez à l'esprit que les problèmes de budget d'exploration se produisent sur de très grands sites - Google déclare que la plupart des sites n'auront jamais à s'en soucier.

Je vous recommande de lire l'article de Google sur les erreurs courantes lors de l'implémentation de "rel=canonical" pour savoir quelles autres choses éviter.

Comment auditer les balises canoniques

Pour que vos balises canoniques soient récupérées, vous devez vous assurer qu'une page a une balise canonique qui pointe vers la bonne page.

Vous devez également vérifier si la page est explorable et indexable - elle ne doit pas être bloquée par robots.txt ou marquée d'une balise noindex.

Vous trouverez ci-dessous quelques méthodes utiles pour auditer vos balises canoniques.

Comment utiliser Google Search Console pour analyser les balises canoniques

Google Search Console contient des outils utiles pour auditer vos pages canoniques : le rapport de couverture de l'index et l'outil d'inspection d'URL.

Le rapport Couverture de l'index

Le rapport Index Coverage de Google Search Console est une source précieuse d'informations sur votre état d'indexation - quelles URL sont indexées et lesquelles ne le sont pas, et pourquoi.

Pour analyser les canoniques de votre site, accédez à la catégorie Exclus.  

C'est là que vous pouvez trouver quelques statuts qui vous concernent :

guide-ultime-de-la-balise-canonique-pour-le-seo - 1-guide-ultime-de-la-balise-canonique-pour-le-seo
Page alternative avec la balise canonique appropriée

Les URL marquées avec ce statut indiquent les pages pour lesquelles Google respecte votre canonisation en URL.

Vous pouvez vous attendre à ce que le nombre de ces URL augmente si vous avez récemment canonisé certaines pages. Vous pouvez utiliser cette section du rapport de Google pour vérifier si Google n'explore pas les doublons plus que nécessaire.

Sinon, ces URL ne nécessitent pas votre attention.

Dupliquer, Google a choisi un canonique différent de celui de l'utilisateur

Le statut indique que Google a ignoré votre référencement canonique ou canonisation vers un autre canonique. Cela peut se produire si des signaux plus forts pointent vers d'autres URL - par exemple, il peut y avoir une augmentation des liens internes vers d'autres pages.

Ce problème peut également indiquer des problèmes de contenu. Par exemple, il est possible que la partie unique du contenu n'ait pas pu être chargée ou que vous ayez choisi la mauvaise page à canoniser, par exemple, parce qu'il n'y a pas de parité de contenu suffisante entre les pages en double et les pages canoniques.

Si vous ne pouvez pas déterminer comment résoudre ce problème, accédez directement à notre guide sur la façon de réparer le doublon, Google a choisi un problème canonique différent de celui de l'utilisateur.

URL soumise en double non sélectionnée comme canonique

Cela signifie que Google a trouvé des pages dans vos sitemaps XML qu'il considère comme des doublons. Parcourez votre sitemap et assurez-vous que toutes les URL qui s'y trouvent doivent être indexées.

Dupliquer sans canonique sélectionné par l'utilisateur

Ce sont des URL en double sans aucune URL rel=canonical spécifiée - déterminez les pages canoniques les plus appropriées pour elles et ajoutez-les.

Outil d'inspection d'URL

Vous pouvez utiliser l' outil d'inspection d'URL pour étudier plus en détail la manière dont Googlebot affiche les URL exclues de l'index.

guide-ultime-de-la-balise-canonique-pour-le-seo - 2-guide-ultime-de-la-balise-canonique-pour-le-seo

Lors de l'inspection d'une page, regardez :

  • Date de la dernière exploration – Dernière fois que Googlebot a récupéré la page. Si une balise canonique a été ajoutée récemment, il est probable que Googlebot n'ait pas exploré l'URL depuis lors.
  • Canonique déclaré par l'utilisateur - Cela devrait montrer l'URL que vous avez sélectionnée - vérifiez si c'est la bonne URL.
  • Canonique sélectionné par Google – Si Google a choisi une page canonique différente, vous pouvez voir quelle URL a été sélectionnée.

Vous pouvez également vérifier si la balise canonique a été ajoutée correctement. Cliquez sur Afficher la page explorée pour examiner le contenu rendu et recherchez la balise canonique dans la section <head>.

guide-ultime-de-la-balise-canonique-pour-le-seo - 3-guide-ultime-de-la-balise-canonique-pour-le-seo

Dans l'onglet Plus d'informations, vous pouvez vérifier l'en-tête de réponse HTTP reçu par Googlebot.

guide-ultime-de-la-balise-canonique-pour-le-seo - 4-guide-ultime-de-la-balise-canonique-pour-le-seo

Assurez-vous qu'il correspond à la configuration souhaitée, même si vous utilisez rel=canonical dans le code HTML d'une page.

Effectuer un crawl de site pour auditer les balises canoniques

Une exploration de site Web peut vous aider à découvrir des problèmes avec vos balises canoniques.

Les robots d'exploration de sites Web vous fournissent des détails sur le ratio canonique vs non canonique. Ils vous alerteront de tout canonique incorrect, tel que des pages supprimées/manquantes (HTTP 4xx), des erreurs de serveur (HTTP 5xx) ou des redirections (HTTP 3xx) dans les balises canoniques. En règle générale, vous devez rechercher tous les codes d'état autres que HTTP 200.

Suivez ce guide pour apprendre à auditer vos canoniques à l'aide de SEO Spider de Screaming Frog.

Emballer

L'implémentation de balises canoniques vous donne la possibilité d'indiquer aux moteurs de recherche quelle URL représente la meilleure version de chaque élément de contenu. Vous pouvez alors influencer les pages qui apparaissent dans les résultats de recherche - et celles qui sont traitées comme secondaires.

Les canoniques sont de simples signaux que les moteurs de recherche n'ont pas besoin de respecter. Mais, dans de nombreux cas, vous pouvez augmenter les chances que vos balises canoniques soient respectées. Comment?

Suivez les meilleures pratiques décrites - voici une liste condensée de mes recommandations :

  • Identifiez le contenu en double sur vos pages et choisissez la version de page qui doit être principale, par exemple parce qu'il s'agit de la page la plus représentative ou la plus précieuse,
  • Assurez-vous d'envoyer des signaux cohérents aux moteurs de recherche concernant vos canoniques,
  • Utiliser des balises canoniques auto-référentielles,
  • Assurez-vous que votre implémentation du fichier robots.txt, des balises noindex et du sitemap s'aligne sur votre canonisation,
  • S'assurer qu'il y a une parité de contenu suffisante entre les pages dupliquées et les pages canoniques,
  • Limitez les liens internes aux pages en double.