Que sont les pages orphelines et comment les réparer
Publié: 2022-06-14Les pages orphelines sont des pages au sein d'un domaine sans aucun lien interne pointant vers elles.
Avoir des pages orphelines sur votre site a des conséquences négatives :
- Les pages avec un potentiel de classement qui ne sont pas liées à partir de la structure de votre site ont peu de chances d'être découvertes et indexées et ne fourniront pas les avantages attendus (c'est-à-dire le trafic organique) pour votre site,
- Les pages orphelines de mauvaise qualité peuvent être explorées et indexées en raison d'autres signaux SEO, comme les backlinks (liens provenant d'autres sites Web). Ce serait un gaspillage du budget d'exploration de votre site qui peut avoir un impact sur l'indexation d'autres pages plus précieuses de votre site Web.
Les pages orphelines sont omniprésentes et leur résolution n'est pas simple - elles peuvent apparaître pour de nombreuses raisons. Vous pouvez simplement oublier d'ajouter des liens internes à certaines pages, alors que dans d'autres situations, vous pouvez créer exprès des pages orphelines. Selon le rôle que joue une page orpheline sur votre site, elle nécessitera un traitement différent.
Dans cet article, je vais vous expliquer comment différents types de pages orphelines impactent votre référencement, comment vous pouvez découvrir des pages orphelines sur votre site et que faire pour y remédier.
Comment les pages orphelines impactent-elles le SEO ?
Les pages orphelines n'ont pas de liens internes pointant vers elles, ce qui les rend problématiques pour les robots et les utilisateurs des moteurs de recherche. Ils ne seront pas trouvés en naviguant sur votre site Web ; s'ils se trouvent d'autres manières, il peut être difficile de comprendre comment ils se rapportent au reste de votre domaine. Cela est particulièrement vrai pour les moteurs de recherche.
Comment les pages orphelines affectent-elles les moteurs de recherche ?
Le manque de liens internes influence négativement la façon dont les robots des moteurs de recherche découvrent le contenu de votre site Web.

Les moteurs de recherche trouvent de nouvelles pages soit en :
- Suivre des liens internes ou externes vers des URL sur votre site Web, ou
- Examen de vos fichiers de plan de site XML .
Des pages orphelines peuvent être incluses dans le plan du site ou contenir des liens provenant d'autres domaines . Elles seront toujours considérées comme des pages orphelines, mais leurs chances d'être explorées et indexées augmentent - ce qui n'est pas nécessairement bon.
Alors que Google peut indexer une URL trouvée dans un sitemap sans aucun lien entrant, il aura du mal à placer une telle URL dans la hiérarchie du site et peut ne pas la considérer comme suffisamment précieuse en raison du manque de liens. L'indexation des pages orphelines dans les sitemaps dépend de nombreux facteurs, tels que la taille du site Web (avec les sites Web plus volumineux, Google laisse généralement de nombreuses pages non explorées et non indexées, et les pages orphelines ont probablement très peu de priorité).
Par conséquent, les pages orphelines ne sont généralement pas indexées et ne sont pas classées sur Google , ce qui ne génère aucun trafic organique vers votre site Web.
Si une page orpheline est indexée en raison d'autres facteurs, les complications ne s'arrêtent pas là. Sans liens internes, le PageRank ne pourra pas être transmis à la page orpheline . Cela signifie que toute autorité de lien que d'autres pages du domaine obtiennent en ayant des backlinks pertinents de haute qualité ne sera pas transférée vers les pages orphelines.
De plus, sans liens internes, les moteurs de recherche n'ont aucun contexte sémantique ou structurel pour évaluer la page . Les moteurs de recherche peuvent avoir du mal à déterminer pour quelles requêtes la page est pertinente sans savoir où elle se situe dans la structure globale de votre site.
Si vous avez des pages orphelines de mauvaise qualité et que leur exploration n'est pas limitée dans les fichiers robots.txt ou que leur indexation n'est pas bloquée via une balise noindex , les moteurs de recherche peuvent gaspiller leur budget d'exploration en les explorant. Cela est particulièrement préjudiciable si vous avez un grand site Web qui peut souffrir de problèmes de budget de crawl.
Dans de rares cas, les pages orphelines de mauvaise qualité peuvent également entraîner un gonflement de l'index , qui se produit lorsqu'un moteur de recherche indexe les pages d'un domaine de manière incontrôlée, indexant tout contenu qu'il peut trouver, y compris le contenu léger ou dupliqué.
Et, pour aggraver les choses, si les moteurs de recherche déterminent que la page n'a pas assez de valeur pour être indexée, mais que vous la rendez indexable, cela peut les empêcher d'indexer d'autres pages de votre site . En effet, ces pages de mauvaise qualité peuvent avoir une influence négative sur l'idée générale de la qualité de votre site Web.
N'oubliez pas que si une page a ne serait-ce qu'un seul lien interne, elle n'est plus considérée comme une page orpheline. Mais, si une page n'a qu'un seul lien et qu'il est essentiel pour votre site Web, envisagez de créer plus de liens pour renforcer sa position dans la hiérarchie du site. De cette façon, vous pouvez également empêcher la page d'être accidentellement orpheline si le seul lien est supprimé.
Comment les pages orphelines affectent-elles les utilisateurs ?
Les pages orphelines sont également problématiques pour les utilisateurs.
Si vos pages orphelines contiennent du contenu de haute qualité qui devrait générer un trafic important vers votre site Web et entraîner des conversions, les utilisateurs auront du mal à les trouver s'ils ne sont pas inclus dans la structure de votre site. Cela entraîne également une perte de temps et de ressources dédiées à la création du contenu de ces pages.
C'est différent si vos pages orphelines n'étaient délibérément pas liées mais restaient trouvables pour les utilisateurs. Les visiteurs qui arrivent sur ces pages peuvent rencontrer du contenu obsolète ou non pertinent, ce qui entraîne une mauvaise expérience utilisateur.
Types de pages orphelines
Les causes courantes des pages orphelines incluent :
- Une migration de site, par exemple lorsque certaines des anciennes pages ne sont pas incluses dans la nouvelle navigation principale et ne sont pas redirigées vers la nouvelle page cible ,
- Architecture de site non optimisée , où certaines pages ne sont pas liées car il n'y a pas de stratégie d'architecture de site. Il pourrait également y avoir des mécanismes sur le site qui n'incluent pas automatiquement les nouveaux types de pages dans la navigation,
- Un CMS créant des URL supplémentaires dont vous n'avez pas connaissance,
- Les pages deviennent obsolètes ou non pertinentes, où les liens vers celles-ci sont supprimés mais les pages restent publiées - cela peut se produire avec des produits en rupture de stock,
- Ne pas ajouter volontairement de liens vers certaines pages - par exemple, des pages de destination pour des campagnes promotionnelles ou payantes.
Beaucoup d'entre eux se produisent en raison d'un manque de processus cohérents et universels pour effectuer des migrations de sites, déplacer des sites d'un environnement intermédiaire à un environnement de production, apporter des modifications importantes au site, etc.
Parce qu'il peut y avoir tellement de raisons différentes pour l'existence de pages orphelines , les traiter ne consiste pas seulement à ajouter des liens vers ces pages.
Toutes les pages ne doivent pas avoir de liens pointant vers elles . L'ajout de liens signifie que vous souhaitez activement que les moteurs de recherche et les utilisateurs consultent ces pages.
Les garder hors de la structure de votre site est l'un des signaux indiquant aux moteurs de recherche qu'ils ne sont pas utiles pour vous. Ceci, combiné à d'autres aspects, tels que restreindre leur exploration dans robots.txt ou les rendre non indexables avec une balise noindex, les gardera hors de l'index de Google.
Comment trouver des pages orphelines
La première étape avant de réparer quoi que ce soit est de trouver vos pages orphelines. Habituellement, un excellent moyen de trouver toutes les pages de votre site Web consiste à utiliser un crawler SEO, mais dans ce cas, les crawlers ne suffiront probablement pas. C'est le problème avec les pages orphelines - les robots d'exploration ne les trouveront pas en suivant les liens sur votre site.

Les sources de données que vous pouvez utiliser pour trouver des pages orphelines sur votre site sont :
- Vos plans de site ou autres listes d'URL que vous pourriez avoir.
- Bases de données de liens (comme Ahrefs.com) qui trouvent des liens vers vos pages sur d'autres sites Web.
- Services d'analyse Web, tels que Google Analytics.
- Analyse de recherche comme Google Search Console.
- Les fichiers journaux de votre serveur.
Certains outils combinent ces sources de données. Par exemple, l'audit de site d'Ahrefs vous montre une section dans Page Explorer avec des pages orphelines trouvées via des backlinks et des sitemaps. La limitation est qu'Ahrefs n'affichera pas les pages orphelines qui ne figurent pas dans les sitemaps ou qui n'ont pas de backlinks.
De même, vous pouvez trouver des pages orphelines en utilisant plusieurs sources de données avec l'audit de site de SEMrush . Il vous donne deux options :
- Affichez les pages trouvées dans vos sitemaps sans aucun lien interne.
- Affichez les pages avec des visites récentes dans Google Analytics qui n'ont pas de liens internes.
Screaming Frog a un guide soigné sur la découverte de pages orphelines à l'aide de son SEO Spider . Leur processus s'articule autour de l'analyse de vos sitemaps XML pour les pages explorables et de l'utilisation des intégrations avec Google Analytics et Google Search Console pour fournir les données pour l'exploration .
Vous pourrez afficher les URL orphelines pour chacune des trois sources de données : plans de site, Google Analytics et Google Search Console. Vous pouvez ensuite utiliser le rapport Pages orphelines pour exporter une liste de toutes les pages orphelines trouvées.
Vous pouvez également consulter Sitebulb, qui, de la même manière, offre une option pour connecter plusieurs sources de données, y compris Google Analytics et Google Search Console – consultez le guide de Sitebulb pour trouver des pages orphelines .
Pour accéder à des données plus complètes sur votre site, vous devez approfondir sa structure. La solution la plus courante consisterait à croiser les ensembles de données par vous-même.
Obtenir une liste des pages explorables
Vous pouvez récupérer une liste de pages à partir de votre fichier de sitemap XML puisqu'il ne doit contenir que vos URL explorables et indexables. La meilleure approche consiste à utiliser un crawler.
Quel que soit le robot d'exploration que vous utilisez , il doit être configuré uniquement pour explorer les pages indexables . Il devrait ignorer les pages d'exploration qui sont :
- Bloqué de l'indexation à l'aide de la balise noindex,
- Non explorable en raison des directives robots.txt.
N'oubliez pas de n'explorer que les URL canoniques, y compris le protocole correct (HTTP ou HTTPS) et le sous-domaine (www ou non-www).
Découvrez quelles pages sont consultées
Une fois que vous avez une liste de vos pages explorables, vous devez trouver les pages qui sont visitées par les utilisateurs ou les robots d'exploration.
Obtenir des données de Google Analytics
Google Analytics peut vous aider à trouver des pages auxquelles les utilisateurs ou les robots accèdent en suivant des liens externes (y compris les réseaux sociaux) ou en saisissant directement l'adresse.
Dans Google Analytics, accédez à Comportement > Contenu du site > Toutes les pages.
Vous verrez alors toutes les URL qui ont été visitées auparavant. Ajustez les dates pour remonter le plus loin possible. Ensuite, exportez la liste reçue.
Obtenir des données de Google Search Console
Vous pouvez également trouver des données utiles dans Google Search Console, et il est bon de les combiner avec les données trouvées dans Google Analytics. Google Search Console peut contenir des données sur les URL auxquelles le robot d'exploration de Google a accédé par des moyens autres que vos liens internes.
Dans GSC, sélectionnez Performances > Pages.
Assurez-vous que les impressions sont incluses dans les données présentées. Modifiez la plage de dates pour remonter le plus loin possible dans le temps, ce qui vous montrera toutes les URL qui ont reçu des impressions au cours de la période sélectionnée.
Utiliser les fichiers journaux du serveur
Alternativement, au lieu de Google Analytics et de Google Search Console, vous pouvez acquérir les données les plus complètes à partir des fichiers journaux de votre serveur . Les fichiers journaux contiennent des informations sur les personnes qui ont visité votre site, y compris les robots d'exploration et les utilisateurs des moteurs de recherche, ainsi que les pages qu'ils ont visitées. Pour l'utiliser, vous aurez besoin d'accéder au serveur - consultez vos développeurs pour savoir si c'est possible.
Croiser les données
Vous devez rechercher les pages trouvées dans l'ensemble de données Google Analytics et Google Search Console ou les fichiers journaux qui manquent dans la liste exportée des pages connues, car ce seront vos pages orphelines.
Vous pouvez comparer les ensembles de données dans Google Sheets, Excel ou tout autre outil.
Une fois que vous avez identifié toutes vos pages orphelines, exportez-les dans un fichier ou une feuille de calcul séparé pour la prochaine partie de l'optimisation.
Comment analyser les pages orphelines
Une fois que vous avez une liste de pages orphelines sur votre site web, vous devez regarder les pages découvertes et vous poser quelques questions qui vous aideront à déterminer quoi en faire :
- Cette page est-elle précieuse pour votre site ? A-t-il un objectif important lié à la génération de trafic ou de conversions ?
- Cette page est-elle classée pour des mots-clés, bien qu'elle soit une page orpheline ?
- Où la page doit-elle exister dans la taxonomie de votre site ?
- Cette page est-elle un doublon ou presque ? Pouvez-vous déplacer le contenu vers une autre page connexe qui n'est pas devenue orpheline ?
- Cette page est-elle optimisée ? Devriez-vous l'améliorer d'une manière ou d'une autre ?
- La page a-t-elle beaucoup de backlinks de qualité ?
En dehors de cela, il est bon de se demander pourquoi les pages sont devenues orphelines en premier lieu . Cela vous aidera à être conscient de ces problèmes à l'avenir et éventuellement à les éviter.
Optimiser les pages orphelines
Une fois que vous avez compris à quoi sert la page orpheline et comment elle contribue à la conduite de votre site Web et à vos objectifs marketing, vous pouvez déterminer quelle étape, le cas échéant, prendre avec la page.
Lien vers la page depuis d'autres pages internes
Lorsque vous souhaitez qu'une page orpheline soit trouvée et visitée parce qu'elle est impérative pour les visiteurs du site, vous devez ajouter des liens internes vers celle-ci à partir d'autres pages de votre site Web . De cette façon, vous créez une opportunité pour que la page soit trouvée par les robots de recherche et les utilisateurs.
Vous devez réfléchir à l'endroit le plus approprié pour y accéder - vous voudrez peut-être considérer ce qui suit :
- Devriez-vous y ajouter des liens à partir d'autres articles thématiquement liés ?
- Vous avez besoin de restructurer l'architecture de votre site pour faire de la place à cette page ?
- Devriez-vous réécrire une partie de votre contenu pour que les liens correspondent mieux ?
- Devrait-il y avoir un lien vers celui-ci dans la navigation principale ou le pied de page ?
- Quel texte d'ancrage choisir pour donner du contexte aux moteurs de recherche et aux utilisateurs qui le visitent ?
Si vous ne savez pas comment les aborder, nous avons ce qu'il vous faut avec notre article sur les liens internes .
Rediriger la page
Une autre méthode consiste à configurer une redirection d'URL vers un nouvel emplacement - idéalement, une page équivalente pertinente qui sera toujours utile aux visiteurs et complétera leur parcours d'utilisateur sans interruption.
Si vous redirigez la page de façon permanente, utilisez une redirection 301 pour conserver autant de PageRank que possible et indiquer correctement le passage aux moteurs de recherche.
Supprimer la page
Si vous avez trouvé une page orpheline qui n'a pas de valeur et n'est pas nécessaire pour votre site, et qu'il est impossible de la rediriger, vous pouvez la supprimer .
L'approche la plus typique consiste à changer son code d'état en 404.
Laisser la page telle quelle
Gardez la page sans lien si elle répond à un besoin commercial qui ne nécessite pas de lien interne vers la page.
Cela peut être le cas si, par exemple, vous avez une page de destination pour une campagne que vous ne souhaitez montrer aux utilisateurs qu'à certains moments.
Rechercher régulièrement de nouvelles pages orphelines
En fonction de la taille de votre site, vous devez mettre en place un processus de surveillance pour détecter les futures pages orphelines avant qu'elles n'aient une chance d'avoir un impact sur votre référencement.
Par exemple, vous pouvez configurer une exploration récurrente pour rechercher des pages orphelines à l'avenir .
La meilleure façon d'empêcher l'apparition de pages orphelines à l'avenir est d' identifier ce qui les cause et de résoudre le problème à la base . Par exemple, si vous identifiez un mécanisme sur votre site qui génère des URL inutiles sans liens, corrigez-le maintenant pour éviter que davantage de pages orphelines n'apparaissent au fil du temps.
Chaque fois que vous publiez une nouvelle page, assurez-vous que les liens y pointent à moins que vous ne vouliez consciemment pas que la page soit liée. Si possible, implémentez des solutions qui génèrent automatiquement des liens internes, telles que des pages de catégories et des éléments associés.
Emballer
L'optimisation des pages orphelines sur votre site Web peut vous aider à :
- Ajoutez du contexte à celles-ci et à d'autres pages de la structure de votre site,
- Rendre les pages explorables et indexables, en leur donnant une plus grande chance de se classer pour les mots-clés appropriés,
- Transférez le PageRank entre plusieurs pages de votre site Web.
Gardez à l'esprit que de petites quantités de pages orphelines sont standard pour n'importe quel site et ne doivent pas être traitées comme un gros problème.
Le problème devient plus grave à mesure que vous obtenez plus de pages orphelines, ce qui peut vous faire manquer des classements, du trafic et des conversions potentiels, ce qui entrave vos revenus et votre réussite commerciale.
Donnez la priorité à un processus régulier pour détecter les pages orphelines indésirables et traitez-les immédiatement.
