Ce que la fuite de code source Yandex a révélé sur les moteurs de recherche
Publié: 2023-02-17Vous êtes-vous déjà demandé ce qui se passe à l'intérieur des géants des moteurs de recherche comme Google, Bing et Yahoo ?
Le 27 janvier 2023, le quatrième moteur de recherche au monde, Yandex, a fait la une des journaux après une fuite de données massive (44 Go pour être exact).
«Ainsi, le moteur de recherche le plus populaire de Russie a subi une brèche. En quoi est-ce pertinent pour moi ? » tu peux demander.
Ce que de nombreuses chaînes d'information ont présenté comme un acte malveillant contre l'entreprise et la sécurité des données des clients, les experts numériques l'ont évalué comme un aperçu rare du fonctionnement des moteurs de recherche.
Et plus important encore, quel contenu privilégient-ils et pourquoi.
La fuite de données a rendu public ce que nous pensions initialement être 1 922 facteurs de classement, mais grâce à Ben Wills, le nombre a été corrigé à 17 853. Massif, non ?

Nous avons parcouru les 1 992.
Lisez la suite pour voir ce que nous avons trouvé le plus intéressant.
Puis-je utiliser les enseignements de la fuite Yandex pour me classer plus haut sur Google ?
Il va sans dire que Yandex n'est pas Google.
Mais plusieurs facteurs notables rendent cette fuite pertinente (et éducative) en dehors de la Russie et dans vos expériences de classement de recherche :
- Il y a environ 70 % de correspondance entre les résultats de recherche Yandex et Google
- Yandex utilise le PageRank (presque identique à celui de Google)
- Yandex emploie beaucoup d'anciens Googleurs, et beaucoup pensent qu'il a été conçu de la même manière
- Yandex suit les meilleures pratiques de récupération d'informations similaires à celles de Google, comme l'index inversé ou les incorporations
- Tout comme les moteurs de recherche Google et Bing, Yandex utilise la fonction de classement Okapi BM25 pour estimer la pertinence des documents par rapport à une requête de recherche donnée.

Cela étant dit, ce que révèle la fuite du code source de Yandex nous aide, pour la première fois, à mieux différencier entre supposer et savoir comment fonctionnent les classements de recherche.
À l'intérieur de la fuite de code Yandex : 11 découvertes sur le fonctionnement des moteurs de recherche
Généralement, les facteurs de classement Yandex peuvent être divisés en trois catégories :
- Des facteurs statiques tels que les backlinks entrants, les liens internes entrants, les en-têtes, le ratio d'annonces, etc. Ceux-ci sont liés à votre site Web.
- Facteurs dynamiques tels que la pertinence du texte, les inclusions de mots clés, etc. Ceux-ci concernent à la fois votre site Web et la requête de recherche.
- Facteurs liés à la recherche d'utilisateurs tels que l'emplacement de l'utilisateur, la langue de la requête, les modificateurs d'intention, etc. Ceux-ci sont directement liés à la requête de l'utilisateur.
Les principaux facteurs de pondération utilisés dans les modèles statistiques sont :

1. Publicité sur la page
La publicité sur une page est considérée comme un facteur négatif. En fait, c'est le facteur avec le poids de classement négatif le plus élevé :

Plusieurs facteurs liés à la publicité, comme le nombre d'emplacements publicitaires sur la page et si l'arrière-plan est cliquable, suggèrent que Yandex n'aime pas les pages avec un ratio élevé de publicités sur l'écran visible.
2. Facteurs au niveau de l'URL
La construction de l'URL est un autre facteur pris en compte par Yandex. Et plus précisément:
- La présence de chiffres dans l'URL.
- Le nombre de barres obliques ("/") dans l'URL
- Le nombre de majuscules dans l'URL
Pour en revenir à l'argument selon lequel Yandex n'est pas Google, et cette fuite ne sera pas utile, eh bien, ces facteurs d'URL ressemblent beaucoup à ceux des directives de structure d'URL de Google.
3. Facteurs au niveau de la page
Il y a beaucoup à dévoiler ici. Il s'avère que Yandex a de nombreux facteurs au niveau de la page qui jouent un rôle dans la construction du SERP. Certains des plus notables incluent:
- Fraîcheur de la page - en particulier pour le contenu des blogs et les sites Web d'actualités. C'est un facteur de classement négatif si une page de contenu a plus de 10 ans. Alors mettez à jour votre contenu fréquemment.
- Dernière destination - Yandex récompense les pages qui mettent fin au parcours de recherche de l'utilisateur, ce qui signifie qu'il a trouvé ce qu'il cherchait.
- Ratio de source de trafic sain - Yandex n'aime pas les pages qui obtiennent du trafic à partir d'une seule source (par exemple, la recherche organique). Pour qu'une page soit bien classée, elle doit obtenir du trafic de toutes sortes de sources - organiques, payantes, directes, etc.
- Qualité du contenu - Il est essentiel que votre texte soit original et non bourré de mots-clés. C'est une amélioration du classement si votre texte a été cité/lié dans des domaines externes. De plus, avoir un contenu de mauvaise qualité réduira le classement du contenu de bonne qualité.
4. Facteurs au niveau du site Web
S'appuyant sur le facteur de fraîcheur de la page, la combinaison ultime serait d'avoir un site Web bien établi qui est actif depuis longtemps et qui met fréquemment à jour son contenu.
En outre, Yandex juge la qualité globale d'un site Web en fonction de sa perspective de cliquabilité. En d'autres termes, à quelle fréquence les utilisateurs cliquent-ils sur l'URL de la recherche ?
Un autre facteur de classement positif est le nom de domaine. Yandex améliore le classement des domaines .COM.
5. Qualité des pages
Nous avons déjà parlé de la qualité du contenu, mais qu'en est-il de la qualité globale de la page ? Eh bien, Yandex évalue la qualité d'une page en fonction de plusieurs facteurs :

- Nombre de visites
- Nombre de visiteurs uniques
- Temps passé sur une page
- Nombre d'actions effectuées sur une page
6. Comportement et engagement des utilisateurs
Il y avait plusieurs points intéressants à retenir sur le comportement des utilisateurs de la fuite dont nous devons discuter.
Un facteur clé est le nombre de clics et d'impressions qu'un hôte reçoit globalement. Yandex prend également en compte si une page est adaptée aux mobiles et analyse le comportement des utilisateurs sur les appareils mobiles, y compris la durée de la session et le temps passé sur la page. De plus, lorsque les visiteurs reviennent sur un site Web au cours du même mois, c'est un facteur de classement positif.
Mais probablement le plus fascinant est que :
Les pages contenant des avis d'utilisateurs sont prioritaires dans les résultats de recherche.
7. Classement et emplacement de l'hôte
Yandex met beaucoup l'accent sur la priorisation du contenu géographiquement proche de l'utilisateur. Ainsi, lorsque deux noms de domaine se battent pour la même requête de recherche, celui qui est le plus proche de l'utilisateur bénéficie d'un meilleur classement.
En termes de facteurs de classement technique, la réduction du nombre d'erreurs client 400 et d'erreurs serveur 500 vous placera en tête dans le SERP. En plus de cela, Yandex accorde beaucoup d'attention à la profondeur d'exploration. C'est pourquoi assurez-vous qu'aucune page importante ne soit à plus de deux clics de votre page d'accueil.
8. Qualité des backlinks
Yandex emploie diverses mesures pour pénaliser la création de chaînes de parrainage, qui gonflent artificiellement la popularité d'un site Web.
L'une de ces mesures consiste à analyser le pourcentage de texte hyperlié, car un lien excessif peut indiquer un comportement manipulateur. Il considère également la qualité des liens pointant vers un site et pénalise les sites avec un grand nombre de liens payants ou de mauvaise qualité.
En parlant de qualité des liens, les facteurs qui contribuent directement à la qualité des liens sont le nombre de redirections et la manière dont les liens sont construits.
9. Impact sur le trafic de recherche
Semblable à Google, les sites Web qui intègrent de bonnes pratiques de référencement fonctionnent mieux que ceux qui ne le font pas. Être facilement détectable est un moyen infaillible d'obtenir un meilleur classement sur Yandex.
Sans surprise, les pages qui peuvent servir l'intention de recherche sont les leaders pour la requête de recherche respective. Les pages avec la requête de recherche exacte dans leur balise de titre et leur corps de texte ont un avantage. De plus, l'utilisation de synonymes est un autre signal positif qui peut conduire à une amélioration du classement.
10. Coup de pouce Wikipédia
Un autre signal fort pour une page de haute qualité est si elle est liée à Wikipedia. Yandex favorise les pages liées à Wikipédia et les classe plus haut.
11. Contenu vidéo
Les sites Web qui contiennent du contenu vidéo sont prioritaires. Mais il y a un hic, Yandex classe les pages plus haut avec des vidéos hébergées par Yandex (duh).
En termes d'évaluation du contenu vidéo d'une page, les mesures standard s'appliquent : le temps de visionnage moyen par rapport à la durée totale de la vidéo.
Et bien que ces 11 résultats aient fourni des informations intéressantes, il y a eu un débat dans le monde du référencement pour savoir si les données divulguées sont précieuses ou non.
Réactions aux facteurs de classement divulgués dans le monde du référencement
Du licenciement pur et simple à une analyse approfondie, les référenceurs ont exprimé des opinions mitigées sur la fuite Yandex.
Kevin Indig a résumé les objections les plus courantes et a offert une excellente contribution sur l'importance des facteurs de classement.

Extrait de l'article "Les référenceurs sous-estiment la fuite Yandex" par Kevin Indig
Des noms notables dans le domaine du référencement, tels que Ben Wills, Alex Buraks et Mic King, ont retroussé leurs manches et plongé profondément pour décoder les données divulguées.
Ben Wills est parmi les premiers experts à donner un sens au code source et à nous aider à saisir la signification de l'événement (même s'il a ouvert le fil Twitter un peu plus tard).

À peu près au même moment, Rob Ousbey a partagé une version alpha d'un outil d'exploration pour le code Yandex :

Mic King a partagé ses premières impressions en direct en parcourant le code source, nous disant : « Ne dormez pas sur ce code.

Les forums de référencement en Russie n'étaient pas moins encombrés et les webmasters avaient une idée similaire à partager avec le monde du référencement occidental. Cependant, il y avait aussi beaucoup de discussions sur Yandex favorisant ses produits et services, comme l'a couvert l'expert russe en référencement Dan Taylor.
Conclusion
La fuite du code source de Yandex changera-t-elle votre façon de faire du référencement ?
Probablement pas.
Mais ce serait une énorme erreur de l'étiqueter comme non important et de le dépasser.
Apparemment, il existe de nombreuses similitudes entre Yandex et Google. Par conséquent, cette fuite peut constituer un excellent point de départ pour d'autres expériences et vous pousser à vous concentrer encore plus sur l'expérience utilisateur et un contenu de qualité.
Alors accrochez-vous et commencez à tester.
