Mise à jour Google BERT : contexte et analyse
Publié: 2019-10-29Il s'agit du plus grand changement apporté à l'algorithme de Google depuis cinq ans, affectant une requête de recherche sur dix. Avec la mise à jour Google BERT, Google vise à améliorer l'interprétation des requêtes de recherche complexes à longue traîne et à afficher des résultats de recherche plus pertinents. En utilisant le traitement du langage naturel, Google a considérablement amélioré sa capacité à comprendre le contexte sémantique du terme de recherche.
Si vous recherchez de l'aide pour l'optimisation de votre site Web pour les moteurs de recherche, vous pouvez obtenir plus d'informations et d'analyses auprès de nos experts :
Prenez rendez-vous !
Les deux cents de Searchmetrics sur la mise à jour Google BERT
"Bert est un développement logique pour Google, suivant les traces de Panda, Hummingbird et RankBrain. Cependant, cette fois, nous ne cherchons pas à modifier la manière dont les données sont indexées ou classées. Au lieu de cela, Google essaie d'identifier le contexte d'une requête de recherche et de fournir des résultats en conséquence. Il s'agit d'un ajout intéressant à ce que les modèles sans contexte comme Word2Vec et GloVe sont en mesure d'offrir. Pour la recherche vocale et la recherche conversationnelle, je m'attends à voir des progrès significatifs dans la qualité des résultats dans un avenir proche. » – Malte Landwehr, vice-président produit, Searchmetrics
Où le BERT a-t-il été déployé ?
Alors que BERT n'utilisait initialement que les résultats de recherche organiques de Google.com, depuis décembre 2019, BERT a déployé plus de 70 langues dans le monde. Pour les Featured Snippets, qui sont affichés sur les résultats de recherche organiques en position 0 avec texte, tableau ou liste, BERT a déjà été utilisé dans les 25 langues pour lesquelles Google affiche également les Featured Snippets.
Le BERT est en cours de déploiement pour le calcul des résultats de la recherche organique en : afrikaans, albanais, amharique, arabe, arménien, azéri, basque, biélorusse, bulgare, catalan, chinois (simplifié et taïwanais), croate, tchèque, danois, néerlandais, anglais , estonien, farsi, finnois, français, galicien, géorgien, allemand, grec, gujarati, hébreu, hindi, hongrois, islandais, indonésien, italien, japonais, javanais, kannada, kazakh, khmer, coréen, kurde, kirghize, lao, letton , lituanien, malais macédonien (Brunei Darussalam et Malaisie), malayalam, maltais, marathi, mongol, népalais, norvégien, polonais, portugais, pendjabi, roumain, russe, serbe, cinghalais, slovaque, slovène, espagnol swahili, suédois, tagalog, tadjik , tamoul, télougou, thaï, turc, ukrainien, ourdou, ouzbek et vietnamien.
Dans ce tweet, Google a annoncé le déploiement mondial de BERT :
BERT, notre nouveau moyen pour la recherche Google de mieux comprendre la langue, est désormais déployé dans plus de 70 langues dans le monde. Il a été initialement lancé en octobre pour l'anglais américain. Vous pouvez en savoir plus sur BERT ci-dessous et une liste complète des langues se trouve dans ce fil…. https://t.co/NuKVdg6HYM
– Google SearchLiaison (@searchliaison) 9 décembre 2019
Pendant ce temps, l'analyste de Webmaster Trends, John Mueller, s'est exprimé dans l'un de ses hangouts Google Webmaster après qu'un utilisateur ait signalé une baisse de 40 % du trafic et soupçonné que le BERT en était la cause. Mueller a expliqué que le BERT n'était pas responsable de ces classements et de ces baisses de trafic, mais de l'une des mises à jour régulières ou d'une mise à jour de base. Selon quels critères les changements d'algorithme sont effectués, Mueller explique en détail comment fonctionne le développement chez Google à partir de 30:46 minutes dans la vidéo :
Que signifie BERT ?
L'abréviation « BERT » signifie Représentations d'encodeurs bidirectionnels à partir de transformateurs et fait référence à un modèle d'algorithme basé sur des réseaux de neurones. Avec l'aide du traitement du langage naturel (NLP), les systèmes de machines tentent d'interpréter la complexité du langage humain. Vous pouvez trouver une documentation détaillée de BERT sur le blog AI de Google.

En termes simples, Google utilise BERT pour essayer de mieux comprendre le contexte d'une requête de recherche et d'interpréter plus précisément la signification des mots individuels. Cette percée s'appuie sur des modèles mathématiques appelés transformateurs : ils analysent un mot par rapport à tous les autres mots de la phrase - ou dans le cas de la recherche Google, la requête de recherche - et ne se contentent pas d'examiner le sens des mots isolément. Ceci est particulièrement utile lors de l'interprétation de la signification des prépositions et de la position des mots individuels dans une requête de recherche.
Pourquoi la mise à jour BERT est-elle si importante pour Google ?
Selon Google, environ 15 % de toutes les requêtes de recherche sont nouvelles, ce qui signifie qu'elles sont recherchées pour la toute première fois. De plus, la formulation des requêtes de recherche se rapproche de plus en plus de la communication humaine réelle - en partie sous l'influence des avancées techniques telles que la recherche vocale. Le service de statistiques Comscore estime que la proportion de recherches vocales atteindra 50 % d'ici deux ans. Un autre facteur est la longueur croissante des requêtes de recherche – aujourd'hui, 70 % des recherches peuvent être considérées comme de longue traine. Les gens se tournent vers Google avec des questions entièrement formulées et attendent des réponses précises en une fraction de seconde - et BERT constitue désormais une partie importante de la technologie qui rend cela possible.
Google travaille depuis de nombreuses années sur des réseaux de neurones capables de répondre correctement aux nouvelles requêtes de recherche et d'améliorer l'interprétation des contenus :
- Hummingbird : En 2013, Hummingbird a été intégré à l'algorithme de Google. Cette mise à jour de l'algorithme a permis de mieux interpréter des requêtes de recherche entières, plutôt que de simplement rechercher les mots individuels dans une requête.
- RankBrain : En 2015, RankBrain est devenu une partie de l'algorithme de Google et a été déclaré être le troisième facteur de classement le plus important. Cela a permis de traiter des termes de recherche avec plusieurs significations, ou des requêtes complexes qui vont au-delà de la recherche normale à longue traîne. Avec RankBrain, il est également devenu possible de traiter les premières recherches, les expressions familières, les dialogues et les néologismes.
Quelles requêtes de recherche sont affectées par BERT ?
L'impact de BERT affecte les requêtes de recherche à longue traîne. BERT améliore l'interprétation du contexte pour les requêtes plus longues qui sont saisies (ou prononcées pour la recherche vocale) dans la barre de recherche sous forme de question ou de groupe de mots.
Sur son blog, Google a fourni quelques exemples de requêtes de recherche que BERT aide à mieux comprendre et pour lesquelles le moteur de recherche fournit désormais des résultats plus pertinents.

Dans cet exemple pour un résultat de recherche organique, selon Google, l'importance du mot "à" et sa relation avec d'autres mots étaient auparavant sous-estimées. Cependant, le mot "à" joue un rôle essentiel dans le sens de la phrase. Nous avons affaire à quelqu'un du Brésil qui souhaite voyager aux États-Unis - et non l'inverse. Le nouveau modèle BERT permet à Google de comprendre correctement cette distinction et de fournir des résultats qui correspondent à la véritable intention de recherche.
Exemple 2 : « Stationnement en côte sans bordure »

Dans cet exemple tiré du billet de blog de Google, qui traite de l'évaluation des résultats de recherche pour choisir l'extrait de code le plus pertinent, l'accent était mis trop sur le mot « freiner », ignorant l'importance du mot « non ». Cela signifiait qu'un extrait présenté était peu utile, car il répondait en fait à la question opposée à celle posée par le chercheur.
Que peuvent faire les SEO et les webmasters ?
Il n'y a pas de réponse simple à la façon de réagir au BERT. Il n'y a pas de tactique facile que vous pouvez utiliser pour améliorer soudainement le classement de votre site Web ou pour récupérer les pertes. Au lieu de cela, il est important de garder à l'esprit que vous devez écrire votre contenu et créer vos sites Web non seulement pour les algorithmes, mais pour les personnes : pour vos utilisateurs et clients potentiels qui visiteront et interagiront avec votre site Web.
