Quelles sont les sources de données pour les outils de recherche de mots clés ?

Publié: 2022-08-22

Vous êtes-vous déjà demandé d'où vos outils de recherche de mots clés préférés tirent leurs idées de mots clés et les volumes de recherche estimés ?

Dans cet article, nous vous présentons les différentes sources de données utilisées par ces outils :

  1. Gratter les SERP
  2. Gratter des pages Web
  3. Console de recherche Google
  4. Planificateur de mots clés Google Ads
  5. Données de flux de clics
  6. Réseaux sociaux et forums en ligne

Nous expliquons également pourquoi vous devez être prudent avec les outils gratuits, les plug-ins et les extensions de navigateur que vous autorisez à accéder aux données de la console de recherche Google de votre site.

1. Gratter les SERP (pages de résultats des moteurs de recherche)

La plupart des outils de recherche de mots clés récupèrent les pages de résultats des moteurs de recherche (SERP) de Google pour remplir leurs bases de données avec des mots clés populaires. Gratter le SERP implique d'utiliser des bots qui peuvent vérifier rapidement Google pour obtenir les informations souhaitées.

Ces outils de mots clés peuvent utiliser l'API de recherche Google ou des méthodes tierces telles que ScrapingBee ou Outscrapper.

Les outils de référencement récupèrent des idées de mots clés à partir de :

  • Saisie automatique.
  • Recherches associées.
  • Les gens demandent aussi (PAA).
  • Les gens recherchent également (PASF).

Mots-clés de saisie semi-automatique (suggestions)

Google affiche des requêtes suggérées lorsqu'un utilisateur commence à taper dans sa barre de recherche.

C'est ce qu'on appelle la saisie semi-automatique de Google.

Les suggestions de saisie semi-automatique de Google sont une source de mots clés populaire.

Le moyen le plus courant d'obtenir une liste de mots-clés à partir de la saisie semi-automatique consiste à utiliser la technique de la soupe à l'alphabet. Ce n'est rien de plus que d'utiliser le mot clé de départ et de parcourir toutes les lettres de l'alphabet pour obtenir des suggestions de Google.

Pour créer une grande liste d'idées de mots clés, les outils vérifient également les questions, les prépositions et les comparaisons en utilisant des mots qui modifient l'intention de recherche.

Les outils qui grattent Google Autocomplete vous donneront de nombreuses idées de mots clés, et la meilleure partie est qu'ils devraient avoir un certain volume de recherche car Google les pousse aux utilisateurs.

L'inconvénient est que tout le monde peut rechercher les mêmes mots-clés car Google les recommande/suggère. En fin de compte, cela signifie plus de concurrence, un CPC (coût par clic) plus élevé et plus de backlinks nécessaires pour se classer.

recherches associées

Tout en bas du SERP, Google affiche les "recherches liées" au(x) terme(s) de recherche actuel(s).

C'est ainsi qu'ils montrent des recherches alternatives aux utilisateurs atteignant le bas de la page sans cliquer sur aucun résultat.

Cependant, Google Related Searches a un certain chevauchement avec les suggestions de la saisie semi-automatique.

Cette méthode de scraping vous donnera une alternative à la requête actuelle et des recherches plus spécifiques.

Malheureusement, Google ne produit qu'environ huit mots-clés avec cette fonctionnalité. C'est un faible volume de recherches connexes par requête si vous me demandez.

Recherches liées à Google à la fin du SERP.

Les gens demandent aussi (PAA)

La section Les gens demandent aussi des SERP affiche les questions liées à la requête de l'utilisateur.

La zone Personnes posent également des questions affiche les questions liées à la requête.

Lorsque quelqu'un interagit avec cette fonctionnalité, elle se développe pour vous montrer un extrait de code qui répond à la requête PAA. Il développera également et affichera d'autres requêtes liées à celle sur laquelle vous avez cliqué.

Les outils de recherche de mots clés récupèrent ces sections PAA car c'est une excellente source de mots clés et d'idées de contenu.

Les boîtes PAA sont devenues de plus en plus populaires en tant que processus de recherche de mots-clés, principalement en affichant des mots-clés à longue traîne et des questions que vous pouvez rapidement ajouter à un article existant.

Alors que la réponse d'extrait de code PAA n'affichera qu'un extrait d'une seule page, une suggestion PAA est une requête de recherche en elle-même que les utilisateurs saisiront directement dans Google et verront les résultats SERP pour.

Les gens recherchent également (PASF)

People Also Search For est une fonctionnalité de Google qui ne s'affiche qu'après avoir cliqué sur un résultat et renvoyé au SERP - en cliquant sur le bouton de retour du navigateur.

La zone de recherche de personnes également s'affiche lorsqu'un utilisateur revient sur le SERP.

De cette façon, Google affiche les recherches alternatives juste en dessous du résultat sur lequel quelqu'un vient de cliquer.

Pour un utilisateur, cela offre la possibilité d'affiner la recherche sans avoir à faire défiler davantage.

Pour les outils de référencement, c'est l'occasion de voir quels mots-clés, selon Google, sont liés à la requête actuelle.

2. Gratter les pages qui se classent pour une requête

Certains outils analysent les résultats de chaque page pour une requête particulière et trouvent d'autres mots-clés pour lesquels une page se classe.

Ils analysent le contenu de ces pages pour trouver des mots et des entités couramment utilisés.

Il s'agit en fait d'essayer de désosser ce que Google fait lorsqu'il explore et analyse une page.

Le NLP (Natural Language Processing) de Google est l'un des algorithmes que les outils peuvent utiliser pour interpréter les entités et leur relation entre chaque mot-clé.

Certains outils peuvent se concentrer sur des facteurs plus simples tels que la fréquence des mots clés, des mots clés similaires et le chevauchement de contenu entre les premières pages.

Cette méthode a l'avantage de former des algorithmes avec des milliers de SERP, et signifie qu'au fil du temps, ils peuvent remarquer les entités les plus importantes et les plus mentionnées dans les meilleurs résultats.

3. Données de la console de recherche Google

Google Search Console est l'une des sources de données les plus importantes dont dispose un propriétaire de site Web. À tel point qu'autoriser l'accès aux données GSC revient à donner une clé de rechange à la porte d'entrée de votre maison !

Certains services avec accès à Google Search Console utiliseront ces données pour faire ce qu'ils appellent "améliorer le service" - en clair, obtenir des volumes de mots clés plus précis basés sur des données réelles.

Pour améliorer les volumes de mots clés, les outils de référencement peuvent accéder aux données GSC des sites auxquels ils ont accès. Cela peut arriver avec un outil gratuit ou payant.

Avoir un outil formé avec les données de Google Search Console est inestimable. Cela peut donner un avantage concurrentiel aux développeurs et aux clients dudit outil.

Pour savoir si un outil aspire les données de votre console de recherche Google, consultez leurs conditions d'utilisation et leurs politiques de confidentialité.

Note : SEOTesting n'utilise pas vos données Google Search Console à d'autres fins que de vous les afficher. Nous ne les partageons ni ne les vendons à des tiers.

Méfiez-vous des outils gratuits

Chaque service a un coût de fonctionnement et de maintenance. Mais certaines entreprises proposent des services gratuits dans le but d'extraire les données des utilisateurs.

Cela peut se produire lorsque des outils de recherche de mots clés gratuits ou des plugins WordPress ont accès à Google Search Console.

Un exemple pourrait être un plugin gratuit qui affiche les données de Google Search Console dans le tableau de bord WordPress.

Ces outils séduisent les utilisateurs car ils sont pratiques. Ensuite, lorsqu'ils ont accès aux données, ils peuvent les utiliser, les partager ou les vendre pour créer des estimations de mots clés avec des données du monde réel.

Lisez les termes et conditions de chaque service qui demande l'accès à Google Search Console pour savoir s'ils utilisent vos données pour améliorer leurs outils. Surtout quand le service est gratuit.

4. Planificateur de mots clés Google Ads (GKP)

Google Ads Keyword Planner est un outil permettant aux annonceurs de créer des campagnes médiatiques payantes.

Au moment de sa sortie, GKP était extrêmement utile pour les référenceurs pour obtenir des suggestions de mots clés, un volume de recherche et des idées.

GKP est considéré comme une source fiable car il s'agit d'un produit Google officiel, affichant les volumes de mots-clés basés sur les 12 derniers mois.

Obtenir le volume de mots clés par pays explique également pourquoi Keyword Planner est devenu si populaire.

GKP est toujours l'une des sources de mots clés les plus utilisées, en particulier parmi les outils de référencement gratuits.

Google Ads Keyword Planner est libre d'accès, mais Google ne veut pas que les gens utilisent les données pour le référencement. C'est pourquoi ils ont cessé d'afficher les volumes de mots clés exacts pour les comptes à faibles dépenses et ont commencé à afficher des plages à la place. Google a également commencé à regrouper les synonymes et les fautes d'orthographe, ce qui peut parfois entraîner des écarts dans les volumes.

Ahrefs a commandé une étude qui a révélé que GKP surestime le volume de recherche pour plus de 91 % de ses mots-clés et est « à peu près précis » 45 % du temps.

Cela signifie que l'utilisation de GKP comme seul outil de recherche n'est plus aussi précise qu'elle l'était par le passé.

5. Données de flux de clics

Le flux de clics est constitué de données anonymisées recueillies à partir du suivi des utilisateurs sur Internet.

Cela comprend généralement :

  • Identification unique de l'appareil.
  • Adresse IP.
  • Type d'appareil.
  • Système opérateur.
  • Pays.
  • Langue.
  • Horodatage.
  • URL de référence.
  • Heure sur la page.

Les données de flux de clics sont ensuite agrégées et utilisées pour construire des modèles qui aident à estimer le volume de recherche mensuel pour les mots-clés.

De par leur nature même, les termes de recherche principaux génèrent beaucoup plus de recherches et apparaissent donc davantage dans les données de flux de clics. Cela signifie qu'il est beaucoup plus facile d'estimer le volume de recherche mensuel pour ces requêtes populaires.

Les mots-clés de longue traîne apparaissent moins souvent, en particulier dans un petit échantillon de données de flux de clics, il est donc beaucoup plus difficile d'estimer le volume de recherche mensuel pour ces mots-clés.

C'est pourquoi les outils qui s'appuient sur les données de flux de clics sont très précis lors de l'estimation du volume de recherche pour les mots-clés populaires, mais moins pour l'estimation des mots-clés de longue traîne.

Les données Click Steam montreront également où les utilisateurs commencent à chercher, sur quoi ils cliquent, combien de fois et quelle est la référence avant la conversion. Selon Google, le parcours utilisateur passe par un "intermédiaire désordonné", et avoir accès aux données via des sources de flux de clics permet aux outils de suggérer le type de contenu à produire davantage.

Lorsqu'il s'agit de collecter des données de flux de clics, il existe de nombreuses façons de le faire, et certaines sont plus transparentes que d'autres.

L'un d'eux est lorsque les utilisateurs s'inscrivent volontairement à un programme qui les suivra. Ces utilisateurs sont communément appelés panélistes.

Des méthodes moins éthiques peuvent inclure des extensions de navigateur et des services VPN / antivirus gratuits pour suivre les données des utilisateurs.

Ces outils sont dans une position privilégiée pour suivre l'activité en ligne d'un utilisateur à son insu.

La plupart d'entre eux ont accès à tous les sites visités. Cela signifie qu'ils peuvent connaître chaque page visitée par un utilisateur. C'est pourquoi je ne suis pas surpris lorsqu'il y a des rapports d'extensions de navigateur vendant des données utilisateur.

Heureusement, toutes les extensions qui souhaitent suivre les utilisateurs ne le cachent pas dans leurs conditions générales. Certains, comme SimilarWeb, disent clairement et franchement qu'un utilisateur doit devenir un contributeur pour accéder à ses données.

C'est ainsi que cela devrait être : une divulgation initiale de la collecte de données et non l'enterrement en termes de service.

6. Médias sociaux et forums en ligne

Les sites de médias sociaux et les forums peuvent être une mine d'or de mots-clés pertinents.

L'exploration, le grattage et l'analyse de ceux-ci peuvent trouver des sujets et des mots-clés avec un véritable intérêt de la part des utilisateurs - car ils écrivent publiquement à ce sujet.

Sommaire

Dans cet article, nous avons passé en revue toutes les sources utilisées par les outils de recherche de mots clés pour obtenir leurs suggestions et les estimations mensuelles du volume de recherche. Les outils premium ont tendance à utiliser une combinaison de sources pour créer leurs propres modèles de volume de recherche mensuel.

Cela permet d'expliquer pourquoi vous constatez de telles différences dans le volume des mots-clés d'un outil à l'autre.