Quais são as fontes de dados para ferramentas de pesquisa de palavras-chave?
Publicados: 2022-08-22Já se perguntou de onde suas ferramentas de pesquisa de palavras-chave favoritas obtêm suas ideias de palavras-chave e números estimados de volume de pesquisa?
Neste artigo, mostramos as diferentes fontes de dados que essas ferramentas usam:
- Raspagem dos SERPs
- Raspagem de páginas da web
- Google Search Console
- Planejador de palavras-chave do Google Ads
- Dados de sequência de cliques
- Mídias sociais e fóruns on-line
Também abordamos por que você precisa ter cuidado com as ferramentas, plug-ins e extensões de navegador gratuitos que você concede acesso aos dados do Google Search Console do seu site.
1. Raspagem das SERPs (páginas de resultados do mecanismo de pesquisa)
A maioria das ferramentas de pesquisa de palavras-chave raspa as SERPs (Search Engine Results Pages) do Google para preencher seus bancos de dados com palavras-chave populares. A raspagem da SERP envolve o uso de bots que podem verificar rapidamente o Google para obter as informações desejadas.
Essas ferramentas de palavras-chave podem usar a API de pesquisa do Google ou métodos de terceiros, como ScrapingBee ou Outscrapper.
As ferramentas de SEO estão extraindo ideias de palavras-chave de:
- Autocompletar.
- Pesquisas relacionadas.
- As Pessoas Também Perguntam (PAA).
- Pessoas Também Procuram (PASF).
Palavras-chave de preenchimento automático (sugestões)
O Google mostra as consultas sugeridas quando um usuário começa a digitar na barra de pesquisa.
Isso é conhecido como Google Autocomplete.

A maneira mais comum de obter uma lista de palavras-chave do preenchimento automático é usando a técnica da sopa de letrinhas. Isso nada mais é do que usar a palavra-chave seed e percorrer todas as letras do alfabeto para obter sugestões do Google.
Para criar uma grande lista de ideias de palavras-chave, as ferramentas também verificam perguntas, preposições e comparações usando palavras que modificam a intenção de pesquisa.
Ferramentas que raspam o Google Autocomplete lhe darão muitas ideias de palavras-chave, e a melhor parte é que elas devem ter algum volume de pesquisa porque o Google as está empurrando para os usuários.
A desvantagem é que todos podem ir atrás das mesmas palavras-chave porque o Google as recomenda/sugere. Em última análise, isso significa mais concorrência, um CPC (custo por clique) mais alto e mais backlinks necessários para classificar.
pesquisas relacionadas
Na parte inferior da SERP, o Google exibe 'pesquisas relacionadas' ao(s) termo(s) de pesquisa atual.
É assim que eles mostram pesquisas alternativas para usuários que chegam ao final da página sem clicar em nenhum resultado.
No entanto, as pesquisas relacionadas do Google têm alguma sobreposição com sugestões do preenchimento automático.
Este método de raspagem lhe dará uma alternativa para a consulta atual e pesquisas mais específicas.
Infelizmente, o Google produz apenas cerca de oito palavras-chave com esse recurso. Isso é um baixo volume de pesquisas relacionadas por consulta, se você me perguntar.

As pessoas também perguntam (PAA)
A seção As pessoas também perguntam das SERPs exibe perguntas relacionadas à consulta do usuário.

Quando alguém interage com esse recurso, ele se expande para mostrar um trecho em destaque que responde à consulta do PAA. Ele também expandirá e mostrará outras consultas relacionadas àquela em que você clicou.
As ferramentas de pesquisa de palavras-chave raspam essas seções do PAA, pois são uma ótima fonte de palavras-chave e ideias de conteúdo.
As caixas PAA tornaram-se cada vez mais populares como um processo de pesquisa de palavras-chave, principalmente mostrando palavras-chave de cauda longa e perguntas que você pode adicionar rapidamente a um artigo existente.
Enquanto a resposta do snippet em destaque do PAA exibirá apenas um snippet de uma única página, uma sugestão do PAA é uma consulta de pesquisa em si mesma, na qual os usuários digitarão diretamente no Google e verão os resultados da SERP.
As pessoas também procuram (PASF)
People Also Search For é um recurso do Google que só aparece depois que você clica em um resultado e retorna à SERP - clicando no botão Voltar no navegador.

Dessa forma, o Google mostra pesquisas alternativas logo abaixo do resultado que alguém acabou de clicar.
Para um usuário, isso oferece a opção de refinar a pesquisa sem precisar rolar mais.
Para ferramentas de SEO, esta é uma oportunidade de ver quais palavras-chave o Google acha que estão relacionadas à consulta atual.
2. Raspagem das páginas classificadas para uma consulta
Algumas ferramentas analisam os resultados de páginas individuais para uma consulta específica e encontram outras palavras-chave para as classificações de uma página.
Eles analisam o conteúdo dessas páginas para encontrar palavras e entidades comumente usadas.
Isso está efetivamente tentando fazer engenharia reversa do que o Google faz quando rastreia e analisa uma página.
O NLP (Natural Language Processing) do Google é um dos algoritmos que as ferramentas podem usar para interpretar as entidades e seu relacionamento entre cada palavra-chave.
Algumas ferramentas podem se concentrar em fatores mais simples, como frequência de palavras-chave, palavras-chave semelhantes e sobreposição de conteúdo entre as páginas principais.
Esse método tem a vantagem de treinar algoritmos com milhares de SERPs, e significa que ao longo do tempo eles podem perceber as entidades mais importantes e mencionadas nos principais resultados.
3. Dados do Google Search Console
O Google Search Console é uma das fontes de dados mais importantes que um proprietário de site tem à sua disposição. Tanto que conceder acesso aos dados do GSC é como dar uma chave reserva da porta da frente da sua casa!

Alguns serviços com acesso ao Google Search Console usarão esses dados para fazer o que chamam de "melhorar o serviço" - em inglês simples, obtendo volumes de palavras-chave mais precisos com base em dados reais.
Para melhorar os volumes de palavras-chave, as ferramentas de SEO podem acessar os dados do GSC de sites aos quais elas têm acesso. Isso pode acontecer com uma ferramenta gratuita ou paga.
Ter uma ferramenta treinada com dados do Google Search Console é inestimável. Pode dar uma vantagem competitiva aos desenvolvedores e clientes dessa ferramenta.
Para saber se uma ferramenta suga seus dados do Google Search Console, verifique seus termos de serviço e políticas de privacidade.
Nota : SEOTesting não usa seus dados do Google Search Console para nenhum outro propósito além de exibi-los para você. Nós não compartilhamos ou vendemos para terceiros.
Desconfie de ferramentas gratuitas
Cada serviço tem um custo para executar e manter. Mas algumas empresas têm serviços gratuitos com o objetivo de minerar dados do usuário.
Isso pode acontecer quando ferramentas gratuitas de pesquisa de palavras-chave ou plugins do WordPress têm acesso ao Google Search Console.
Um exemplo pode ser um plugin gratuito que exibe dados do Google Search Console dentro do painel do WordPress.
Essas ferramentas tentam os usuários porque são convenientes. Então, quando tiverem acesso aos dados, poderão usá-los, compartilhá-los ou vendê-los para criar estimativas de palavras-chave com dados do mundo real.
Leia os termos e condições de todos os serviços que solicitam acesso ao Google Search Console para saber se eles usam seus dados para melhorar suas ferramentas. Principalmente quando o serviço é gratuito.
4. Planejador de palavras-chave do Google Ads (GKP)
O Planejador de palavras-chave do Google Ads é uma ferramenta para os anunciantes criarem campanhas de mídia paga.
No momento do lançamento, o GKP era extremamente útil para os SEOs obterem sugestões de palavras-chave, volume de pesquisa e ideias.
O GKP é visto como uma fonte confiável porque é um produto oficial do Google, mostrando volumes de palavras-chave com base nos últimos 12 meses.
Obter o volume de palavras-chave por país também explica por que o Planejador de palavras-chave se tornou tão popular.
O GKP ainda é uma das fontes de palavras-chave mais usadas, especialmente entre as ferramentas gratuitas de SEO.
O Google Ads Keyword Planner é de acesso gratuito, mas o Google não quer que as pessoas usem os dados para SEO. É por isso que eles pararam de mostrar volumes exatos de palavras-chave para contas de baixo gasto e começaram a mostrar intervalos. O Google também começou a agrupar sinônimos e erros ortográficos, que às vezes podem causar discrepâncias nos volumes.
A Ahrefs encomendou um estudo que descobriu que o GKP superestima o volume de pesquisa para mais de 91% de suas palavras-chave e é "aproximadamente preciso" 45% das vezes.
Isso significa que usar o GKP como sua única ferramenta de pesquisa não é tão preciso quanto era no passado.
5. Dados de sequência de cliques
Clickstream são dados anônimos coletados do rastreamento dos usuários pela Internet.
Isso geralmente inclui:
- Identificação única do dispositivo.
- Endereço de IP.
- Tipo de dispositivo.
- Sistema operacional.
- País.
- Linguagem.
- Carimbo de data e hora.
- URL de referência.
- Tempo na página.
Os dados do fluxo de cliques são então agregados e usados para construir modelos que ajudam a estimar o volume de pesquisa mensal de palavras-chave.
Por sua própria natureza, os termos de pesquisa principal obtêm muito mais pesquisas e, portanto, aparecem mais nos dados do fluxo de cliques. Isso significa que é muito mais fácil estimar o volume de pesquisa mensal para essas consultas populares.
As palavras-chave de cauda longa aparecem com menos frequência, especialmente em uma amostra menor de dados de fluxo de cliques, por isso é muito mais difícil estimar o volume de pesquisa mensal para essas palavras-chave.
É por isso que as ferramentas que dependem de dados de fluxo de cliques são muito precisas ao estimar o volume de pesquisa para palavras-chave de termo principal populares, mas menos ao estimar palavras-chave de cauda longa.
Os dados de cliques do Steam também mostrarão onde os usuários começam a pesquisar, o que eles clicam, quantas vezes e qual é a referência antes de converter. Segundo o Google, a jornada do usuário passa por um “meio confuso” e ter acesso aos dados por meio de fontes de fluxo de cliques permite que as ferramentas sugiram o tipo de conteúdo a ser produzido.
Quando se trata de coletar dados de fluxo de cliques, há muitas maneiras de fazer isso, e algumas são mais transparentes do que outras.
Uma delas é quando os usuários se inscrevem voluntariamente em um programa que os rastreia. Esses usuários são comumente conhecidos como painelistas.
Métodos menos éticos podem incluir extensões de navegador e serviços VPN/antivírus gratuitos que rastreiam dados do usuário.
Essas ferramentas estão em uma posição privilegiada para rastrear a atividade online de um usuário sem que ele saiba.
A maioria deles tem acesso a todos os sites visitados. O que significa que eles podem saber sobre todas as páginas que um usuário visita. É por isso que não fico surpreso quando há relatos de extensões de navegador vendendo dados de usuários.
Felizmente, nem todas as extensões que desejam rastrear usuários o ocultam em seus termos e condições. Alguns, como SimilarWeb, dizem de forma clara e direta que um usuário precisa se tornar um colaborador para acessar seus dados.
É assim que deve ser: divulgação antecipada da coleta de dados e não enterrá-la em termos de serviço.
6. Mídias Sociais e Fóruns Online
Sites de mídia social e fóruns podem ser uma mina de ouro de palavras-chave relevantes.
Rastreando, raspando e analisando isso pode encontrar tópicos e palavras-chave com interesse genuíno dos usuários, pois eles estão escrevendo sobre isso publicamente.
Resumo
Neste artigo, analisamos todas as fontes que as ferramentas de pesquisa de palavras-chave usam para obter suas sugestões e estimativas mensais de volume de pesquisa. As ferramentas premium tendem a usar uma combinação de fontes para criar seus próprios modelos mensais de volume de pesquisa.
Isso ajuda a explicar por que você vê essas diferenças no volume de palavras-chave de uma ferramenta para outra.
