キーワード調査ツールのデータ ソースは何ですか?
公開: 2022-08-22お気に入りのキーワード調査ツールが、キーワードのアイデアと推定検索ボリューム数をどこから得ているのか疑問に思ったことはありませんか?
この記事では、これらのツールが使用するさまざまなデータ ソースについて説明します。
- SERPのスクレイピング
- ウェブページのスクレイピング
- Googleサーチコンソール
- Google 広告 キーワード プランナー
- クリックストリーム データ
- ソーシャル メディアとオンライン フォーラム
また、サイトの Google Search Console データへのアクセスを許可する無料のツール、プラグイン、ブラウザ拡張機能に注意する必要がある理由についても説明します。
1. SERP(検索エンジンの結果ページ)のスクレイピング
ほとんどのキーワード調査ツールは、Google の検索エンジンの結果ページ (SERP) をスクレイピングして、データベースを人気のあるキーワードで埋めます。 SERP のスクレイピングには、Google をすばやくチェックして必要な情報を取得できるボットの使用が含まれます。
これらのキーワード ツールでは、Google Search API や、ScrapingBee や Outscrapper などのサードパーティ メソッドを使用できます。
SEO ツールは、以下からキーワードのアイデアをかき集めています。
- オートコンプリート。
- 関連検索。
- 人々はまた尋ねる (PAA)。
- 人々はまた検索します (PASF)。
オートコンプリート キーワード (候補)
ユーザーが検索バーに入力を開始すると、Google はクエリの候補を表示します。
これは、Google オートコンプリートと呼ばれます。

オートコンプリートからキーワードのリストを取得する最も一般的な方法は、アルファベット スープ テクニックを使用することです。 これは、seed キーワードを使用し、アルファベットのすべての文字を検索して Google から候補を取得することに他なりません。
キーワード候補の大きなリストを作成するために、ツールは、検索意図を変更する単語を使用して、質問、前置詞、および比較もチェックします。
Google オートコンプリートをスクレイピングするツールは、多くのキーワードのアイデアを提供します。最良の部分は、Google がそれらをユーザーにプッシュしているため、検索ボリュームがある程度あるはずです.
欠点は、Google が推奨/提案するため、誰もが同じキーワードを使用できることです。 最終的にこれは、より多くの競争、より高い CPC (Cost Per Click)、およびランキングに必要なより多くの被リンクを意味します。
関連検索
SERP の一番下に、Google は現在の検索用語に「関連する検索」を表示します。
これは、結果をクリックせずにページの下部に到達したユーザーに代替検索を表示する方法です。
ただし、Google 関連検索は、オートコンプリートからの提案と一部重複しています。
このスクレイピング方法により、現在のクエリやより具体的な検索に代わる手段が得られます。
残念ながら、Google はこの機能で約 8 つのキーワードしか出力しません。 あなたが私に尋ねると、それはクエリごとの関連検索の量が少ないことです.

人々はまた尋ねる (PAA)
SERP の People Also Ask セクションには、ユーザーのクエリに関連する質問が表示されます。

誰かがこの機能を操作すると、拡張されて、PAA クエリに答える強調スニペットが表示されます。 また、クリックしたクエリに関連する他のクエリも展開して表示します。
キーワード調査ツールは、キーワードとコンテンツのアイデアの優れた情報源であるため、これらの PAA セクションをスクレイピングします。
PAA ボックスは、既存の記事にすばやく追加できるロングテール キーワードと質問を表示することで、キーワード調査プロセスとしてますます人気が高まっています。
PAA 強調スニペットの回答には 1 つのページのスニペットのみが表示されますが、PAA の提案は、ユーザーが Google に直接入力して SERP 結果を表示する、それ自体の検索クエリです。
ユーザーは次も検索します (PASF)
People Also Search For は Google の機能で、検索結果をクリックして SERP に戻った後 (ブラウザの [戻る] ボタンをクリック) にのみ表示されます。

このようにして、Google はユーザーがクリックした結果のすぐ下に代替検索を表示します。
これにより、ユーザーはさらにスクロールしなくても検索を絞り込むことができます。
SEO ツールの場合、これは Google が現在のクエリに関連していると考えるキーワードを確認する機会です。
2.クエリでランク付けされたページをスクレイピングする
一部のツールは、特定のクエリの個々のページの結果を分析し、ページがランク付けされている他のキーワードを見つけます.
これらのページのコンテンツを分析して、一般的に使用される単語やエンティティを見つけます。
これは、Google がページをクロールして分析するときに行うことを効果的にリバース エンジニアリングしようとしています。
Google の NLP (自然言語処理) は、ツールがエンティティと各キーワード間の関係を解釈するために使用するアルゴリズムの 1 つです。
一部のツールは、キーワードの頻度、類似のキーワード、上位ページ間のコンテンツの重複など、より単純な要因に焦点を当てる場合があります。
この方法には、何千ものSERPでアルゴリズムをトレーニングするという利点があり、時間の経過とともに、上位の結果で最も重要で言及されているエンティティに気付くことができます.
3. Googleサーチコンソールのデータ
Google Search Console は、ウェブサイトの所有者が自由に使用できる最も重要なデータ ソースの 1 つです。 GSC データへのアクセスを許可することは、自宅の玄関ドアに予備の鍵を渡すようなものです。

Google Search Console にアクセスできる一部のサービスは、このデータを使用して、「サービスの改善」と呼ばれるものを実行します。平易な英語で言えば、実際のデータに基づいてより正確なキーワード ボリュームを取得します。
キーワードのボリュームを改善するために、SEO ツールはアクセス権のあるサイトから GSC データにアクセスできます。 これは、無料または有料のツールで発生する可能性があります。
Google Search Console のデータでトレーニングされたツールを持つことは非常に貴重です。 それは、そのツールの開発者と顧客に競争上の優位性を与えることができます.
ツールが Google Search Console のデータを吸い上げているかどうかを確認するには、ツールの利用規約とプライバシー ポリシーを確認してください。
注: SEOTesting は、表示以外の目的で Google Search Console のデータを使用しません。 第三者に共有または販売することはありません。
無料ツールに注意
すべてのサービスには、実行と維持にコストがかかります。 しかし、一部の企業は、ユーザー データのマイニングを目的とした無料サービスを提供しています。
これは、無料のキーワード調査ツールまたは WordPress プラグインが Google Search Console にアクセスできる場合に発生する可能性があります。
例として、WordPress ダッシュボード内に Google Search Console のデータを表示する無料のプラグインがあります。
これらのツールは便利なので、ユーザーを誘惑します。 その後、データにアクセスできるようになると、それを使用、共有、または販売して、実際のデータを使用してキーワードの見積もりを作成する可能性があります。
Google Search Console へのアクセスを要求するすべてのサービスの利用規約を読んで、それらのサービスがツールを改善するためにあなたのデータを使用しているかどうかを確認してください。 特にサービスが無料の場合。
4. Google 広告キーワード プランナー (GKP)
Google 広告 Keyword Planner は、広告主が有料メディア キャンペーンを作成するためのツールです。
リリース時には、GKP は SEO がキーワードの提案、検索ボリューム、およびアイデアを得るために非常に役立ちました。
GKP は Google の公式製品であり、過去 12 か月間のキーワード ボリュームを表示しているため、信頼できる情報源と見なされています。
国ごとのキーワードのボリュームを取得することも、キーワード プランナーが人気を博した理由を説明しています。
GKP は、特に無料の SEO ツールの中で、依然として最も使用されているキーワード ソースの 1 つです。
Google 広告 Keyword Planner は無料でアクセスできますが、Google はユーザーが SEO のためにデータを使用することを望んでいません。 これが、支出の少ないアカウントの正確なキーワード ボリュームの表示を停止し、代わりに範囲の表示を開始した理由です。 Google は同義語とスペルミスのグループ化も開始しました。これにより、ボリュームに矛盾が生じることがあります。
Ahrefs は、GKP がキーワードの 91% 以上の検索ボリュームを過大評価し、45% の確率で「ほぼ正確」であることを発見した調査を依頼しました。
これは、GKP を唯一の調査ツールとして使用することは、以前ほど正確ではないことを意味します。
5. クリックストリーム データ
クリックストリームは、インターネット上でユーザーを追跡して収集された匿名化されたデータです。
これには通常、次のものが含まれます。
- 一意のデバイス ID。
- IPアドレス。
- デバイスタイプ。
- オペレーティング·システム。
- 国。
- 言語。
- タイムスタンプ。
- 参照 URL。
- ページ滞在時間。
次に、クリックストリーム データが集計され、キーワードの月間検索量を見積もるのに役立つモデルを構築するために使用されます。
本質的に、ヘッド検索語はより多くの検索を取得するため、クリック ストリーム データにより多く表示されます。 つまり、これらの人気のあるクエリの月間検索ボリュームを簡単に見積もることができます。
ロングテール キーワードは、特にクリック ストリーム データのサンプルが少ない場合はあまり表示されないため、これらのキーワードの月間検索ボリュームを見積もることははるかに困難です。
これが、クリックストリーム データに依存するツールが、人気のあるヘッド キーワードの検索ボリュームを見積もるときには非常に正確であるが、ロング テール キーワードを見積もるときにはそれほど正確ではない理由です。
クリック ストリーム データには、ユーザーがどこで検索を開始したか、何をクリックしたか、何回クリックしたか、コンバージョンに至るまでの参照も表示されます。 Google によると、ユーザー ジャーニーは「乱雑な中間」を通過し、クリック ストリーム ソースを介してデータにアクセスできるため、ツールはより多くのコンテンツを生成するタイプを提案できます。
クリックストリーム データの収集に関しては、さまざまな方法があり、いくつかの方法は他の方法よりも透過的です。
その 1 つは、ユーザーが自分を追跡するプログラムに自発的にサインアップする場合です。 これらのユーザーは、一般にパネリストとして知られています。
倫理的でない方法には、ブラウザの拡張機能や、ユーザー データを追跡する無料の VPN / ウイルス対策サービスが含まれる場合があります。
これらのツールは、ユーザーが知らないうちにユーザーのオンライン アクティビティを追跡するのに最適な位置にあります。
それらのほとんどは、訪問したすべてのサイトにアクセスできます。 つまり、ユーザーがアクセスするすべてのページについて知ることができます。 だからこそ、ブラウザ拡張機能がユーザー データを販売しているという報告があっても驚かないのです。
幸いなことに、ユーザーを追跡したいすべての拡張機能が利用規約でそれを隠しているわけではありません。 SimilarWeb のように、ユーザーが自分のデータにアクセスするには貢献者になる必要があることを明確かつ率直に述べているものもあります。
それが本来あるべき姿です: データ収集を事前に開示し、サービスの観点からそれを埋めないでください。
6. ソーシャル メディアとオンライン フォーラム
ソーシャル メディア サイトやフォーラムは、関連するキーワードの宝庫です。
これらをクロール、スクレイピング、分析することで、ユーザーが純粋に興味を持っているトピックやキーワードを見つけることができます。
概要
この記事では、キーワード調査ツールが提案と月間検索ボリュームの見積もりを取得するために使用するすべてのソースを確認しました. プレミアム ツールは、ソースを組み合わせて独自の月間検索ボリューム モデルを作成する傾向があります。
これは、ツールごとにキーワードのボリュームにこのような違いが見られる理由を説明するのに役立ちます.
