人々はまた検索しますか、それとも常に検索しますか? Google がトレーニング済み生成モデルを使用して PASF、PAA などの検索機能のクエリ バリアントを生成する方法 [特許]

公開: 2023-06-27
Eメール
Google は生成モデルを使用して、ユーザーが検索したり質問したりするクエリのバリアントを生成しています

先日、Google の特許をいくつかチェックしていたところ、2023 年 5 月 30 日に付与され公開された興味深い特許を見つけました。そのタイトルは「トレーニングされた生成モデルを使用したクエリ バリアントの生成」であり、間違いなく私の好奇心をそそられました。 もともと2018年に申請されていたが、5月下旬に認められた。 そして、私は People also Ask (PAA) や People Both Search For (PASF) などの重要な SERP 機能に常に興味があるので、詳しく調べる必要がありました。

また、これは私が過去に優秀なビル・スロウスキー氏に問い詰めていたであろうことだ。 残念ながら、ビルはもう私たちと一緒にいません。 特許について調べてみると、ビルの特許に関する投稿や、彼の分析についての質問を DM で送ることができたことがどれほど懐かしいかに気づきました。 ビルを失うことは間違いなく私たちの業界にとって大きな損失でした。 とにかく、ビルがいつものように掘り下げてくれないので、私は自分自身を掘り下げることにしました。 そして、そうしてよかったと思います。 とても面白かったです。

SERP機能にニューラルネットワークを使用した生成モデルの活用
以下では、この特許で、トレーニングされた生成モデルを使用して、「People Both Search For」や「People Both Ask」などの SERP 機能のクエリバリアントを生成する方法について説明します。 特許には「People also Search For」と記載されていますが、このプロセスが PAA にも使用できると考えるのは無理もありません。 それについては、以下の分析で説明します。

Google がこの分野で (少なくとも特許に基づいて) 取り組んでいることについて詳しく知るのは興味深いことでした。 他の特許と同様に、Google がこれをまだ実装しているかどうか、または今後実装するかどうかはわかりませんが、私が読んだ内容に基づいてそれは確かに理にかなっていました。

さらに、これは興味深いと思いましたが、この特許では、Google が新しいクエリ (真新しい) や、まだ利用可能なデータがあまりないロングテール クエリのクエリ バリアントをどのように生成できるかについても説明されています。 また、全クエリのうち 15% は Google がこれまで見たことがないものであるため、クエリ バリアントを生成するようなアプローチを使用することは理にかなっています。 これについては後ほど詳しく説明します。

特許の重要なポイント:
この特許をカバーする最善の方法は、いくつかの要点を箇条書きにすることだと思います。 以下では、この特許の重要なポイントをいくつか取り上げますので、興味を持っていただければ幸いです。

トレーニングされた生成モデルを使用したクエリ バリアントの生成
米国 11663201 B2
付与日: 2023 年 5 月 30 日
提出日: 2018 年 4 月 27 日
譲受人名: Google LLC

生成モデルを使用して PASF および PAA のクエリ バリアントを生成することに関する Google 特許の図

1. 元のクエリと追加の入力特徴からのトークンに基づいてトレーニングされた生成モデルを利用して、クエリ バリアントを実行時に生成できます。 追加の入力機能については、すぐに詳しく説明します。

2. モデルがそのクエリでトレーニングされていない場合でも、システムはクエリ バリアントを生成できます。 そのため、新しいクエリ (まったく新しいクエリ) や、データがまだ多くない Google の言うところの「テール」クエリのバリアントを生成できます。 特に Google はクエリの 15% がこれまでに見たことがないと述べているので、これは非常に興味深いと思いました。 したがって、生成モデルは、ニューラル ネットワーク (メモリ層を含む) を使用して、しきい値の低いクエリであっても、どのクエリ バリアントを生成するかを予測できます。

新しいクエリとロングテール クエリに機能する Google の生成モデル。

3. 生成モデルは、ユーザーによる以前のクエリの送信に基づいてトレーニングできます。 しかし、この特許では、クエリ バリアントのトレーニング データは、同じドキュメントをクリックしたクエリ ペアに基づくこともできるとも説明しています。 これは当然のことであり、ユーザー エンゲージメントがモデルによって生成される内容にどのように影響するかを示しています。

Google の生成モデルは、同じドキュメントをクリックしたクエリのペアでトレーニングされました。

4. この特許では、モデルをマルチタスク モデルとしてトレーニングして、複数の種類のクエリ バリアントを生成できることも説明されています。 したがって、これは、フォローアップ クエリ、一般化クエリ、正規化クエリ、言語翻訳クエリ、含意クエリなどを含む、さまざまなタイプのクエリ バリアントを生成できる洗練されたシステムです。

Google の生成モデルは、複数の種類のクエリ バリアントを生成するマルチタスク モデルとしてトレーニングできます。

5. クエリ バリアントが生成された後、モデルによってスコア付けされます。 システムは各バリアントの応答スコアを提供します。 そして、システムは、それらのクエリ バリアントに対する回答をチェックすることで、それらのバリアントを採点できます。 これは、システムが「偽の可能性のある」クエリのバリアントを検出するのに役立ちます。 とても興味深い…

Google の生成モデルはクエリのバリエーションをスコアリングして品質を判断します。

6. この特許では、システムが単なるクエリの変形に加えて回答を返すこともできると説明されています。 たとえば、システムは検索結果 (PAA は誰ですか?)、ナレッジ グラフ エンティティ、ヌル応答 (回答なし)、または説明を求めるプロンプト (ユーザー インターフェイスの入力を明確にする) を返すことができます。 それは、ユーザーが何を求めているのかを理解しようとする際に、Googleがユーザーからの助けを求めているときに目にする曖昧さ回避チップの形になる可能性があります。 またまた興味深い。

Google の特許では、システムがクエリのバリエーションだけでなく回答も返すことができると説明されています。

7. この特許では、モデルがクエリからトークンだけでなく、「追加の入力機能」も含めて取得できると説明しています。 これらの入力特徴には、場所、ユーザーが興味があるまたは実行しているタスク (料理、車の修理、旅行の計画など) が含まれる場合があります。 天候なども考慮に入れることができます。 また、タスクは、ユーザーの保存されたカレンダー エントリ、チャット メッセージやその他の通信、ユーザーが送信した過去のクエリなどに基づいている可能性があります。そのため、クエリのバリエーションはパーソナライゼーションまたは現在のコンテキストに基づいている可能性があります。

Google の特許では、このモデルがクエリからトークンだけでなく、「追加の入力機能」も取得できると説明されています。

8. モデルは、クエリや広告その他のコンテンツのバリアントを生成することもできます。 したがって、モデルはクエリ バリアントを生成できるだけでなく、SERP に表示できる広告やその他のコンテンツを生成 (または取得) することもできます。 そのセクションをもう一度見直さなければならないと思いますが、それは興味深いものでした…:)

Google の生成モデルは、クエリや広告、その他のコンテンツのバリエーションを生成できます。

9. この特許では、さまざまな属性やタスクに基づいて多数の生成モデルが存在し得ることも説明されています。 したがって、ショッピング、特定の場所への旅行など、さまざまなタスクに固有のモデルが存在する可能性があります。

Google の特許では、さまざまな属性やタスクに基づいて多数の生成モデルが存在する可能性があると説明されています。

概要: PASF および PAA のバリアントの生成は、一部の人が考えているよりも複雑で微妙な場合があります。
この特許を詳しく解説することで、Google がトレーニングされた生成モデルをどのように使用して、さまざまな SERP 機能に表示できるクエリ バリアントやその他のコンテンツを生成するのかを理解するのに少しでも役に立てば幸いです。 また、これは、まだデータがあまりない新規クエリ (新規) やロングテール クエリでも発生する可能性があります。 さらに、特定の分野に焦点を当てた複数のモデルが使用される可能性があります。 また、結果は (追加の入力機能に基づいて) パーソナライズすることもできます。

したがって、次回 SERP で「People Both Search For」または「People Both Ask」を表示するときは、これらのクエリのバリエーションを提供するために生成モデルが使用されている可能性があることに注意してください。 そして、パーソナライズされている場合、それらのクエリはあなたのケースに固有のものである可能性があります。 繰り返しになりますが、Google のシステムは一部の人々が考えているよりもはるかに洗練されています。

GG