تحديث Google BERT: الخلفية والتحليل

نشرت: 2019-10-29

إنه أكبر تغيير في خوارزمية Google لمدة خمس سنوات ، حيث أثر على واحد من كل عشرة طلبات بحث. من خلال تحديث Google BERT ، تهدف Google إلى تحسين تفسير استعلامات البحث المعقدة الطويلة وعرض نتائج بحث أكثر صلة. باستخدام Natural Language Processing ، حسنت Google بشكل كبير قدرتها على فهم السياق الدلالي لمصطلح البحث.

إذا كنت تبحث عن دعم لتحسين محرك البحث لموقعك على الويب ، فيمكنك الحصول على مزيد من المعلومات والتحليلات من خبرائنا:

رتب موعدًا!

Searchmetrics 'على تحديث Google BERT

malte-landwehr_01_sw "يعتبر Bert تطورًا منطقيًا لشركة Google ، يسير على خطى Panda و Hummingbird و RankBrain. ومع ذلك ، هذه المرة لا ننظر إلى تغيير في طريقة فهرسة البيانات أو ترتيبها. بدلاً من ذلك ، تحاول Google تحديد سياق استعلام البحث وتقديم النتائج وفقًا لذلك. هذه إضافة مثيرة لما يمكن أن تقدمه النماذج الخالية من السياق مثل Word2Vec و GloVe. بالنسبة إلى البحث الصوتي والبحث التخاطبي ، أتوقع أن أرى قفزات كبيرة إلى الأمام في جودة النتائج في المستقبل القريب ". - Malte Landwehr ، نائب الرئيس للمنتجات ، Searchmetrics

أين تم طرح BERT؟

بينما استخدم BERT في البداية فقط نتائج البحث العضوية لموقع Google.com ، فقد طرح BERT منذ ديسمبر 2019 أكثر من 70 لغة في جميع أنحاء العالم. بالنسبة إلى المقتطفات المميزة ، والتي يتم عرضها على نتائج البحث العضوية في الموضع 0 مع نص أو جدول أو قائمة ، تم استخدام BERT بالفعل في جميع اللغات الـ 25 التي يعرض Google لها أيضًا المقتطفات المميزة.

يتم طرح BERT لحساب نتائج البحث العضوي في: الأفريكانية ، الألبانية ، الأمهرية ، العربية ، الأرمينية ، الأذرية ، الباسكية ، البيلاروسية ، البلغارية ، الكاتالونية ، الصينية (المبسطة والتايوانية) ، الكرواتية ، التشيكية ، الدنماركية ، الهولندية ، الإنجليزية ، الإستونية ، الفارسية ، الفنلندية ، الفرنسية ، الجاليكية ، الجورجية ، الألمانية ، اليونانية ، الغوجاراتية ، العبرية ، الهندية ، المجرية ، الأيسلندية ، الإندونيسية ، الإيطالية ، اليابانية ، الجاوية ، الكانادا ، الكازاخستانية ، الخميرية ، الكورية ، الكردية ، القرغيزية ، اللاوية ، اللاتفية ، الليتوانية ، المقدونية الملايو (بروناي دار السلام وماليزيا) ، المالايالامية ، المالطية ، المهاراتية ، المنغولية ، النيبالية ، النرويجية ، البولندية ، البرتغالية ، البنجابية ، الرومانية ، الروسية ، الصربية ، السنهالية ، السلوفاكية ، السلوفينية ، الإسبانية السواحيلية ، السويدية ، التاجالوجية ، الطاجيكية والتاميلية والتيلجو والتايلاندية والتركية والأوكرانية والأردية والأوزبكية والفيتنامية.

في هذه التغريدة ، أعلنت Google عن طرح BERT عالميًا:

وفي الوقت نفسه ، تحدث جون مولر ، محلل اتجاهات مشرفي المواقع ، في إحدى جلسات Hangout الخاصة بمشرفي المواقع على Google بعد أن أبلغ أحد المستخدمين عن انخفاض بنسبة 40 ٪ في حركة المرور واشتبه في أن السبب وراء ذلك هو BERT. أوضح مولر أن BERT لم يكن مسؤولاً عن مثل هذه التصنيفات وانخفاض حركة المرور ، ولكنه كان مسؤولاً عن أحد التحديثات المنتظمة أو التحديث الأساسي. وفقًا للمعايير التي يتم بها إجراء تغييرات الخوارزمية ، يشرح مولر بالتفصيل كيفية عمل التطوير في Google من 30:46 دقيقة في الفيديو:

ماذا يعني BERT؟

يشير الاختصار ، "BERT" ، إلى تمثيلات التشفير ثنائية الاتجاه من المحولات ويشير إلى نموذج خوارزمية يعتمد على الشبكات العصبية. بمساعدة معالجة اللغة الطبيعية (NLP) ، تحاول أنظمة الآلة تفسير تعقيد اللغة البشرية. يمكنك العثور على توثيق مفصل لـ BERT على مدونة Google AI.

ببساطة ، يستخدم Google BERT لمحاولة فهم سياق استعلام البحث بشكل أفضل ، ولتفسير معنى الكلمات الفردية بشكل أكثر دقة. تم بناء هذا الاختراق على نماذج رياضية تسمى Transformers: تحلل هذه الكلمة فيما يتعلق بجميع الكلمات الأخرى في الجملة - أو في حالة بحث Google في استعلام البحث - ولا تنظر ببساطة إلى معنى الكلمات بمعزل عن غيرها. هذا مفيد بشكل خاص عند تفسير معنى حروف الجر وموضع الكلمات الفردية داخل استعلام البحث.

لماذا يعد تحديث BERT مهمًا جدًا لجوجل؟

وفقًا لـ Google ، حوالي 15 بالمائة من جميع استعلامات البحث جديدة - وهذا يعني أنه يتم البحث عنها لأول مرة. علاوة على ذلك ، تزداد صياغة استعلامات البحث بشكل أقرب وأقرب إلى التواصل البشري الحقيقي - جزئيًا تحت تأثير التطورات التقنية مثل البحث الصوتي. وقالت خدمة الإحصاء Comscore خبراء أن نسبة عمليات البحث الصوتي ستصل إلى 50 بالمئة في غضون عامين. عامل آخر هو الطول المتزايد لطلبات البحث - اليوم ، يمكن اعتبار 70٪ من عمليات البحث طويلة الذيل. يلجأ الأشخاص إلى Google بأسئلة مصاغة بالكامل ، ويتوقعون إجابات دقيقة في جزء من الثانية - وتشكل BERT الآن جزءًا مهمًا من التكنولوجيا التي تجعل هذا ممكنًا.

لسنوات عديدة حتى الآن ، تعمل Google على شبكات عصبية يمكنها الرد بشكل صحيح على استفسارات البحث الجديدة وتحسين تفسير المحتوى:

  • الطائر الطنان: في عام 2013 ، تم دمج الطائر الطنان في خوارزمية Google. أتاح تحديث الخوارزمية هذا تفسير استعلامات البحث بالكامل بشكل أفضل ، بدلاً من مجرد البحث عن الكلمات الفردية داخل استعلام.
  • RankBrain : في عام 2015 ، أصبح RankBrain جزءًا من خوارزمية Google وأعلن أنه ثالث أهم عامل تصنيف. هذا جعل من الممكن معالجة مصطلحات البحث ذات المعاني المتعددة ، أو الاستعلامات المعقدة التي تتجاوز البحث العادي طويل الذيل. مع RankBrain ، أصبح من الممكن أيضًا معالجة عمليات البحث والعبارات العامية والحوارات والتعابير الجديدة لأول مرة.

ما هي استعلامات البحث المتأثرة بـ BERT؟

يؤثر تأثير BERT على استعلامات البحث الطويلة. تعمل BERT على تحسين تفسير السياق للاستعلامات الأطول التي يتم إدخالها (أو المنطوقة للبحث الصوتي) في شريط البحث كسؤال أو مجموعة كلمات.

على مدونتهم ، قدمت Google بعض الأمثلة لاستعلامات البحث التي تساعد BERT على فهمها بشكل أفضل والتي يوفر محرك البحث الآن نتائج أكثر صلة بها.

Google-BERT-Update-Query-2019-brazil-traveler-to-usa-need-a-visa

في هذا المثال لنتيجة بحث عضوية ، وفقًا لـ Google ، تم الاستهانة سابقًا بأهمية كلمة "to" وعلاقتها بالكلمات الأخرى. ومع ذلك ، فإن كلمة "إلى" تلعب دورًا أساسيًا في معنى الجملة. نحن نتعامل مع شخص من البرازيل يريد السفر إلى الولايات المتحدة - وليس العكس. يتيح نموذج BERT الجديد لـ Google فهم هذا التمييز بشكل صحيح وتقديم نتائج تتوافق مع هدف البحث الحقيقي.

مثال 2: "وقوف السيارات على تل بلا حاجز"

Google-BERT-Update-Query-Parking-on-a-hill-with-no-curb

في هذا المثال من مدونة Google ، التي تتعامل مع تقييم نتائج البحث لاختيار المقتطف المميز الأكثر صلة ، كان التركيز يتم وضعه بشكل كبير جدًا على كلمة "كبح" ، متجاهلاً أهمية كلمة "لا". هذا يعني أنه تم عرض مقتطف مميز كان ذا فائدة قليلة ، لأنه في الواقع أجاب على السؤال المعاكس لذلك الذي طرحه الباحث.

ما الذي يمكن تحسين محركات البحث ومشرفي المواقع فعله؟

لا توجد إجابة بسيطة لكيفية التعامل مع BERT. لا توجد أي تكتيكات سهلة يمكنك استخدامها لتحسين ترتيب موقعك فجأة أو لتعويض الخسائر. بدلاً من ذلك ، من المهم أن تضع في اعتبارك أنك تحتاج إلى كتابة المحتوى الخاص بك وإنشاء مواقع الويب الخاصة بك ليس فقط للخوارزميات ، ولكن من أجل الأشخاص: للمستخدمين المحتملين والعملاء الذين سيزورون موقع الويب الخاص بك ويتفاعلون معه.