การอัปเดต Google BERT: ความเป็นมาและการวิเคราะห์

เผยแพร่แล้ว: 2019-10-29

เป็นการเปลี่ยนแปลงครั้งใหญ่ที่สุดในอัลกอริทึมของ Google เป็นเวลาห้าปี โดยส่งผลต่อหนึ่งในสิบคำค้นหา ด้วยการอัปเดต Google BERT Google มีเป้าหมายเพื่อปรับปรุงการตีความคำค้นหาหางยาวที่ซับซ้อนและแสดงผลการค้นหาที่เกี่ยวข้องมากขึ้น ด้วยการใช้การประมวลผลภาษาธรรมชาติ Google ได้ปรับปรุงความสามารถในการทำความเข้าใจบริบททางความหมายของข้อความค้นหาอย่างมาก

หากคุณกำลังมองหาการสนับสนุนการเพิ่มประสิทธิภาพกลไกค้นหาของเว็บไซต์ของคุณ คุณสามารถรับข้อมูลเพิ่มเติมและการวิเคราะห์จากผู้เชี่ยวชาญของเรา:

นัดรับ!

สองเซ็นต์ของ Searchmetrics ในการอัปเดต Google BERT

malte-landwehr_01_sw “เบิร์ตเป็นการพัฒนาที่สมเหตุสมผลสำหรับ Google ตามรอยเท้าของ Panda, Hummingbird และ RankBrain อย่างไรก็ตาม คราวนี้เราไม่ได้ดูการเปลี่ยนแปลงวิธีการจัดทำดัชนีหรือจัดอันดับข้อมูล แต่ Google พยายามระบุบริบทของคำค้นหาและให้ผลลัพธ์ตามนั้น นี่เป็นส่วนเสริมที่น่าตื่นเต้นสำหรับโมเดลที่ไม่มีบริบทเช่น Word2Vec และ GloVe สามารถนำเสนอได้ สำหรับการค้นหาด้วยเสียงและการค้นหาการสนทนา ฉันคาดหวังว่าจะได้เห็นการก้าวกระโดดที่สำคัญในด้านคุณภาพของผลลัพธ์ในอนาคตอันใกล้นี้” – Malte Landwehr รองประธานฝ่ายผลิตภัณฑ์ Searchmetrics

BERT เปิดตัวที่ไหน?

แม้ว่าในตอนแรก BERT จะใช้ผลการค้นหาทั่วไปของ Google.com เท่านั้น แต่ตั้งแต่เดือนธันวาคม 2019 BERT ได้เปิดตัวภาษาต่างๆ มากกว่า 70 ภาษาทั่วโลก สำหรับ Featured Snippets ซึ่งกระจายอยู่เหนือผลการค้นหาแบบออร์แกนิกเป็นตำแหน่ง 0 พร้อมข้อความ ตาราง หรือรายการ BERT ถูกใช้ไปแล้วใน 25 ภาษา ซึ่ง Google จะแสดง Featured Snippets ด้วย

BERT กำลังเปิดตัวสำหรับการคำนวณผลลัพธ์การค้นหาแบบออร์แกนิกใน: แอฟริกา อัลเบเนีย อัมฮาริก อาหรับ อาร์เมเนีย อาเซอร์รี บาสก์ เบลารุส บัลแกเรีย คาตาลัน จีน (ตัวย่อ & ไต้หวัน) โครเอเชีย เช็ก เดนมาร์ก ดัตช์ อังกฤษ เอสโตเนีย ฟาร์ซี ฟินแลนด์ ฝรั่งเศส กาลิเซีย จอร์เจีย เยอรมัน กรีก คุชราต ฮิบรู ฮินดี ฮังการี ไอซ์แลนด์ อินโดนีเซีย อิตาลี ญี่ปุ่น ชวา กันนาดา คาซัค เขมร เกาหลี เคิร์ด คีร์กีซ ลาว ลัตเวีย , ลิทัวเนีย, มาซิโดเนียมาเลย์ (บรูไนดารุสซาลามและมาเลเซีย), มาลายาลัม, มอลตา, มาราธี, มองโกเลีย, เนปาล, นอร์เวย์, โปแลนด์, โปรตุเกส, ปัญจาบ, โรมาเนีย, รัสเซีย, เซอร์เบีย, ชาวสิงหล, สโลวัก, สโลวีเนีย, สวาฮีลีสเปน, สวีเดน, ตากาล็อก, ทาจิกิสถาน , ทมิฬ, เตลูกู, ไทย, ตุรกี, ยูเครน, อูรดู, อุซเบกและเวียดนาม

ในทวีตนี้ Google ประกาศเปิดตัว BERT ทั่วโลก:

ในขณะเดียวกัน John Mueller นักวิเคราะห์ของ Webmaster Trends ได้พูดใน Google Webmaster Hangout ของเขาหลังจากที่ผู้ใช้รายงานว่ามีปริมาณการใช้งานลดลง 40% และสงสัยว่า BERT เป็นสาเหตุ Mueller อธิบายว่า BERT ไม่ได้รับผิดชอบต่อการจัดอันดับดังกล่าวและการเข้าชมที่ลดลง แต่เป็นหนึ่งในการอัปเดตปกติหรือการอัปเดตหลัก ตามเกณฑ์ที่อัลกอริทึมทำการเปลี่ยนแปลง Mueller อธิบายรายละเอียดว่าการพัฒนาที่ Google ทำงานอย่างไรจาก 30:46 นาทีในวิดีโอ:

BERT หมายถึงอะไร?

ตัวย่อ 'BERT' ย่อมาจาก Bidirectional Encoder Representations จาก Transformers และหมายถึงโมเดลอัลกอริธึมที่ยึดตามโครงข่ายประสาทเทียม ด้วยความช่วยเหลือของ Natural Language Processing (NLP) ระบบเครื่องพยายามตีความความซับซ้อนของภาษามนุษย์ คุณสามารถอ่านเอกสารโดยละเอียดของ BERT ได้ในบล็อก AI ของ Google

พูดง่ายๆ ก็คือ Google ใช้ BERT เพื่อพยายามทำความเข้าใจบริบทของคำค้นหาให้ดีขึ้น และเพื่อตีความความหมายของคำแต่ละคำให้แม่นยำยิ่งขึ้น ความก้าวหน้านี้สร้างขึ้นจากแบบจำลองทางคณิตศาสตร์ที่เรียกว่า Transformers ซึ่งวิเคราะห์คำที่เกี่ยวข้องกับคำอื่นๆ ทั้งหมดในประโยค หรือในกรณีของ Google ค้นหาคำค้นหา และอย่ามองแค่ความหมายของคำแยกกัน สิ่งนี้มีประโยชน์อย่างยิ่งในการตีความความหมายของคำบุพบทและตำแหน่งของคำแต่ละคำภายในคำค้นหา

เหตุใด BERT Update จึงมีความสำคัญสำหรับ Google

จากข้อมูลของ Google พบว่าประมาณ 15 เปอร์เซ็นต์ของข้อความค้นหาทั้งหมดเป็นข้อความค้นหาใหม่ ซึ่งหมายความว่ามีการค้นหาเป็นครั้งแรก นอกจากนี้ การใช้ถ้อยคำของข้อความค้นหายังใกล้ชิดกับการสื่อสารของมนุษย์มากขึ้นเรื่อยๆ ส่วนหนึ่งอยู่ภายใต้อิทธิพลของความก้าวหน้าทางเทคนิค เช่น การค้นหาด้วยเสียง บริการสถิติของผู้เชี่ยวชาญ Comscore สัดส่วนของการค้นหาด้วยเสียงจะแตะ 50 เปอร์เซ็นต์ภายในสองปี อีกปัจจัยหนึ่งคือความยาวที่เพิ่มขึ้นของข้อความค้นหา – ปัจจุบันนี้ 70% ของการค้นหาถือได้ว่าเป็นการค้นหาแบบยาว ผู้คนหันมาใช้ Google ด้วยคำถามที่มีสูตรครบถ้วน และคาดหวังคำตอบที่แม่นยำในเวลาเพียงเสี้ยววินาที และตอนนี้ BERT ได้กลายเป็นส่วนสำคัญของเทคโนโลยีที่ทำให้สิ่งนี้เป็นไปได้

เป็นเวลาหลายปีแล้วที่ Google ทำงานเกี่ยวกับโครงข่ายประสาทเทียมที่สามารถตอบสนองต่อคำค้นหาใหม่ๆ ได้อย่างถูกต้องและปรับปรุงการตีความเนื้อหา:

  • Hummingbird: ในปี 2013 Hummingbird ถูกรวมไว้ใน Google Algorithm การอัปเดตอัลกอริธึมนี้ทำให้ตีความคำค้นหาทั้งหมดได้ดีขึ้น แทนที่จะค้นหาเฉพาะคำภายในคำค้นหา
  • RankBrain : ในปี 2015 RankBrain ได้กลายเป็นส่วนหนึ่งของอัลกอริทึมของ Google และได้รับการประกาศให้เป็นปัจจัยอันดับสามที่สำคัญที่สุด ทำให้สามารถประมวลผลข้อความค้นหาที่มีหลายความหมาย หรือคำค้นหาที่ซับซ้อนที่นอกเหนือไปจากการค้นหาหางยาวปกติ ด้วย RankBrain ทำให้สามารถประมวลผลการค้นหาครั้งแรก ภาษาพูด บทสนทนา และ neologisms ได้

คำค้นหาใดบ้างที่ได้รับผลกระทบจาก BERT

ผลกระทบของ BERT ส่งผลต่อคำค้นหาหางยาว BERT ปรับปรุงการตีความบริบทสำหรับข้อความค้นหาที่ยาวขึ้นซึ่งป้อน (หรือพูดสำหรับการค้นหาด้วยเสียง) ลงในแถบค้นหาเป็นคำถามหรือกลุ่มคำ

ในบล็อกของพวกเขา Google ได้ให้ตัวอย่างบางส่วนของข้อความค้นหาที่ BERT ช่วยให้เข้าใจได้ดีขึ้น และขณะนี้เครื่องมือค้นหาให้ผลลัพธ์ที่เกี่ยวข้องมากขึ้น

Google-BERT-Update-Query-2019-brazil-traveler-to-usa-need-a-visa

ในตัวอย่างนี้สำหรับผลการค้นหาทั่วไป ตามข้อมูลของ Google ก่อนหน้านี้ ความสำคัญของคำว่า "ถึง" และความสัมพันธ์กับคำอื่นๆ ถูกประเมินต่ำไป อย่างไรก็ตาม คำว่า "ถึง" มีบทบาทสำคัญในความหมายของประโยค เรากำลังติดต่อกับใครบางคน จาก บราซิลที่ต้องการเดินทาง ไป สหรัฐอเมริกา ไม่ใช่ในทางกลับกัน โมเดล BERT ใหม่ทำให้ Google สามารถเข้าใจความแตกต่างนี้ได้อย่างถูกต้องและให้ผลลัพธ์ที่สอดคล้องกับจุดประสงค์ในการค้นหาที่แท้จริง

ตัวอย่างที่ 2: “การจอดรถบนเนินเขาที่ไม่มีขอบทาง”

Google-BERT-Update-Query-Parking-on-a-hill-with-no-curb

ในตัวอย่างนี้จากบล็อกโพสต์ของ Google ซึ่งเกี่ยวกับการประเมินผลการค้นหาเพื่อเลือกข้อมูลโค้ดเด่นที่เกี่ยวข้องมากที่สุด มักให้ความสำคัญกับคำว่า "ขอบทาง" มากเกินไป โดยไม่สนใจความสำคัญของคำว่า "ไม่" ซึ่งหมายความว่ามีการแสดงตัวอย่างข้อมูลเด่นซึ่งใช้งานน้อย เนื่องจากจริง ๆ แล้วได้ตอบคำถามที่ตรงกันข้ามกับคำถามที่ผู้ค้นหาโพสต์

SEO และเว็บมาสเตอร์สามารถทำอะไรได้บ้าง

ไม่มีคำตอบง่ายๆ เกี่ยวกับวิธีตอบสนองต่อ BERT ไม่มีกลวิธีง่ายๆ ที่คุณสามารถใช้เพื่อทำให้เว็บไซต์ของคุณมีอันดับที่ดีขึ้นหรือเพื่อฟื้นฟูความสูญเสียในทันใด สิ่งสำคัญคือต้องจำไว้ว่าคุณต้องเขียนเนื้อหาและสร้างเว็บไซต์ของคุณ ไม่ใช่แค่สำหรับอัลกอริทึม แต่สำหรับผู้คน: สำหรับผู้ใช้ที่มีศักยภาพและลูกค้าที่จะเข้าชมและโต้ตอบกับเว็บไซต์ของคุณ