สิ่งที่ซอร์สโค้ด Yandex รั่วไหลเปิดเผยเกี่ยวกับเครื่องมือค้นหา

เผยแพร่แล้ว: 2023-02-17

เคยสงสัยหรือไม่ว่ามีอะไรอยู่ในเสิร์ชเอ็นจิ้นยักษ์ใหญ่อย่าง Google, Bing และ Yahoo?

เมื่อวันที่ 27 มกราคม 2023 Yandex เสิร์ชเอ็นจิ้นที่ใหญ่เป็นอันดับ 4 ของโลก ขึ้นแท่นพาดหัวข่าวอันดับต้น ๆ หลังจากการรั่วไหลของข้อมูลจำนวนมหาศาล (44GB)

“ดังนั้น เสิร์ชเอ็นจิ้นที่ได้รับความนิยมสูงสุดในรัสเซียประสบความล้มเหลว มันเกี่ยวข้องกับฉันอย่างไร” คุณอาจถาม

สิ่งที่ช่องข่าวหลายช่องมองว่าเป็นการกระทำที่มุ่งร้ายต่อบริษัทและความปลอดภัยของข้อมูลลูกค้า ผู้เชี่ยวชาญด้านดิจิทัลประเมินว่าสิ่งนี้เป็นข้อมูลเชิงลึกที่หายากเกี่ยวกับวิธีการทำงานของเสิร์ชเอ็นจิ้น

และที่สำคัญกว่านั้น พวกเขาจัดลำดับความสำคัญเนื้อหาใดและทำไม

การรั่วไหลของข้อมูลทำให้สิ่งที่เราคิดว่าในตอนแรกเป็นปัจจัยอันดับ 1,922 แต่ต้องขอบคุณ Ben Wills ตัวเลขจึงถูกแก้ไขเป็น 17,853 ใหญ่โตใช่ไหม?

Mic King ทวีตบนยานเดกซ์

เราผ่านทั้งหมด 1,992

อ่านต่อเพื่อดูว่าเราพบว่าอะไรน่าสนใจที่สุด


ฉันสามารถใช้การเรียนรู้จากการรั่วไหลของ Yandex เพื่อจัดอันดับที่สูงขึ้นใน Google ได้หรือไม่

ไม่ต้องบอกว่า Yandex ไม่ใช่ Google

แต่ปัจจัยที่น่าสังเกตหลายประการทำให้การรั่วไหลนี้มีความเกี่ยวข้อง (และเพื่อการศึกษา) นอกรัสเซียและในการทดสอบการจัดอันดับการค้นหาของคุณ:

  • มีการจับคู่ประมาณ 70% ระหว่าง Yandex และผลการค้นหาของ Google
  • ยานเดกซ์ใช้ PageRank (เกือบจะเหมือนกับใน Google)
  • ยานเดกซ์จ้างอดีตชาวกูเกิลจำนวนมาก และหลายคนคาดเดาว่ายานเดกซ์ได้รับการออกแบบในลักษณะเดียวกัน
  • ยานเดกซ์ปฏิบัติตามแนวทางปฏิบัติที่ดีที่สุดในการดึงข้อมูลที่คล้ายคลึงกันกับ Google เช่น ดัชนีกลับด้านหรือการฝัง
  • เช่นเดียวกับเครื่องมือค้นหาของ Google และ Bing Yandex ใช้ฟังก์ชันการจัดอันดับ Okapi BM25 เพื่อประเมินความเกี่ยวข้องของเอกสารกับคำค้นหาที่กำหนด

Alex Buraks ทวีตบนยานเดกซ์

ดังที่ได้กล่าวไปแล้ว สิ่งที่ซอร์สโค้ด Yandex เปิดเผยช่วยให้เราแยกแยะความแตกต่างระหว่างการคาดเดาและการรู้ว่าการจัดอันดับการค้นหาทำงานอย่างไรเป็นครั้งแรก

ภายในการรั่วไหลของรหัส Yandex: 11 ข้อค้นพบเกี่ยวกับวิธีการทำงานของเครื่องมือค้นหา

โดยทั่วไป ปัจจัยการจัดอันดับยานเดกซ์สามารถแบ่งออกเป็นสามประเภท:

  • ปัจจัยคงที่ เช่น ลิงก์ย้อนกลับขาเข้า ลิงก์ภายในขาเข้า ส่วนหัว อัตราส่วนโฆษณา ฯลฯ สิ่งเหล่านี้เกี่ยวข้องกับเว็บไซต์ของคุณ
  • ปัจจัยไดนามิก เช่น ความเกี่ยวข้องของข้อความ การรวมคำหลัก เป็นต้น สิ่งเหล่านี้เกี่ยวข้องกับทั้งเว็บไซต์ของคุณและคำค้นหา
  • ปัจจัยที่เกี่ยวข้องกับการค้นหาของผู้ใช้ เช่น ตำแหน่งที่ตั้งของผู้ใช้ ภาษาที่ใช้ค้นหา ตัวแก้ไขเจตนา ฯลฯ สิ่งเหล่านี้เกี่ยวข้องโดยตรงกับการค้นหาของผู้ใช้

ปัจจัยการชั่งน้ำหนักที่ใหญ่ที่สุดที่ใช้ในแบบจำลองทางสถิติคือ:

ปัจจัยการชั่งน้ำหนักยานเดกซ์

1. โฆษณาบนเพจ

โฆษณาบนเพจถูกมองว่าเป็นปัจจัยลบ ตามความเป็นจริงแล้ว เป็นปัจจัยที่มีน้ำหนักอันดับลบสูงสุด:

Mic King ทวีตเกี่ยวกับปัจจัยการจัดอันดับ Yandex ที่มีน้ำหนัก

ปัจจัยที่เกี่ยวข้องกับโฆษณาหลายประการ เช่น จำนวนตำแหน่งโฆษณาบนหน้าและหากพื้นหลังสามารถคลิกได้ แนะนำว่ายานเดกซ์ไม่ชอบหน้าที่มีอัตราส่วนโฆษณาสูงต่อหน้าจอที่มองเห็นได้

2. ปัจจัยระดับ URL

การสร้าง URL เป็นอีกปัจจัยหนึ่งที่ยานเดกซ์คำนึงถึง และโดยเฉพาะอย่างยิ่ง:

  • การมีอยู่ของตัวเลขใน URL
  • จำนวนของเครื่องหมายทับ (“/”) ใน URL
  • จำนวนตัวพิมพ์ใหญ่ใน URL

ย้อนกลับไปที่ข้อโต้แย้งที่ว่ายานเดกซ์ไม่ใช่ Google และการรั่วไหลนี้ก็ไม่มีประโยชน์ ปัจจัยของ URL เหล่านี้คล้ายกับหลักเกณฑ์ของโครงสร้าง URL ของ Google


3. ปัจจัยระดับหน้า

มีหลายสิ่งที่จะเปิดเผยที่นี่ ปรากฎว่ายานเดกซ์มีปัจจัยระดับเพจมากมายที่มีบทบาทในการสร้าง SERP สิ่งที่น่าสังเกตมากที่สุด ได้แก่ :

  • ความใหม่ของหน้า - โดยเฉพาะอย่างยิ่งสำหรับเนื้อหาบล็อกและเว็บไซต์ข่าว เป็นปัจจัยด้านลบหากหน้าเนื้อหามีอายุมากกว่า 10 ปี ดังนั้นอัปเดตเนื้อหาของคุณบ่อยๆ
  • ปลายทางสุดท้าย - ยานเดกซ์ให้รางวัลแก่เพจที่สิ้นสุดเส้นทางการค้นหาของผู้ใช้ หมายความว่าพวกเขาพบสิ่งที่ต้องการแล้ว
  • อัตราส่วนแหล่งที่มาของการเข้าชมที่ดี - ยานเดกซ์ไม่ชอบหน้าเว็บที่ได้รับการเข้าชมจากแหล่งเดียว (เช่น การค้นหาทั่วไป) เพื่อให้เพจมีอันดับสูง จำเป็นต้องได้รับการเข้าชมจากแหล่งที่มาทุกประเภท - ทั่วไป จ่ายตรง ฯลฯ
  • คุณภาพของเนื้อหา - จำเป็นอย่างยิ่งที่ข้อความของคุณจะต้องไม่ซ้ำกับคำหลัก เป็นการเพิ่มอันดับหากข้อความของคุณได้รับการอ้างอิง/เชื่อมโยงในโดเมนภายนอก นอกจากนี้ การมีเนื้อหาคุณภาพต่ำจะทำให้อันดับของเนื้อหาคุณภาพดีลดลง

4. ปัจจัยระดับเว็บไซต์

เมื่อพิจารณาจากปัจจัยความใหม่ของหน้าเว็บแล้ว การผสมผสานที่ดีที่สุดคือการมีเว็บไซต์ที่มั่นคงและใช้งานมาเป็นเวลานานและอัปเดตเนื้อหาบ่อยๆ

นอกจากนี้ Yandex ยังตัดสินคุณภาพโดยรวมของเว็บไซต์ด้วยมุมมองความสามารถในการคลิก กล่าวอีกนัยหนึ่ง ผู้ใช้คลิก URL สำหรับการค้นหาบ่อยเพียงใด

ปัจจัยด้านการจัดอันดับที่เป็นบวกอีกประการหนึ่งคือชื่อโดเมน Yandex ช่วยเพิ่มอันดับให้กับโดเมน .COM


5. คุณภาพของเพจ

เราได้พูดถึงคุณภาพเนื้อหาแล้ว แต่คุณภาพของหน้าโดยรวมล่ะ Yandex ประเมินคุณภาพของหน้าตามปัจจัยหลายประการ:

  • จำนวนการเข้าชม
  • จำนวนผู้เข้าชมที่ไม่ซ้ำ
  • เวลาที่ใช้ในเพจ
  • จำนวนการดำเนินการในหน้า

6. พฤติกรรมและการมีส่วนร่วมของผู้ใช้

มีพฤติกรรมของผู้ใช้ที่น่าสนใจหลายประการจากการรั่วไหลที่เราจำเป็นต้องพูดคุย

ปัจจัยสำคัญคือจำนวนคลิกและการแสดงผลโดยรวมที่โฮสต์ได้รับ ยานเดกซ์ยังพิจารณาว่าเพจนั้นเหมาะกับมือถือหรือไม่ และวิเคราะห์พฤติกรรมของผู้ใช้บนอุปกรณ์พกพา รวมถึงระยะเวลาเซสชันและเวลาที่ใช้ในเพจ นอกจากนี้ เมื่อผู้เยี่ยมชมกลับมาที่เว็บไซต์ภายในเดือนเดียวกัน นั่นเป็นปัจจัยในการจัดอันดับเชิงบวก

แต่สิ่งที่น่าสนใจที่สุดคือ:

หน้าเว็บที่แสดงบทวิจารณ์ของผู้ใช้จะได้รับความสำคัญในผลการค้นหา

7. อันดับโฮสต์และที่ตั้ง

ยานเดกซ์ให้ความสำคัญกับการจัดลำดับความสำคัญของเนื้อหาที่อยู่ใกล้กับผู้ใช้ในเชิงภูมิศาสตร์ ดังนั้นเมื่อชื่อโดเมนสองชื่อต่อสู้กันเพื่อการค้นหาคำค้นหาเดียวกัน ชื่อที่อยู่ใกล้กับผู้ใช้มากที่สุดจะได้รับการจัดอันดับที่เพิ่มขึ้น

ในแง่ของปัจจัยการจัดอันดับทางเทคนิค การลดจำนวนข้อผิดพลาดของไคลเอ็นต์ 400 รายการและข้อผิดพลาดของเซิร์ฟเวอร์ 500 รายการจะทำให้คุณนำหน้าใน SERP ยิ่งไปกว่านั้น Yandex ให้ความสำคัญกับความลึกในการรวบรวมข้อมูลเป็นอย่างมาก นั่นเป็นเหตุผลที่ต้องแน่ใจว่าไม่มีหน้าสำคัญใดที่ควรอยู่ห่างจากหน้าแรกของคุณมากกว่าสองคลิก


8. คุณภาพของลิงก์ย้อนกลับ

ยานเดกซ์ใช้มาตรการต่าง ๆ เพื่อลงโทษการสร้างเครือข่ายการอ้างอิงซึ่งเพิ่มความนิยมของเว็บไซต์เกินจริง

มาตรการหนึ่งคือการวิเคราะห์เปอร์เซ็นต์ของข้อความไฮเปอร์ลิงก์ เนื่องจากการเชื่อมโยงมากเกินไปอาจบ่งบอกถึงพฤติกรรมบิดเบือน นอกจากนี้ยังพิจารณาถึงคุณภาพของลิงก์ที่นำไปยังไซต์และลงโทษไซต์ที่มีลิงก์แบบเสียเงินหรือคุณภาพต่ำจำนวนมาก

เมื่อพูดถึงคุณภาพของลิงก์ ปัจจัยที่ส่งผลโดยตรงต่อคุณภาพลิงก์คือจำนวนการเปลี่ยนเส้นทางและวิธีการสร้างลิงก์


9. ผลกระทบต่อการเข้าชมการค้นหา

เช่นเดียวกับ Google เว็บไซต์ที่รวมแนวทางปฏิบัติ SEO ที่ดีจะทำงานได้ดีกว่าเว็บไซต์ที่ไม่มี การถูกค้นพบได้ง่ายเป็นวิธีที่แน่นอนในการได้รับการจัดอันดับที่สูงขึ้นบนยานเดกซ์

ไม่น่าแปลกใจเลยที่หน้าเว็บที่สามารถตอบสนองความต้องการในการค้นหาเป็นผู้นำสำหรับข้อความค้นหาที่เกี่ยวข้อง หน้าเว็บที่มีข้อความค้นหาตรงกันในแท็กชื่อเรื่องและข้อความเนื้อหาจะได้เปรียบกว่า นอกจากนี้ การใช้คำพ้องความหมายก็เป็นอีกหนึ่งสัญญาณเชิงบวกที่สามารถนำไปสู่การเพิ่มอันดับได้


10. เพิ่มวิกิพีเดีย

สัญญาณที่ชัดเจนอีกประการหนึ่งสำหรับหน้าเว็บคุณภาพสูงก็คือหากลิงก์มาจากวิกิพีเดีย ยานเดกซ์ชอบหน้าเว็บที่เชื่อมโยงจากวิกิพีเดียและจัดอันดับให้สูงขึ้น

11. เนื้อหาวิดีโอ

เว็บไซต์ที่มีเนื้อหาวิดีโอจะได้รับการจัดลำดับความสำคัญ แต่มีข้อผิดพลาดคือ Yandex จัดอันดับหน้าที่สูงขึ้นด้วยวิดีโอที่โฮสต์โดย Yandex (duh)

ในแง่ของการประเมินเนื้อหาวิดีโอของเพจ จะใช้มาตรการมาตรฐาน นั่นคือ เวลาในการดูเฉลี่ยเทียบกับความยาวทั้งหมดของวิดีโอ

และในขณะที่การค้นพบทั้ง 11 ข้อนี้ให้ข้อมูลเชิงลึกที่ยอดเยี่ยม แต่ก็มีการถกเถียงกันในโลกของ SEO ว่าข้อมูลที่รั่วไหลนั้นมีค่าหรือไม่

ปฏิกิริยาต่อปัจจัยการจัดอันดับที่รั่วไหลในโลก SEO

ตั้งแต่การเลิกจ้างทันทีไปจนถึงการวิเคราะห์เชิงลึก SEOs แสดงความคิดเห็นที่หลากหลายเกี่ยวกับการรั่วไหลของยานเดกซ์

Kevin Indig สรุปข้อโต้แย้งที่พบบ่อยที่สุดและเสนอข้อมูลที่ดีเกี่ยวกับความสำคัญของปัจจัยการจัดอันดับ

ตัดตอนมาจากบทความของ Kevin Indig เกี่ยวกับการรั่วไหลของข้อมูลยานเดกซ์
ตัวอย่างจากบทความ “SEOs are underestimating The Yandex leak” โดย Kevin Indig

บุคคลที่มีชื่อเสียงในแวดวง SEO เช่น Ben Wills, Alex Buraks และ Mic King ต่างถวิลหาและเจาะลึกเพื่อถอดรหัสข้อมูลที่รั่วไหลออกมา

Ben Wills เป็นหนึ่งในผู้เชี่ยวชาญกลุ่มแรกๆ ที่เข้าใจซอร์สโค้ดและช่วยให้เราเข้าใจความสำคัญของเหตุการณ์ (แม้ว่าเขาจะเปิดเธรด Twitter ในภายหลังก็ตาม)

Ben Willis ทวีตบนยานเดกซ์

ในเวลาเดียวกัน Rob Ousbey ได้แบ่งปันเครื่องมือสำรวจรุ่นอัลฟ่าสำหรับรหัสยานเดกซ์:

Rob Ousbey ทวีตบนยานเดกซ์

Mic King แบ่งปันความประทับใจแรกของเขาแบบสดๆ ในขณะที่ดูซอร์สโค้ด โดยบอกเราว่า “อย่านอนกับโค้ดนี้”

Mic King ทวีตบนยานเดกซ์


ฟอรัม SEO ในรัสเซียก็มีผู้คนหนาแน่นไม่น้อย และผู้ดูแลเว็บก็มีข้อมูลเชิงลึกที่คล้ายคลึงกันที่จะแบ่งปันในฐานะโลก SEO ของตะวันตก อย่างไรก็ตาม ยังมีการพูดคุยกันมากมายเกี่ยวกับ Yandex ที่ชื่นชอบผลิตภัณฑ์และบริการของบริษัท ดังที่ Dan Taylor ผู้เชี่ยวชาญด้าน SEO ของรัสเซียกล่าวถึง

บทสรุป

การรั่วไหลของซอร์สโค้ด Yandex จะเปลี่ยนวิธีการทำ SEO ของคุณหรือไม่?

อาจจะไม่.

แต่มันจะเป็นความผิดพลาดอย่างใหญ่หลวงที่จะติดป้ายว่าไม่สำคัญและเลื่อนผ่านไป

เห็นได้ชัดว่ามีความคล้ายคลึงกันมากระหว่าง Yandex และ Google ดังนั้น การรั่วไหลนี้จึงเป็นจุดเริ่มต้นที่ดีสำหรับการทดลองเพิ่มเติม และผลักดันให้คุณมุ่งเน้นไปที่ประสบการณ์ของผู้ใช้และเนื้อหาที่มีคุณภาพมากยิ่งขึ้น

ดังนั้นให้คุกเข่าลงและเริ่มการทดสอบ