สิ่งที่ซอร์สโค้ด Yandex รั่วไหลเปิดเผยเกี่ยวกับเครื่องมือค้นหา
เผยแพร่แล้ว: 2023-02-17เคยสงสัยหรือไม่ว่ามีอะไรอยู่ในเสิร์ชเอ็นจิ้นยักษ์ใหญ่อย่าง Google, Bing และ Yahoo?
เมื่อวันที่ 27 มกราคม 2023 Yandex เสิร์ชเอ็นจิ้นที่ใหญ่เป็นอันดับ 4 ของโลก ขึ้นแท่นพาดหัวข่าวอันดับต้น ๆ หลังจากการรั่วไหลของข้อมูลจำนวนมหาศาล (44GB)
“ดังนั้น เสิร์ชเอ็นจิ้นที่ได้รับความนิยมสูงสุดในรัสเซียประสบความล้มเหลว มันเกี่ยวข้องกับฉันอย่างไร” คุณอาจถาม
สิ่งที่ช่องข่าวหลายช่องมองว่าเป็นการกระทำที่มุ่งร้ายต่อบริษัทและความปลอดภัยของข้อมูลลูกค้า ผู้เชี่ยวชาญด้านดิจิทัลประเมินว่าสิ่งนี้เป็นข้อมูลเชิงลึกที่หายากเกี่ยวกับวิธีการทำงานของเสิร์ชเอ็นจิ้น
และที่สำคัญกว่านั้น พวกเขาจัดลำดับความสำคัญเนื้อหาใดและทำไม
การรั่วไหลของข้อมูลทำให้สิ่งที่เราคิดว่าในตอนแรกเป็นปัจจัยอันดับ 1,922 แต่ต้องขอบคุณ Ben Wills ตัวเลขจึงถูกแก้ไขเป็น 17,853 ใหญ่โตใช่ไหม?

เราผ่านทั้งหมด 1,992
อ่านต่อเพื่อดูว่าเราพบว่าอะไรน่าสนใจที่สุด
ฉันสามารถใช้การเรียนรู้จากการรั่วไหลของ Yandex เพื่อจัดอันดับที่สูงขึ้นใน Google ได้หรือไม่
ไม่ต้องบอกว่า Yandex ไม่ใช่ Google
แต่ปัจจัยที่น่าสังเกตหลายประการทำให้การรั่วไหลนี้มีความเกี่ยวข้อง (และเพื่อการศึกษา) นอกรัสเซียและในการทดสอบการจัดอันดับการค้นหาของคุณ:
- มีการจับคู่ประมาณ 70% ระหว่าง Yandex และผลการค้นหาของ Google
- ยานเดกซ์ใช้ PageRank (เกือบจะเหมือนกับใน Google)
- ยานเดกซ์จ้างอดีตชาวกูเกิลจำนวนมาก และหลายคนคาดเดาว่ายานเดกซ์ได้รับการออกแบบในลักษณะเดียวกัน
- ยานเดกซ์ปฏิบัติตามแนวทางปฏิบัติที่ดีที่สุดในการดึงข้อมูลที่คล้ายคลึงกันกับ Google เช่น ดัชนีกลับด้านหรือการฝัง
- เช่นเดียวกับเครื่องมือค้นหาของ Google และ Bing Yandex ใช้ฟังก์ชันการจัดอันดับ Okapi BM25 เพื่อประเมินความเกี่ยวข้องของเอกสารกับคำค้นหาที่กำหนด

ดังที่ได้กล่าวไปแล้ว สิ่งที่ซอร์สโค้ด Yandex เปิดเผยช่วยให้เราแยกแยะความแตกต่างระหว่างการคาดเดาและการรู้ว่าการจัดอันดับการค้นหาทำงานอย่างไรเป็นครั้งแรก
ภายในการรั่วไหลของรหัส Yandex: 11 ข้อค้นพบเกี่ยวกับวิธีการทำงานของเครื่องมือค้นหา
โดยทั่วไป ปัจจัยการจัดอันดับยานเดกซ์สามารถแบ่งออกเป็นสามประเภท:
- ปัจจัยคงที่ เช่น ลิงก์ย้อนกลับขาเข้า ลิงก์ภายในขาเข้า ส่วนหัว อัตราส่วนโฆษณา ฯลฯ สิ่งเหล่านี้เกี่ยวข้องกับเว็บไซต์ของคุณ
- ปัจจัยไดนามิก เช่น ความเกี่ยวข้องของข้อความ การรวมคำหลัก เป็นต้น สิ่งเหล่านี้เกี่ยวข้องกับทั้งเว็บไซต์ของคุณและคำค้นหา
- ปัจจัยที่เกี่ยวข้องกับการค้นหาของผู้ใช้ เช่น ตำแหน่งที่ตั้งของผู้ใช้ ภาษาที่ใช้ค้นหา ตัวแก้ไขเจตนา ฯลฯ สิ่งเหล่านี้เกี่ยวข้องโดยตรงกับการค้นหาของผู้ใช้
ปัจจัยการชั่งน้ำหนักที่ใหญ่ที่สุดที่ใช้ในแบบจำลองทางสถิติคือ:

1. โฆษณาบนเพจ
โฆษณาบนเพจถูกมองว่าเป็นปัจจัยลบ ตามความเป็นจริงแล้ว เป็นปัจจัยที่มีน้ำหนักอันดับลบสูงสุด:

ปัจจัยที่เกี่ยวข้องกับโฆษณาหลายประการ เช่น จำนวนตำแหน่งโฆษณาบนหน้าและหากพื้นหลังสามารถคลิกได้ แนะนำว่ายานเดกซ์ไม่ชอบหน้าที่มีอัตราส่วนโฆษณาสูงต่อหน้าจอที่มองเห็นได้
2. ปัจจัยระดับ URL
การสร้าง URL เป็นอีกปัจจัยหนึ่งที่ยานเดกซ์คำนึงถึง และโดยเฉพาะอย่างยิ่ง:
- การมีอยู่ของตัวเลขใน URL
- จำนวนของเครื่องหมายทับ (“/”) ใน URL
- จำนวนตัวพิมพ์ใหญ่ใน URL
ย้อนกลับไปที่ข้อโต้แย้งที่ว่ายานเดกซ์ไม่ใช่ Google และการรั่วไหลนี้ก็ไม่มีประโยชน์ ปัจจัยของ URL เหล่านี้คล้ายกับหลักเกณฑ์ของโครงสร้าง URL ของ Google
3. ปัจจัยระดับหน้า
มีหลายสิ่งที่จะเปิดเผยที่นี่ ปรากฎว่ายานเดกซ์มีปัจจัยระดับเพจมากมายที่มีบทบาทในการสร้าง SERP สิ่งที่น่าสังเกตมากที่สุด ได้แก่ :
- ความใหม่ของหน้า - โดยเฉพาะอย่างยิ่งสำหรับเนื้อหาบล็อกและเว็บไซต์ข่าว เป็นปัจจัยด้านลบหากหน้าเนื้อหามีอายุมากกว่า 10 ปี ดังนั้นอัปเดตเนื้อหาของคุณบ่อยๆ
- ปลายทางสุดท้าย - ยานเดกซ์ให้รางวัลแก่เพจที่สิ้นสุดเส้นทางการค้นหาของผู้ใช้ หมายความว่าพวกเขาพบสิ่งที่ต้องการแล้ว
- อัตราส่วนแหล่งที่มาของการเข้าชมที่ดี - ยานเดกซ์ไม่ชอบหน้าเว็บที่ได้รับการเข้าชมจากแหล่งเดียว (เช่น การค้นหาทั่วไป) เพื่อให้เพจมีอันดับสูง จำเป็นต้องได้รับการเข้าชมจากแหล่งที่มาทุกประเภท - ทั่วไป จ่ายตรง ฯลฯ
- คุณภาพของเนื้อหา - จำเป็นอย่างยิ่งที่ข้อความของคุณจะต้องไม่ซ้ำกับคำหลัก เป็นการเพิ่มอันดับหากข้อความของคุณได้รับการอ้างอิง/เชื่อมโยงในโดเมนภายนอก นอกจากนี้ การมีเนื้อหาคุณภาพต่ำจะทำให้อันดับของเนื้อหาคุณภาพดีลดลง
4. ปัจจัยระดับเว็บไซต์
เมื่อพิจารณาจากปัจจัยความใหม่ของหน้าเว็บแล้ว การผสมผสานที่ดีที่สุดคือการมีเว็บไซต์ที่มั่นคงและใช้งานมาเป็นเวลานานและอัปเดตเนื้อหาบ่อยๆ
นอกจากนี้ Yandex ยังตัดสินคุณภาพโดยรวมของเว็บไซต์ด้วยมุมมองความสามารถในการคลิก กล่าวอีกนัยหนึ่ง ผู้ใช้คลิก URL สำหรับการค้นหาบ่อยเพียงใด
ปัจจัยด้านการจัดอันดับที่เป็นบวกอีกประการหนึ่งคือชื่อโดเมน Yandex ช่วยเพิ่มอันดับให้กับโดเมน .COM
5. คุณภาพของเพจ
เราได้พูดถึงคุณภาพเนื้อหาแล้ว แต่คุณภาพของหน้าโดยรวมล่ะ Yandex ประเมินคุณภาพของหน้าตามปัจจัยหลายประการ:

- จำนวนการเข้าชม
- จำนวนผู้เข้าชมที่ไม่ซ้ำ
- เวลาที่ใช้ในเพจ
- จำนวนการดำเนินการในหน้า
6. พฤติกรรมและการมีส่วนร่วมของผู้ใช้
มีพฤติกรรมของผู้ใช้ที่น่าสนใจหลายประการจากการรั่วไหลที่เราจำเป็นต้องพูดคุย
ปัจจัยสำคัญคือจำนวนคลิกและการแสดงผลโดยรวมที่โฮสต์ได้รับ ยานเดกซ์ยังพิจารณาว่าเพจนั้นเหมาะกับมือถือหรือไม่ และวิเคราะห์พฤติกรรมของผู้ใช้บนอุปกรณ์พกพา รวมถึงระยะเวลาเซสชันและเวลาที่ใช้ในเพจ นอกจากนี้ เมื่อผู้เยี่ยมชมกลับมาที่เว็บไซต์ภายในเดือนเดียวกัน นั่นเป็นปัจจัยในการจัดอันดับเชิงบวก
แต่สิ่งที่น่าสนใจที่สุดคือ:
หน้าเว็บที่แสดงบทวิจารณ์ของผู้ใช้จะได้รับความสำคัญในผลการค้นหา
7. อันดับโฮสต์และที่ตั้ง
ยานเดกซ์ให้ความสำคัญกับการจัดลำดับความสำคัญของเนื้อหาที่อยู่ใกล้กับผู้ใช้ในเชิงภูมิศาสตร์ ดังนั้นเมื่อชื่อโดเมนสองชื่อต่อสู้กันเพื่อการค้นหาคำค้นหาเดียวกัน ชื่อที่อยู่ใกล้กับผู้ใช้มากที่สุดจะได้รับการจัดอันดับที่เพิ่มขึ้น
ในแง่ของปัจจัยการจัดอันดับทางเทคนิค การลดจำนวนข้อผิดพลาดของไคลเอ็นต์ 400 รายการและข้อผิดพลาดของเซิร์ฟเวอร์ 500 รายการจะทำให้คุณนำหน้าใน SERP ยิ่งไปกว่านั้น Yandex ให้ความสำคัญกับความลึกในการรวบรวมข้อมูลเป็นอย่างมาก นั่นเป็นเหตุผลที่ต้องแน่ใจว่าไม่มีหน้าสำคัญใดที่ควรอยู่ห่างจากหน้าแรกของคุณมากกว่าสองคลิก
8. คุณภาพของลิงก์ย้อนกลับ
ยานเดกซ์ใช้มาตรการต่าง ๆ เพื่อลงโทษการสร้างเครือข่ายการอ้างอิงซึ่งเพิ่มความนิยมของเว็บไซต์เกินจริง
มาตรการหนึ่งคือการวิเคราะห์เปอร์เซ็นต์ของข้อความไฮเปอร์ลิงก์ เนื่องจากการเชื่อมโยงมากเกินไปอาจบ่งบอกถึงพฤติกรรมบิดเบือน นอกจากนี้ยังพิจารณาถึงคุณภาพของลิงก์ที่นำไปยังไซต์และลงโทษไซต์ที่มีลิงก์แบบเสียเงินหรือคุณภาพต่ำจำนวนมาก
เมื่อพูดถึงคุณภาพของลิงก์ ปัจจัยที่ส่งผลโดยตรงต่อคุณภาพลิงก์คือจำนวนการเปลี่ยนเส้นทางและวิธีการสร้างลิงก์
9. ผลกระทบต่อการเข้าชมการค้นหา
เช่นเดียวกับ Google เว็บไซต์ที่รวมแนวทางปฏิบัติ SEO ที่ดีจะทำงานได้ดีกว่าเว็บไซต์ที่ไม่มี การถูกค้นพบได้ง่ายเป็นวิธีที่แน่นอนในการได้รับการจัดอันดับที่สูงขึ้นบนยานเดกซ์
ไม่น่าแปลกใจเลยที่หน้าเว็บที่สามารถตอบสนองความต้องการในการค้นหาเป็นผู้นำสำหรับข้อความค้นหาที่เกี่ยวข้อง หน้าเว็บที่มีข้อความค้นหาตรงกันในแท็กชื่อเรื่องและข้อความเนื้อหาจะได้เปรียบกว่า นอกจากนี้ การใช้คำพ้องความหมายก็เป็นอีกหนึ่งสัญญาณเชิงบวกที่สามารถนำไปสู่การเพิ่มอันดับได้
10. เพิ่มวิกิพีเดีย
สัญญาณที่ชัดเจนอีกประการหนึ่งสำหรับหน้าเว็บคุณภาพสูงก็คือหากลิงก์มาจากวิกิพีเดีย ยานเดกซ์ชอบหน้าเว็บที่เชื่อมโยงจากวิกิพีเดียและจัดอันดับให้สูงขึ้น
11. เนื้อหาวิดีโอ
เว็บไซต์ที่มีเนื้อหาวิดีโอจะได้รับการจัดลำดับความสำคัญ แต่มีข้อผิดพลาดคือ Yandex จัดอันดับหน้าที่สูงขึ้นด้วยวิดีโอที่โฮสต์โดย Yandex (duh)
ในแง่ของการประเมินเนื้อหาวิดีโอของเพจ จะใช้มาตรการมาตรฐาน นั่นคือ เวลาในการดูเฉลี่ยเทียบกับความยาวทั้งหมดของวิดีโอ
และในขณะที่การค้นพบทั้ง 11 ข้อนี้ให้ข้อมูลเชิงลึกที่ยอดเยี่ยม แต่ก็มีการถกเถียงกันในโลกของ SEO ว่าข้อมูลที่รั่วไหลนั้นมีค่าหรือไม่
ปฏิกิริยาต่อปัจจัยการจัดอันดับที่รั่วไหลในโลก SEO
ตั้งแต่การเลิกจ้างทันทีไปจนถึงการวิเคราะห์เชิงลึก SEOs แสดงความคิดเห็นที่หลากหลายเกี่ยวกับการรั่วไหลของยานเดกซ์
Kevin Indig สรุปข้อโต้แย้งที่พบบ่อยที่สุดและเสนอข้อมูลที่ดีเกี่ยวกับความสำคัญของปัจจัยการจัดอันดับ

ตัวอย่างจากบทความ “SEOs are underestimating The Yandex leak” โดย Kevin Indig
บุคคลที่มีชื่อเสียงในแวดวง SEO เช่น Ben Wills, Alex Buraks และ Mic King ต่างถวิลหาและเจาะลึกเพื่อถอดรหัสข้อมูลที่รั่วไหลออกมา
Ben Wills เป็นหนึ่งในผู้เชี่ยวชาญกลุ่มแรกๆ ที่เข้าใจซอร์สโค้ดและช่วยให้เราเข้าใจความสำคัญของเหตุการณ์ (แม้ว่าเขาจะเปิดเธรด Twitter ในภายหลังก็ตาม)

ในเวลาเดียวกัน Rob Ousbey ได้แบ่งปันเครื่องมือสำรวจรุ่นอัลฟ่าสำหรับรหัสยานเดกซ์:

Mic King แบ่งปันความประทับใจแรกของเขาแบบสดๆ ในขณะที่ดูซอร์สโค้ด โดยบอกเราว่า “อย่านอนกับโค้ดนี้”

ฟอรัม SEO ในรัสเซียก็มีผู้คนหนาแน่นไม่น้อย และผู้ดูแลเว็บก็มีข้อมูลเชิงลึกที่คล้ายคลึงกันที่จะแบ่งปันในฐานะโลก SEO ของตะวันตก อย่างไรก็ตาม ยังมีการพูดคุยกันมากมายเกี่ยวกับ Yandex ที่ชื่นชอบผลิตภัณฑ์และบริการของบริษัท ดังที่ Dan Taylor ผู้เชี่ยวชาญด้าน SEO ของรัสเซียกล่าวถึง
บทสรุป
การรั่วไหลของซอร์สโค้ด Yandex จะเปลี่ยนวิธีการทำ SEO ของคุณหรือไม่?
อาจจะไม่.
แต่มันจะเป็นความผิดพลาดอย่างใหญ่หลวงที่จะติดป้ายว่าไม่สำคัญและเลื่อนผ่านไป
เห็นได้ชัดว่ามีความคล้ายคลึงกันมากระหว่าง Yandex และ Google ดังนั้น การรั่วไหลนี้จึงเป็นจุดเริ่มต้นที่ดีสำหรับการทดลองเพิ่มเติม และผลักดันให้คุณมุ่งเน้นไปที่ประสบการณ์ของผู้ใช้และเนื้อหาที่มีคุณภาพมากยิ่งขึ้น
ดังนั้นให้คุกเข่าลงและเริ่มการทดสอบ
