Yandex 源代碼洩漏揭示了有關搜索引擎的內容

已發表: 2023-02-17

有沒有想過 Google、Bing 和 Yahoo 等搜索引擎巨頭的內部情況?

2023 年 1 月 27 日,全球第四大搜索引擎 Yandex 在發生大規模(準確地說是 44GB)數據洩露後登上了頭條新聞。

“因此,俄羅斯最受歡迎的搜索引擎遭到入侵。 它與我有什麼關係?” 你可能會問。

許多新聞頻道將其視為針對公司和客戶數據安全的惡意行為,但數字專家將其評估為對搜索引擎運作方式的罕見洞察。

更重要的是,他們優先考慮哪些內容以及原因。

數據洩露公開了我們最初認為的 1,922 個排名因素,但多虧了 Ben Wills,該數字被更正為 17,853。 很大,對吧?

Yandex 上的 Mic King 推文

我們遍歷了所有 1,992 個。

繼續閱讀以了解我們發現最有趣的內容。


我可以利用從 Yandex 洩漏中學到的知識來提高在 Google 上的排名嗎?

不用說,Yandex 不是谷歌。

但是有幾個值得注意的因素使這次洩密在俄羅斯境外和您的搜索排名實驗中具有相關性(和教育意義):

  • Yandex 和 Google 搜索結果之間的匹配度約為 70%
  • Yandex 使用 PageRank(與 Google 中的幾乎相同)
  • Yandex 僱傭了很多前谷歌員工,許多人推測它是以類似的方式設計的
  • Yandex 遵循與 Google 類似的信息檢索最佳實踐,例如反向索引或嵌入
  • 就像 Google 和 Bing 搜索引擎一樣,Yandex 使用 Okapi BM25 排名函數來估計文檔與給定搜索查詢的相關性

Alex Buraks 在 Yandex 上發推文

話雖這麼說,Yandex 源代碼洩漏所揭示的內容首次幫助我們更好地區分假設和知道搜索排名是如何工作的。

Yandex 代碼洩漏內部:關於搜索引擎如何運作的 11 項調查結果

通常,Yandex 排名因素可以分為三類:

  • 靜態因素,如入站反向鏈接、入站內部鏈接、標題、廣告比例等。這些與您的網站有關。
  • 文本相關性、關鍵字包含等動態因素。這些都與您的網站和搜索查詢有關。
  • 用戶搜索相關因素,如用戶位置、查詢語言、意圖修飾符等。這些與用戶查詢直接相關。

統計模型中使用的最大權重因素是:

Yandex 權重因子

1.頁面廣告

頁面上的廣告被視為負面因素。 事實上,它是負排名權重最高的因素:

Mic King Tweet on Yandex 排名因素權重

多個與廣告相關的因素,如頁面上的廣告展示位置數量以及背景是否可點擊,表明 Yandex 不喜歡廣告與可見屏幕比例高的頁面。

2. URL 級因素

URL 的構造是 Yandex 考慮的另一個因素。 更具體地說:

  • URL 中存在數字。
  • URL 中尾部斜杠(“/”)的數量
  • URL中大寫字母的數量

回到 Yandex 不是 Google 的論點,這種洩漏不會有價值,好吧,這些 URL 因素與 Google 的 URL 結構指南中的因素非常相似。


3.頁面級因素

這裡有很多東西要展開。 事實證明,Yandex 有許多頁面級因素在構建 SERP 中發揮作用。 一些最著名的包括:

  • 頁面新鮮度——尤其是博客內容和新聞網站。 如果內容頁面超過 10 年,這是一個負面的排名因素。 所以經常更新你的內容。
  • 最後目的地- Yandex 獎勵結束用戶搜索旅程的頁面,這意味著他們已經找到了他們正在尋找的東西。
  • 健康的流量來源比例——Yandex 不喜歡從單一來源(例如自然搜索)獲取流量的頁面。 為了讓頁面排名靠前,它需要從各種來源獲得流量——自然流量、付費流量、直接流量等。
  • 內容質量- 您的文本必須是原創的,而不是塞滿關鍵字,這一點至關重要。 如果您的文本已在外部域中被引用/鏈接,這將提升排名。 此外,質量差的內容會降低優質內容的排名。

4. 網站層面的因素

基於頁面新鮮度因素,最終的組合將是擁有一個長期活躍並經常更新其內容的完善網站。

此外,Yandex 從可點擊性的角度來判斷網站的整體質量。 換句話說,用戶點擊 URL 進行搜索的頻率如何?

另一個積極的排名因素是域名。 Yandex 提高了 .COM 域的排名。


5.頁面質量

我們已經討論了內容質量,但是整體頁面質量呢? 那麼,Yandex 會根據以下幾個因素評估頁面質量:

  • 訪問次數
  • 獨立訪客數量
  • 在頁面上花費的時間
  • 在頁面上執行的操作數

6. 用戶行為和參與

我們需要討論從洩漏中得出的幾個有趣的用戶行為要點。

一個關鍵因素是主機收到的總體點擊次數和印像數。 Yandex 還會考慮頁面是否適合移動設備並分析用戶在移動設備上的行為,包括會話持續時間和在頁面上花費的時間。 此外,當訪問者在同一個月內返回網站時,這是一個積極的排名因素。

但可能最吸引人的是:

以用戶評論為特色的頁面在搜索結果中具有優先權。

7.主機排名和位置

Yandex 非常重視優先考慮地理位置靠近用戶的內容。 因此,當兩個域名爭奪同一個搜索查詢時,離用戶較近的域名將獲得排名提升。

在技​​術排名因素方面,減少 400 個客戶端錯誤和 500 個服務器錯誤的數量將使您在 SERP 中領先。 最重要的是,Yandex 非常注重抓取深度。 這就是為什麼要確保任何重要頁面與您的主頁之間的距離都不應超過兩次點擊。


8.反向鏈接質量

Yandex 採用各種措施來懲罰推薦鏈的創建,這會人為地提高網站的知名度。

其中一項措施是分析超鏈接文本的百分比,因為過多的鏈接可能表明存在操縱行為。 它還會考慮指向站點的鏈接的質量,並對具有大量付費或低質量鏈接的站點進行懲罰。

說到鏈接質量,直接影響鏈接質量的因素是重定向的數量和鏈接的構建方式。


9. 對搜索流量的影響

與穀歌類似,採用良好 SEO 做法的網站比不採用的網站表現更好。 容易被發現是在 Yandex 上獲得更高排名的必經之路。

毫不奇怪,可以服務於搜索意圖的頁面是相應搜索查詢的領導者。 標題標籤和正文中包含精確搜索查詢的頁面具有優勢。 此外,同義詞的使用是另一個可以提高排名的積極信號。


10.維基百科提升

高質量頁面的另一個重要信號是它是否鏈接自維基百科。 Yandex 偏愛從維基百科鏈接的頁面並將它們排名更高。

11.視頻內容

包含視頻內容的網站優先。 但有一個問題,Yandex 對 Yandex 託管的視頻的頁面排名更高(duh)。

在評估頁面的視頻內容方面,適用標準衡量標準 - 平均觀看時間與視頻總長度的比值。

雖然所有這 11 項調查結果都提供了一些很好的見解,但在 SEO 世界中存在一些關於洩露數據是否有價值的爭論。

對 SEO 世界中洩露的排名因素的反應

從徹底駁回到深入分析,SEO 對 Yandex 洩密事件表達了不同的看法。

Kevin Indig 總結了最常見的反對意見,並就排名因素的重要性提供了重要意見。

摘自 Kevin Indig 關於 Yandex 數據洩露的文章
摘自 Kevin Indig 的文章“SEO 低估了 Yandex 洩密事件”

SEO 領域的知名人士,如 Ben Wills、Alex Buraks 和 Mic King,捲起袖子深入研究洩露的數據。

Ben Wills 是第一批理解源代碼並幫助我們掌握事件意義的專家之一(儘管他稍後才打開 Twitter 線程)。

本·威利斯在 yandex 上發推文

大約在同一時間,Rob Ousbey 分享了一個用於 Yandex 代碼的探索器工具的 alpha 版本:

Rob Ousbey 在 Yandex 上發推文

Mic King 在查看源代碼時現場分享了他的第一印象,告訴我們,“不要在這段代碼上睡大覺。”

Yandex 上的 Mic King 推文


俄羅斯的 SEO 論壇同樣擁擠,網站管理員與西方 SEO 世界有著相似的見解。 然而,也有很多關於 Yandex 偏愛其產品和服務的討論,正如俄羅斯 SEO 專家 Dan Taylor 所報導的那樣。

結論

Yandex 源代碼洩漏會改變您進行 SEO 的方式嗎?

可能不是。

但是將它標記為不重要並滾動過去將是一個巨大的錯誤。

顯然,Yandex 和 Google 之間有很多相似之處。 因此,這次洩漏可以作為進行更多實驗的一個很好的起點,並促使您更加關注用戶體驗和優質內容。

所以屈服並開始測試。