分析最大中文搜索引擎的百度-SEO排名因素
已發表: 2020-10-31再深入一點——分析最大的中文搜索引擎百度的排名因素
過去,我們以及其他組織和個人已經發表了許多谷歌排名因素相關性研究,但到目前為止,還沒有人對百度排名因素進行系統分析。
談到百度,許多 SEO 會根據 Google 的工作原理來考慮 SEO。
雖然這並不是一個糟糕或錯誤的方法,但事實是,它在他們的方法中留下了巨大的漏洞——有些東西根本不像谷歌,這就是我整理的這項研究令人興奮的地方,我們為您提供免費下載。
下載研究
方法
2020 年年中,我分析了大約 50,000 個中文搜索詞在百度自然搜索結果中排名前 10 的頁面的 URL 和索引片段。
選擇檢索詞的規則如下:
- 100% 中文(無數字、無拉丁字母、無阿拉伯語、日語或其他語言)
- 100% 簡體中文(沒有台灣或香港中文通用的長字符)
- 關鍵字的長度在 2 到 8 個字符之間。
相信誰?
百度 SEO 專家提出了許多相互矛盾的意見,這使得 SEO 很難知道該相信誰。 一個例子是關於國家代碼頂級域 (ccTLD) 的主題。
例如,Fabernovel 的 SEO 專家、ISTE Ltd. 出版的百度 SEO 的作者 Veronique Duong 表示,在嘗試在百度中獲得良好排名時,擁有 ccTLD 具有優勢。
前端開發人員和 SEMRush 百度 SEO 指南的作者 Gary Stevens 支持這樣的信念:“獲取 .cn 或不要打擾。 百度在其搜索結果排名中強烈支持 .cn 域後綴(中國的國家代碼)而不是 .com。”
Dragon Metrics 聲稱使用中文 ccTLD 可能不是排名因素——我可以驗證它們確實是正確的! 2017 年我明確反駁了這個神話,今年我詳細的百度排名分析再次證實了這一點。
擁有 .com.cn 或 .cn 域名並不能保證任何排名優勢。

圖:百度前 10 名中的頂級域名分佈(不包括百度自有資產)
很明顯,通用.com頂級域名是迄今為止百度 SERP 中最主要的域名擴展(不包括百度擁有的資產,占前 10 名排名的 50% 左右。下載研究以了解有關百度主導地位的更多信息)。
不過,擁有 ccTLD 並不是劣勢:百度前 10 名(不包括百度擁有的網站)中 9% 的 TLD 是中國的 ccTLD,例如.cn、.com.cn、org.cn 和 .net.cn。
我並不是說存在與 TLD 相關的明確排名信號,數據根本沒有表明這一點。
另一個神話破滅 - HTTP 與 HTTPS
許多百度搜索引擎優化博主已經得出結論,在百度宣布將其用作信號後,將您的網站設置為 https 是排名因素。
研究發現,前 10 名中超過 50% 的搜索結果是 https 網址……但沒有明確的相關性表明它絕對是排名因素。 如果 50% 的 URL 排名不使用 https,那麼很明顯,如果 SEO 沒有切換到 https,這對他們來說不是一個交易破壞者。
當然,我會建議任何想在中國取得成功的網站所有者對他們的網站進行加密。 不僅因為它具有邏輯意義,而且因為它很可能是一個排名因素,時間會證明一切。 但是,要注意的關鍵是您不應期望從中獲得很大的排名優勢。

圖表:每個頁面 1 排名位置的 https URL 百分比(1 到 10)
子域使用令人驚訝
我仍然堅信,百度在不同的子域中分配根本不同的用戶意圖對 SEO 是有利的。
我對結果中關於子域使用情況的發現感到驚訝。
在子域名方面,中國大玩家處於領先地位。 中國許多最大的品牌都在www子域上託管其核心業務,但它們的不同站點部分——客戶支持、常見問題解答、用戶論壇、幫助論壇、圖片庫、視頻門戶、Wiki 等——都託管在獨特的、獨立的子域。
但是,有一個明確的跡象表明排名前 10 的頁面託管在 www 子域上。
即使這種相關性看起來像一個排名因素,我基於數據的信念是它只是一個相關性,而不是一個確定的排名因素。 許多公司在 www 域上發佈各自的核心業務這一事實使我得出了這個結論。

圖表:www 的百分比。 每個頁面的子域 1 排名位置(1 到 10)
因為百度更喜歡每個網站和每個子域的用戶焦點,我的建議是:如果為中國市場選擇一個獨立的域,核心業務應該放在 www 子域(例如 www.mychinesedomain.com),而進一步用戶意圖(博客、論壇、問答等)應迎合併託管在不同的子域上。

另一方面,如果國際化的子域策略已經在使用,例如 cn.mydomain.com,我將構建網站以這種方式 cn.mydomain.com/forum/ 拆分用戶意圖,因為這是實現與子域的清晰結構分離的下一個最佳方法。
但這開始變得有點哲學化了,我相信其他人會以不同的方式看待事情,請在下面的評論中告訴我你的想法。
對網站內容的一些(不足為奇的)見解
超過 98% 的排名靠前的頁面都使用簡體中文,這對中國愛好者和任何密切關注中國數字環境的人來說都不會感到驚訝。
繁體字主要在香港和台灣使用,數據顯示,使用過多的繁體字可能會降低您在百度搜索結果中的成功機會。
再深入一點,一般來說,頁面內容由 57% 的漢字組成(其餘 43% 由拉丁字母、數字、標點符號和空格組成)和 100% 由漢字組成的搜索詞的排名.


標題標籤和描述
索引片段解釋
在此圖像中,漢字由小方塊表示。

一份關於我們的研究報告的下載邀請
- 99% 的 Top 10 Ranked Pages 指的是中國社交媒體渠道
- 排名前 10 的頁面的平均長度為 3,194 個字符,其中頂部頁面的字符最多
- 排名前 10 的頁面平均包含 28 張圖片 (<img>),其中 60% 使用 alt 屬性
- 17.6% 的頁面平均使用 8 個表 (<table>)
- 88.7% 的頁面平均使用 10 個未排序列表 (<ul>),只有 7.9% 的頁面平均使用 2 個已排序列表 (<ol>)
下載完整的研究
希望提高您在百度和谷歌的排名? 研究您在中國和國際上的競爭對手? 發現您的 SEO 中的差距?
我們可以幫忙! 保持聯繫!
