分析最大中文搜索引擎的百度-SEO排名因素
已发表: 2020-10-31再深入一点——分析最大的中文搜索引擎百度的排名因素
过去,我们以及其他组织和个人已经发表了许多谷歌排名因素相关性研究,但到目前为止,还没有人对百度排名因素进行系统分析。
谈到百度,许多 SEO 会根据 Google 的工作原理来考虑 SEO。
虽然这并不是一个糟糕或错误的方法,但事实是,它在他们的方法中留下了巨大的漏洞——有些东西根本不像谷歌,这就是我整理的这项研究令人兴奋的地方,我们为您提供免费下载。
下载研究
方法
2020 年年中,我分析了大约 50,000 个中文搜索词在百度自然搜索结果中排名前 10 的页面的 URL 和索引片段。
选择检索词的规则如下:
- 100% 中文(无数字、无拉丁字母、无阿拉伯语、日语或其他语言)
- 100% 简体中文(没有台湾或香港中文通用的长字符)
- 关键字的长度在 2 到 8 个字符之间。
相信谁?
百度 SEO 专家提出了许多相互矛盾的意见,这使得 SEO 很难知道该相信谁。 一个例子是关于国家代码顶级域 (ccTLD) 的主题。
例如,Fabernovel 的 SEO 专家、ISTE Ltd. 出版的百度 SEO 的作者 Veronique Duong 表示,在尝试在百度中获得良好排名时,拥有 ccTLD 具有优势。
前端开发人员和 SEMRush 百度 SEO 指南的作者 Gary Stevens 支持这样的信念:“获取 .cn 或不要打扰。 百度在其搜索结果排名中强烈支持 .cn 域后缀(中国的国家代码)而不是 .com。”
Dragon Metrics 声称使用中文 ccTLD 可能不是排名因素——我可以验证它们确实是正确的! 2017 年我明确反驳了这个神话,今年我详细的百度排名分析再次证实了这一点。
拥有 .com.cn 或 .cn 域名并不能保证任何排名优势。

图:百度前 10 名中的顶级域名分布(不包括百度自有资产)
很明显,通用.com顶级域名是迄今为止百度 SERP 中最主要的域名扩展(不包括百度拥有的资产,占前 10 名排名的 50% 左右。下载研究以了解有关百度主导地位的更多信息)。
不过,拥有 ccTLD 并不是劣势:百度前 10 名(不包括百度拥有的网站)中 9% 的 TLD 是中国的 ccTLD,例如.cn、.com.cn、org.cn 和 .net.cn。
我并不是说存在与 TLD 相关的明确排名信号,数据根本没有表明这一点。
另一个神话破灭 - HTTP 与 HTTPS
许多百度搜索引擎优化博主已经得出结论,在百度宣布将其用作信号后,将您的网站设置为 https 是排名因素。
研究发现,前 10 名中超过 50% 的搜索结果是 https 网址……但没有明确的相关性表明它绝对是排名因素。 如果 50% 的 URL 排名不使用 https,那么很明显,如果 SEO 没有切换到 https,这对他们来说不是一个交易破坏者。
当然,我会建议任何想在中国取得成功的网站所有者对他们的网站进行加密。 不仅因为它具有逻辑意义,而且因为它很可能是一个排名因素,时间会证明一切。 但是,要注意的关键是您不应期望从中获得很大的排名优势。

图表:每个页面 1 排名位置的 https URL 百分比(1 到 10)
子域使用令人惊讶
我仍然坚信,百度在不同的子域中分配根本不同的用户意图对 SEO 是有利的。
我对结果中关于子域使用情况的发现感到惊讶。
在子域名方面,中国大玩家处于领先地位。 中国许多最大的品牌都在www子域上托管其核心业务,但它们的不同站点部分——客户支持、常见问题解答、用户论坛、帮助论坛、图片库、视频门户、Wiki 等——都托管在独特的、独立的子域。
但是,有一个明确的迹象表明排名前 10 的页面托管在 www 子域上。
即使这种相关性看起来像一个排名因素,我基于数据的信念是它只是一个相关性,而不是一个确定的排名因素。 许多公司在 www 域上发布各自的核心业务这一事实使我得出了这个结论。

图表:www 的百分比。 每个页面的子域 1 排名位置(1 到 10)
因为百度更喜欢每个网站和每个子域的用户焦点,我的建议是:如果为中国市场选择一个独立的域,核心业务应该放在 www 子域(例如 www.mychinesedomain.com),而进一步用户意图(博客、论坛、问答等)应迎合并托管在不同的子域上。

另一方面,如果国际化的子域策略已经在使用,例如 cn.mydomain.com,我将构建网站以这种方式 cn.mydomain.com/forum/ 拆分用户意图,因为这是实现与子域的清晰结构分离的下一个最佳方法。
但这开始变得有点哲学化了,我相信其他人会以不同的方式看待事情,请在下面的评论中告诉我你的想法。
对网站内容的一些(不足为奇的)见解
超过 98% 的排名靠前的页面都使用简体中文,这对中国爱好者和任何密切关注中国数字环境的人来说都不会感到惊讶。
繁体字主要在香港和台湾使用,数据显示,使用过多的繁体字可能会降低您在百度搜索结果中的成功机会。
再深入一点,一般来说,页面内容由 57% 的汉字组成(其余 43% 由拉丁字母、数字、标点符号和空格组成)和 100% 由汉字组成的搜索词的排名.


标题标签和描述
索引片段解释
在此图像中,汉字由小方块表示。

一份关于我们的研究报告的下载邀请
- 99% 的 Top 10 Ranked Pages 指的是中国社交媒体渠道
- 排名前 10 的页面的平均长度为 3,194 个字符,其中顶部页面的字符最多
- 排名前 10 的页面平均包含 28 张图片 (<img>),其中 60% 使用 alt 属性
- 17.6% 的页面平均使用 8 个表 (<table>)
- 88.7% 的页面平均使用 10 个未排序列表 (<ul>),只有 7.9% 的页面平均使用 2 个已排序列表 (<ol>)
下载完整的研究
希望提高您在百度和谷歌的排名? 研究您在中国和国际上的竞争对手? 发现您的 SEO 中的差距?
我们可以帮忙! 保持联系!
