SEO 的重要 HTTP 状态代码指南

已发表: 2020-10-22

在进行技术 SEO 审核或诊断网站的技术问题时,对于 SEO 来说,了解最常见的 HTTP 状态代码是什么以及何时应该使用它们非常重要。 本文将解释它们是什么,它们发生的时间和原因,以及最重要的是如何有效地利用它们。

  • 什么是 HTTP 状态码?
  • 最常见的状态码是什么?
  • 如何检查和测试状态码?
  • 有哪些不同类别的状态代码?

什么是 HTTP 状态码?

每次您访问网站上的新页面(或网络上任何地方的页面)时,您的浏览器都会向该网站的服务器发送一个请求。 对请求的响应是来自服务器的三位数代码——这是 HTTP 状态代码。 此代码确认来自客户端的请求并表示来自服务器的响应。

有数百种不同的代码,每个代码都有不同的用途。 这些代码可让您了解页面是否正常运行或是否存在问题,以及如果存在,发生了什么问题。

当机器人抓取一个网站时,它会以与浏览器相同的方式请求网页——HTTP 代码指导这种交换。

SEO 专家可以在网站上实施某些代码,为用户和机器人创建不同的旅程。 也就是说,在抓取网站时更改用户或机器人的路径。 状态代码也可用于传递或阻止流经页面的链接资产。

由于搜索引擎对这些代码的处理方式不同,因此正确使用它们很重要! 如果代码使用不正确,您的网站可能会面临重大的技术 SEO 问题。

这就是为什么搜索引擎优化 (SEO) 专家需要了解 HTTP 协议以及这些协议如何影响机器人抓取和索引页面的原因。

SEO 专家还需要了解常见的状态代码,以告知技术 SEO 策略并诊断网站上的问题。

下面,我们将分解常见的 HTTP 代码、何时使用这些代码以及如何实现这些代码以实现最佳实践 SEO。

最常见的状态码是什么?

  • 200(确定)
  • 301(永久移动)
  • 302(临时搬家)
  • 307(临时重定向)
  • 404(未找到)
  • 410(消失)
  • 500内部服务器错误)
  • 503(服务错误)

您如何检查和测试状态代码?

有多种工具可用于检查 URL 的 HTTP 状态代码,其中一些工具比其他工具更有效。

使用内置浏览器工具检查 HTTP 状态码

要访问 Chrome 的内置工具,请打开 Chrome DevTools 并访问“网络”选项卡以查看网络活动。

用户经常发现这个工具有点笨拙,并且在测试 URL 时更喜欢使用浏览器插件工具(见下文)。

使用浏览器插件(重定向路径)检查 HTTP 状态码

Redirect Path 是 Ayima 的一个流行的浏览器插件。 此工具允许全面探索 HTTP 响应。 Chrome 插件可以在这里下载。

Ayima 网站的响应代码示例——有一个 301 重定向到他们网站的 HTTPS 版本。

这是我们使用重定向路径的 URL 的完整 HTTP 响应

使用 Google Search Console 检查 HTTP 状态码

Google Search Console 中的 URL 检查功能允许您请求 HTTP 响应。

请求 URL 后,打开“覆盖面板”。 其中,“Page fetch”定义了 HTTP 响应。

当我们请求 URL:https://www.semetrical.com/technical-seo/ 时,该工具会返回代表 200 Ok 状态代码的“Successful”响应。

有哪些不同类别的状态码?

有不同类别的状态代码,SEO 应该从记忆中知道它们 - 了解这些将导致更有效地找到问题的原因。 他们是:

  • 2xx – 客户端成功:对服务器的请求成功。 这意味着浏览器给出了预期的响应,即网页加载成功。
  • 3xx 重定向:成功接收到服务器请求,服务器已将您重定向到另一个页面。 即您从页面 A > 页面 B 重定向
  • 4xx 客户端错误:请求的页面无效/无法加载,原因是客户端出现问题,即找不到页面或无法加载页面。
  • 5xx 服务器错误:客户端发出了有效的请求,但服务器未能加载请求。

2xx – 客户成功代码

这些代码表示页面已成功获取,对于用户而言,这意味着页面已按预期加载。 通常,2xx 请求对用户不可见,但由机器人处理。

200 - 好的

200 代码是互联网上最常见的代码——它代表您点击的页面正确加载。 这是浏览器和网页之间最常见的交换。 200 不需要任何操作。

对于 SEO,200 个代码在页面之间传递链接公平性。

3xx – 重定向代码

当您从一个页面重定向到另一个页面时,服务器将发出 3xx 响应。 重定向可以是临时的,也可以是永久的,由不同的代码来区分。

301 - 永久重定向

301 状态代码是 SEO 中流行的代码——它告诉浏览器一个网页已永久移动到另一个页面(这意味着 URL 已更改)。 用户和机器人都将从旧页面重定向到具有 301 的新目标页面。

尽管有一些猜测,但业内普遍认为 301 重定向会将有价值的链接资产从旧页面传递到新重定向的页面——这意味着使用 301 重定向不会失去排名能力!

对于搜索引擎,301 表示从其索引中删除旧页面并将旧页面指标与新页面相关联。

SEO 应用程序:当您需要将一个页面永久重定向到新的页面地址时,您应该始终使用 301。 例如,从 HTTP 迁移到 HTTPS 时,使用 301 重定向从每个 HTTP 页面到其各自的 HTTPS 版本。

SEO 提示:始终 301 将页面重定向到其最终目的地! 如果您不这样做,您可能会创建重定向链,机器人必须通过这些重定向链才能找到目标页面——这将降低您网站的可抓取性!

例如,来自页面 A > 页面 B > 页面 C 的 301 将导致技术问题。

其最佳实践为 301 Page A > Page C。

302 - 临时重定向

与 301 一样,302 重定向告诉浏览器页面已移动,关键区别在于 302 是临时页面重定向。

当用户和机器人被发送到新的目标页面时,搜索引擎会将原始页面保留在其索引中。

302 重定向的这种临时性质意味着没有链接权益被传递到新页面——因为谷歌知道原始页面将在短时间内被激活。

SEO 应用程序:当您暂时想要将机器人和用户从一个页面移动到新的目标页面时,应用 302 重定向。

例如,在测试新登陆页面的有效性时,您将实施 302 重定向,以便登陆页面从页面 A > 页面 B 移动。测试期结束后,删除 302。

重要的是要记住,302 重定向确实会将链接资产从一个页面传递到另一个页面。 如果 302 重定向在设定的时间后没有被移除,来自原始页面的链接资产将丢失并阻止流经网站 - 损害网站的排名力!

307 - 临时重定向/内部重定向

临时重定向:

307 相当于 302 重定向。 不同之处在于 307 保证客户端遵循将用户和机器人引导到新的临时页面的请求。 较旧的客户端页面可能不遵守重定向,这可能会导致问题。

作为临时重定向,链接权益不会从旧 URL 传递到目标 URL,搜索引擎会将旧 URL 保留在其索引中。

内部重定向:

307重定向也可以理解为浏览器重定向,而不是服务器重定向。 当浏览器从 HTTP 重定向到 HTTPS 时会提供 307。

如果站点在 HSTS 服务器预加载列表中,或者之前已请求浏览器这样做,浏览器将在内部将用户和机器人重定向到站点的 HTTPS 版本。

需要注意的是,HSTS 预加载列表中的网站会告诉浏览器提供 HTTPS。

例如,用户可能请求访问 http://yourseowebsite.com,但浏览器将使用 307 覆盖此访问 https://yourseowebsite.com。 此重定向可防止对不安全站点(使用 HTTP 的站点)的请求。

跨浏览器支持 HSTS,有关此的更多信息可以在这里找到 https://hstspreload.org/。

SEO 应用程序:应应用 307 以确保内部重定向是安全的。

4xx – 客户端错误代码

当页面无法访问时,服务器会发送一个 4xx 代码 - 网页上会出现一条错误消息。 这些代码表示为什么无法从客户端评估页面。

404页面不存在

最常见的 4xx 代码是 404。这是来自服务器的响应,即无法找到所请求的页面。 用户将无法访问该页面。

如果网站所有者已删除站点上的页面,但该页面仍与内部链接,则可能会故意发生 404。 或者,这些可能是由于系统中的错误而意外发生的——应不惜一切代价避免这些意外的 404,并强调查看您网站上的 404 页面的重要性。

尽管目前无法访问 404 页面,但它们仍在 Google 的索引中。 一段时间后,如果页面被重复爬取并返回此错误,这些页面将从索引中删除。

尽管如此,404 不应被视为负面因素。 有一些策略方法可以实现这些错误,以帮助从 Google 的索引中删除页面,并且有机会创建用户友好的 404 页面,这是 Google 的建议!

SEO 应用程序: SEO 有机会将 404 页面错误页面 301 重定向(永久移动)到活动 URL。 例如,具有高流量和链接资产的有价值页面(类别中心页面)应该 301 重定向到站点上的另一个相关页面。

在某些情况下,保留 404 页面变得具有战略意义——这将有助于从 Google 的索引中删除页面,因为它不会被搜索引擎抓取。 在这种情况下,创建一个自定义 404 页面,用户可以在其中使用关键内部链接进入您网站的其他区域。 当用户面对 404 页面时,这将防止较高跳出率的潜在负面影响。

410 - 页面已消失

410 错误代码类似于 404,不同之处在于 410 表示页面已被永久删除。 当网站所有者故意删除页面时会发生 410 - 该页面将不再可从服务器获得。

对于爬取页面的用户和机器人来说,410 错误页面是一个死胡同,因此应该删除指向这些页面的内部链接。

对于搜索引擎,410 页面是从其索引中删除该页面的直接信号。 因此,410 对 SEO 可能很强大,但应谨慎使用。

SEO 应用程序: 410 状态代码应仅应用于要永久删除且永不返回的页面。 如果页面将暂时不可用,则应应用 404 状态代码。

5xx – 服务器错误代码

当客户端向服务器发出有效请求,但服务器无法处理该请求时,将提供 5xx 错误代码。 对于用户,页面将不会加载,对于机器人,页面将无法抓取。 这些错误可能会给 SEO 带来很大的问题。

如果服务器响应 5xx 错误,则站点的爬取效率会降低,甚至更糟的是,机器人在错误修复之前不会爬取站点。

对爬网率的影响可能意味着新内容索引的延迟,甚至整个网站的有机可见性丧失。

对于 Google 而言,为用户提供积极的用户体验至关重要,5xx 页面错误会损害这一点,应该不惜一切代价避免。

500 – 内部服务错误

500 错误表示服务器存在问题,但未指定问题。 这意味着服务器无法提供请求的页面。

链接资产不会流经这些页面,对于用户和机器人来说,这些页面都是死胡同。 如上所述,搜索引擎会减少对存在这些错误的网站的抓取预算,因此一旦发现 500 个错误,就必须立即调查并修复它们。

SEO 应用程序:500 个错误会损害您网站的可抓取性,因此了解这些错误何时发生非常重要。 安排例行检查 500 个错误页面是一种减少这种情况的方法,Google Search Console 中有报告可以找到出现此错误的页面。

503服务不可用

提供 503 错误的页面表明服务器暂时不可用。 对人类和机器人的页面响应是稍后再检查。 503 代码可能由于临时错误而发生,例如服务器过载或服务器维护。

与 500 错误类似,Google 在遇到此错误时会降低其抓取速度。 但是,由于 503 是短期错误,一旦 503 错误得到纠正,Google 将保留其索引中的页面准备为用户提供服务 - 503 不会失去排名能力!

需要注意的是,如果长时间提供 503,Google 会将其视为 500。

SEO 应用程序:如果您的站点正在维护中,则提供 503 将确保爬虫稍后回来,当站点准备好被爬取时。

我们希望通过阅读本文,您了解 HTTP 状态码的重要性、它们之间的区别以及何时应该使用它们。 一旦您掌握了优先级状态代码之间的区别,就可以更快地诊断网站上的问题。

如果您的网站遇到技术 SEO 问题,请访问我们的技术 SEO 服务页面了解更多信息。