如何为 Google Search Console 和 SEO 构建动态 XML 站点地图
已发表: 2017-03-24
在这一点上,“XML 站点地图”是许多营销人员甚至对 SEO 有一般了解的小企业主至少都知道的东西。 但是,当我登录到客户端 Google Search Console 帐户时,仍然很常见地看到没有提交 XML 站点地图,或者有许多错误和/或未提交的页面。 在这篇文章中,我们将介绍一些生成站点地图并将其提交到 Google Search Console 的技巧,该站点地图将随您的站点一起扩展。
什么是 XML 站点地图?
对于那些不熟悉的人来说,首先要了解的是:站点地图基本上是您网站所有 URL 的列表。 通过 Google Search Console(以前的 Google 网站管理员工具)向 Google 提交 XML 站点地图有助于搜索引擎发现您网站的所有内容并为其编制索引。 因此,此步骤对您的 SEO 工作产生积极影响,因为 Google 索引中的内容越多,您进入更多搜索垂直领域的机会就越多,从而出现在更多搜索查询中。
XML 站点地图还可以帮助您了解您要诊断的站点上潜在的 SEO 问题。
为了帮助您制作 Google 站点地图,我们创建了一套详细的说明,介绍如何制作动态 XML 站点地图以增加您网站内容的索引。 在站点地图说明的末尾,如果您需要 XML 站点地图生成器或站点地图生成器并且对如何将站点地图提交给 Google 有疑问,我们提供了一些有用的资源。
关于如何构建动态 XML 站点地图的说明
- 使用您网站的完整网址作为“起始网址”选项。 爬虫只探索起始目录中的 URL,即当起始 URL 是“http://www.example.com/path/index.html”时,“http://www.example.com/path/sub/ page.html”将被编入索引,但“http://www.example.com/other/index.html”将不会。
- “将站点地图保存到”——是您网站“public_html/”文件夹中的文件名。 该文件应该可由脚本写入。 为确保它是,请创建此文件并将其权限设置为 0666。
- 建议在“上次修改”字段中使用“服务器的响应”。 在这种情况下,静态页面的条目将填充它们真正的最后修改时间,而动态页面则使用当前时间。
- “不解析”输入字段包含文件类型,以空格分隔。 这些文件将添加到站点地图,但不会获取以节省带宽,因为它们不是 html 文件并且没有嵌入链接。 请确保这些文件已被 Google 索引,否则将它们添加到站点地图是没有意义的!
- “不解析 URL”与上面的选项一起使用可以提高站点地图生成的速度。 如果您确定您网站上的某些页面不包含指向其他页面的唯一链接,您可以告诉生成器不要获取它们。
例如,如果您的网站有“查看文章”页面,其 URL 类似于“viewarticle.php?..”,您可能希望将它们添加到此处,因为很可能这些页面内的所有链接都已列在“更高级别”(例如文章列表)文件以及:- viewarticle.php?id=
如果您不确定在这里写什么,请将此字段留空。 请注意,这些页面仍包含在站点地图中。
- “排除扩展名”——这些文件不会被抓取,也不会包含在站点地图中。
- 要禁止您的网站部分包含在站点地图中,请使用“排除 URL”设置:将跳过所有包含指定字符串的 URL。
例如,要排除“www.domain.com/folder/”中的所有页面,请添加以下行:
- 文件夹/如果您的站点包含可以按列重新排序的列表的页面,并且 URL 看起来像“list.php?sort=column2”,请添加此行以排除重复内容:
–排序=无论如何,您可以将此框留空以列出所有页面。
- “仅包含 URL”设置与“排除 URL”相反。 当它不为空时,只有与输入的子字符串匹配的 url 才会包含在站点地图中。
- “个别属性”设置允许您为每页的最后修改时间、频率和优先级设置特定值。 要使用它,请按以下格式定义特定的频率和优先级属性:“url substring,lastupdate YYYY-mm-dd,frequency,priority”。
示例:page.php?product=,2005-11-14, monthly,0.9
- 您可能希望限制要索引的页面数量,以确保如果您的网站出现无限循环链接等错误,索引不会无休止。
- 要限制脚本的最长运行时间,请定义“最长执行时间”字段(以秒为单位)。
- 要有可能使用“恢复会话”功能,请定义“保存脚本状态”字段。 该值表示保存爬虫进程状态的时间间隔,因此如果脚本被中断,您可以从上次保存的点继续该过程。 将此值设置为“0”以禁用节省。
- 为了减少站点地图生成器对您的服务器造成的负载,您可以在每次向您的站点发出 N(已配置)请求后添加“睡眠”延迟 X 秒(已配置)。 保留空白(“0”)值以立即抓取网站。
- Google 不支持页面超过 50,000 的站点地图文件。 这就是脚本支持为大型站点创建“站点地图索引”的原因。 因此,它将创建一个站点地图索引文件和多个站点地图文件,每个文件有 50,000 页。
例如,您的网站有大约 140,000 个页面。 XML 站点地图生成器将创建这些文件:

- “sitemap.xml”——包含指向其他文件的链接的站点地图索引文件(文件名取决于您在“将站点地图保存到”字段中输入的内容)
- “sitemap1.xml”——站点地图文件(URLs 从 1 到 50,000)
- “sitemap2.xml”——站点地图文件(URL 从 50,001 到 100,000)
- “sitemap3.xml”——站点地图文件(URL 从 100,001 到 140,000)
如果您的网站很大,请确保所有这些文件都是可写的。
- 启用“创建 HTML 站点地图”选项,让生成器为您的访问者创建站点地图。 您还应该定义存储站点地图的“HTML 站点地图文件名”。 通过定义“HTML 站点地图中每页的链接数”选项,可以将 html 站点地图拆分为多个文件。
文件名如下所示:
- “sitemap.html”——以防所有链接都放在一个文件中
或者 - “sitemap1.html”——站点地图文件,第 1 页
- “sitemap2.html”——站点地图文件,第 2 页
- ETC
同上一点:请确保所有这些文件都是可写的。 可以在pages/mods/sitemap_tpl.html文件中修改站点地图页面布局以适合您的网站。
除了修改 html 站点地图的样式表外,您还可以更改其格式化方式。 基本的模板命令是:
- <TLOOP XX>…</TLOOP> – 定义重复的代码序列(如页码或站点地图链接)
- <TIF XX>…</TIF> – 定义仅在满足特定条件时插入的条件语句
- <TVAR XX> – 插入指定变量的值
使用示例请参考 sitemap_tpl.html 文件。
- “sitemap.html”——以防所有链接都放在一个文件中
- 启用站点地图文件的 GZip 压缩以节省磁盘空间和带宽。 在这种情况下,“.gz”将被添加到站点地图文件名中(如“sitemap.xml.gz”)。
- “站点地图 URL”与在“将站点地图保存到”字段中输入的文件相同,但采用 URL 形式。 需要将站点地图地址告知谷歌。
- 启用“Ping Google”复选框,让脚本在每次站点地图更改时通知 Google。 通过这种方式,您将始终让谷歌了解您网站上的最新信息。
- 如果您想限制对生成器页面的访问,请在此处设置登录名和密码。
XML 站点地图生成器资源
以下是为 Google 制作 XML 站点地图的一些重要资源,包括一个有用的文章库,可帮助您进一步了解什么是 XML 站点地图,提供站点地图示例以及如何解决提交站点地图时可能出现的潜在问题出于 SEO 目的向 Google 提供。 此外,还有一个免费站点地图工具和创建者列表。
站点地图 学习图书馆
- 所有关于站点地图
- 创建站点地图
- 管理站点地图
- 为多个网站创建站点地图
- 图片站点地图
- 视频站点地图
免费站点地图生成器工具
- 制作 Google 站点地图的免费工具
