揭开 SEO 的秘密:优化主题

已发表: 2017-03-14

在我们揭开 SEO 的秘密的最后一期中,我的同事 Holly Miller 概述了在正确的时间和良好的 SEO 形状中选择好的在线主题的步骤。 现在是时候确保您所撰写的主题将同样针对用户和搜索引擎进行优化。 是时候谈谈语义主题优化了!

Unwrapping_Secrets_SEO

内容优化简介

作为在线营销人员、搜索引擎优化或内容作者,您的最终目标是确保您为在线受众创建的任何内容都能按预期执行。 这可能以用户信号、更高排名、社交分享或转化的形式出现。 内容优化的目标正是如此——确保您的内容在用户通过搜索引擎查找信息的重要时刻连接起来。 为此,搜索引擎(以及用户)需要尽可能地认为它与特定主题相关。 最终,通过了解您真正想要做的是增加内容相关性而不是优化内容,可以更好地优化您的内容。

这种增加内容相关性的一般概念不仅从 SEO 的角度来看很有趣,而且对于帮助内容作者了解哪些子主题应该包含在主题中也非常有用。

为了完全信任有助于我们提高内容相关性的数据,让我们深入了解一下 Google 如何理解内容的相关性。

关键词密度简史

在人工智能、机器学习和所有那些花哨的算法出现之前,谷歌主要根据两个因素评估页面质量:链接和关键字密度。 对于像我这样的 SEO,这实际上很有趣。 几年前“过去”的搜索引擎优化更多地基于策略而不是基于策略。

如今,这是一场不同的球赛。 谷歌和其他搜索引擎变得更加智能,不再仅仅根据几个链接或几个页面关键字来判断相关性。

好的,如果您不使用关键字密度来优化关键字,您如何针对主题进行优化? 接下来的两个概念起初可能看起来很复杂,但应该很容易理解。

潜在语义索引

第一个是潜在语义索引,或 LSI。 Google 使用 LSI 的方式其实很简单。 数学公式定义了一段内容中术语之间的接近度和关系。 搜索引擎会抓取一个网页,并根据您的网页标题或主要主题,将最常见的单词和短语进行分组并识别为页面的核心主题关键字。 如果搜索引擎在您的页面上找到的字词是相关字词,它会期望找到相关字词,例如“汽车”、“二手”、“拍卖”等。

对于大多数人来说,这一切听起来应该很熟悉。 LSI 只是一种基于共现的方法,搜索引擎会在其中查找与其他术语自然结合出现的术语。 这是我几个月前写的一篇文章中有关 LSI 的更多信息。

到 TF*IDF 还是不到 TF*IDF

如果您想更深入,TF*IDF 或词频 * 倒置文档频率是更高级的公式。 Portent.com 写了关于 TF*IDF 的文章:

“.. 忽略所有信息检索算法之母 TF-IDF 是不行的,TF-IDF 被人们亲切地称为搜索极客,称为词频-逆文档频率。

这种主要的排名算法在 1970 年代引入,使用存在、出现次数和出现位置来生成文档中特定术语重要性的统计权重。 它包括一个规范化功能,以防止冗长乏味的文档由于其周长的剪切特性而占据搜索结果中的位置。”

尽管您可以看到这是一个较旧的概念,但它仍然非常重要。 与 LSI 类似,TF*IDF 着眼于特定的关键字并尝试理解每个关键字之间的关系。 但是,它通过为每个术语赋予特定权重而更进一步。

假设您试图了解哪些单词和短语与二手车主题相关。 我们将公式设置为查看排名前 20 的页面。 TF*IDF 将以两种方式工作:

  • TF(词频):爬虫会查看每个网页上的每个词,并确定每个词的词频(关键词密度):

Term_Frequency

这将在第 2 页、第 3 页等重复。

  • IDF(倒排文档频率):然后爬虫将查看所有这些单词并确定这些单词存在于多少文档(在分析的 20 个文档中)。

IDF_示例

  • 重复第 2 页、第 3 页等……
  • TF*IDF:将这两项放在一起后,将计算一个简单的对数并返回每个分析项的分数(权重)。

二手车:TF*IDF = 0.8

二手车:TF*IDF = 0.6

使这种方法令人惊奇的是,它实际上消除了试图理解哪些单词和主题应该与文本的核心主题一起使用的猜测。 然后,您可以分析哪些关键字最重要,因此对您所写的主题更重要。

顺便说一句,谷歌在其一些搜索专利中谈到了 TF*IDF:

  • https://www.google.com/patents/US7711668
  • https://www.google.com/patents/US20130346424
  • https://www.google.com/patents/US7730061

如果你不认为之前理解很重要。 我希望你现在这样做。

深入研究实体类型

现在让我们谈谈实体类型。 我们已经看到了 Google 如何理解特定主题的最重要术语的示例; 谷歌也了解单词的分类。 让我们以这篇文章为例。 标题为“特朗普以 35% 的美国进口关税威胁德国汽车制造商”,很好地概述了你在这篇文章中读到的内容。 简而言之,文章称,特朗普总统正在通知宝马、通用汽车的沃克斯豪尔品牌和其他品牌在美国生产更多产品。他们不会更多地投资于美国的制造业。 下面,我使用 IBM 的 Watson 的实体搜索工具来了解机器学习算法如何定义内容相关性以及如何将每个单词分类为特定的实体类型:

实体工具实体工具2实体3实体4实体5

以下是有关 Google 如何对实体进行集群的附加资源:

http://searchengineland.com/google-patent-question-answering-using-entity-references-unstructured-data-267273

这是什么意思? 搜索引擎,尤其是那些智能到可以使用机器学习的搜索引擎,会查看文本文档中的每个单词,并对它们进行权衡和分类。 要击败竞争对手,您需要了解所有这些概念,并确保页面上的所有内容都经过适当优化。

内容质量与内容结构

既然我们已经讨论了使我们的内容在质量方面具有相关性,那么让我们看看我们的内容在结构方面是如何相关的。

许多 SEO(过去)犯错的一个巨大范式就是简单地在页面上的任何地方吐出内容(甚至优化得很好)并希望它能够排名(我说的是你的挫败,尤其是在电子商务中)。 让我们看一下两个内容:

版本 1

“Lorem ipsum dolor sit amet,consectetur adipiscing elit。

Cras venenatis mi eu urna tristique,id dictum ligula aliquet。 Pellentesque non dignissim 狮子座。 Ut dignissim accumsan lectus,在 maximus quam lobortis 坐下。 Donec pharetra placerat mauris,坐在 amet molestie diam dictum ac。 Vivamus quis ex quis arcu malesuada rhoncus vel eget ex。 Sed eget tortor ut augue mattis aliquet in ac nunc。 前庭非 arcu id quam egestas tristique。 Suspendisse fringilla id risus nec dictum。 Nunc finibus risus id odio vulputate,在 pretium nisi ultricies。 整数 imperdiet velit ligula, vitae pulvinar elit malesuada vitae。”

版本 2

“Lorem ipsum dolor sit amet,consectetur adipiscing elit。

Cras venenatis mi eu urna tristique, id dictum ligula aliquot:

  • Pellentesque non dignissim 狮子座。 Ut dignissim accumsan lectus,在 maximus quam lobortis 坐下。 Donec pharetra placerat mauris,坐在 amet molestie diam dictum ac。
  • Vivamus quis ex quis arcu malesuada rhoncus vel eget ex。
  • Sed eget tortor ut augue mattis aliquet in ac nunc。 前庭非 arcu id quam egestas tristique。 Suspendisse fringilla id risus nec dictum。

Nunc finibus risus id odio vulputate,在 pretium nisi ultricies。 整数 imperdiet velit ligula, vitae pulvinar elit malesuada vitae。”

版本 2 看起来更好,对吧?

这不仅有助于整体用户信号(更低的跳出率、更长的页面停留时间,这有望导致每次会话的页面增加)——而且有助于排名,因为搜索引擎了解各种 CSS 元素,从而了解页面的布局方式出去。

用这些概念变得真实

假设您的核心主题是“购买二手车”,并且您试图了解要写哪些子主题:我应该谈谈过程吗? 提示? 买外州车?

第一步是在任何特定时刻尽可能地了解市场。 使用 Searchmetrics Content Experience 敏捷内容开发平台,我们能够快速识别一些高级项目,包括搜索量、季节性、类似关键字和搜索集成来指导我们的主题:

Searchmetrics 内容体验

SCE1SCE2

Searchmetrics 内容体验的下一步是与主题浏览器合作,以了解哪些主题在市场上引起了共鸣,以及原因:

SCE 主题浏览器

借助 Searchmetrics 主题图,我们能够快速识别语义上接近“购买二手车”这一主题的核心主题。 有趣的是,我们会注意到许多人有兴趣了解如何用现金购买二手车,或者在州外或从经销商处购买二手车。 由于我们的分析最多可以包括五个核心主题,因此我们将包括搜索量较高的主题。

通过选择其中一些其他主题,我们的总搜索量增加到大约 7,000+

搜索量

搞定了,我们可以开始写了!

在敏捷内容开发中应用关键字

准备好编写后,让我们看一下您在 Searchmetrics Content Experience 的编辑器模块左侧看到的内容。 在写任何东西之前,我们会注意到一些非常有趣的事情,主要是要写哪些关键字(基本上是子主题),以及建议每个关键字在搜索结果中排名靠前的频率。

还记得本文前面的所有这些内容概念吗? 看看这些关键词推荐的大部分是在哪里计算的。

SCE 关键字建议

必备品附加千瓦

根据上述数据,为了确保我们的内容完全相关,我们需要写下保险、维护、试驾过程、保修、注册、融资和其他一些内容。

一旦我们开始写作,这就是乐趣开始的地方:

Searchmetrics 内容体验
Searchmetrics 内容体验

我可以使用该工具采用数据驱动的方法来整体编写内容,对其可读性和结构良好进行评分,甚至在控制台中查看来自其他网站的重复内容可能会导致我在排名方面出现问题。

如果您想更深入地了解数据并了解数据,我们将分解 TF*IDF 和其他数据驱动的建议。

Searchmetrics 内容体验中的热门关键字
Searchmetrics 内容体验中的热门关键字

最后,您跟踪影响。 确保您正在跟踪所有 5 个核心主题,以查看哪些在排名、流量和用户信号方面表现更好。

提醒:旧的“发布并忘记”心态已不复存在。 您应该“发布和回收”以确保您的内容始终是优化和最新的。

揭开SEO的秘密

了解语义内容优化的基础知识至关重要。 你不需要技术。 您无需成为数据科学家。 你只需要注意并保持好奇。 一旦你理解了对内容进行语义优化的价值,以数据为中心的写作不仅会更有趣,而且会开始变得更有意义。