掌握 A/B 和多变量测试(终极指南)

已发表: 2018-07-27

到目前为止,大多数营销人员都知道他们需要将 A/B 测试集成到他们开发新促销和广告的过程中。

但是,知道应该使用 A/B 测试和知道如何运行 A/B 测试是两种不同的游戏。

A/B 测试的世界可能令人困惑,许多人可以互换使用“A/B 测试”、“A/B/n 测试”或“多变量测试”等术语。

但是,这些都是不同类型的测试。 这是一个快速的纲要:

“A/B”和“A/B/n”测试非常相似。 他们都在测试一个特定的变量更改,以查看该更改的影响。 A/B 测试意味着您正在运行促销的两个版本——通常是一个控制版本和一个带有您想要测试的更改的第二个版本。 A/B/n 测试意味着您正在运行多个版本的促销 - 仍然测试一个特定变量,但运行该变量更改的多个变体。 例如…

  1. A/B 测试:您正在测试 CTA 按钮上的文本。 一个版本说“注册!” 第二个版本说“现在加入!”
  2. A/B/n 测试:您正在测试 CTA 按钮的颜色。 第一个版本是红色的,第二个版本是蓝色的,第三个版本是绿色的,以此类推。

多变量测试是一次测量多个变量更改的影响的任何测试。 提示就在名称本身中:多(多)变量(变量)。 例如…

  1. 您正在同时测试 CTA 按钮颜色和文本的变体。

在本文中,我们将介绍为什么应该运行 A/B 测试、应该运行什么类型的测试以及何时运行 A/B 测试。 让我们跳进去!

为什么要运行 A/B 测试?

为了运行成功的 A/B 测试,您必须具备测试背后的正确推理和意图。

运行测试的一个广泛原因是为了优化转换,但如果你想成功,你必须有更深入和更详细的推理。

让我们深入了解运行 A/B 测试的最常见原因。

1. 我的促销效果不佳

这是大多数营销人员开始进行测试的主要原因。

效果不佳的促销活动对您的收入来说是一个真正的问题,并且是您可以衡量的。

通过运行 A/B 测试,您可以调整促销的细节,以逐步提高其有效性。 这使您可以为客户提供更好的体验,同时还可以提高您的底线。

2. 我的品牌指南发生了变化

这种情况发生的频率比您想象的要多。 每当公司进行品牌更新时,通常促销活动都需要全新的设计和内容。

虽然 A/B 测试是快速实施这些更改的好方法,但它也有助于引导品牌更新。

通过使用 A/B 测试来测试不同的颜色、措辞和设计风格,您可以通过展示客户反应最佳的真实用户数据来帮助告知整体品牌方向。

在这种情况下,您不会针对原始设计测试新设计。

通过品牌更新,您通常会有一个关于品牌设计和声音将走向何方的一般指南,但您仍然需要弄清楚字体、颜色托盘等细节。您从第一个开始,您的测试应该反映您从之前的晋升成功中学到的东西。

在你开始之前…

在开始设置 A/B 测试之前,有几件事情需要记住。 首先,要避免的一些陷阱……

陷阱#1:没有根据行业基准检查促销绩效。

当然,您希望您的促销活动优于“平均水平”,但如果您的促销活动已经超过行业平均水平 20% 以上,那么最好测试其他方法以实现您的目标。

好消息是,您的晋升远高于竞争对手。 坏消息是,在此促销活动中运行 A/B 测试可能弊大于利。 如果促销已经是您客户的理想选择,那么引入变化可能会使性能下降。

陷阱 2:未能确定可衡量的 KPI。

如果您“只是希望此促销活动做得更好”,那么您可能没有将该促销活动与影响底线业务目标的 KPI 联系起来。

要提高促销的绩效,您需要密切关注哪些 KPI 会受到影响,以便准确评估更改。

如果附加的 KPI 是为了增加平均订单价值,并且您运行测试并看到参与度增加但平均订单价值减少,则不应将测试视为成功。

与促销相关的最常见的 KPI 是:

  1. 兑换率
  2. 购物车放弃率
  3. 电子邮件捕获率
  4. 平均订单价值

您应该在启动任何测试之前确定您的目标 KPI,以确保您可以正确跟踪更改。

IA/B 应该测试什么?

现在您对基础有了更好的了解,我们可以深入了解测试中最重要和最常被误解的方面——如何构建可靠的 A/B 测试。

促销的要素

  1. CTA——行动号召
  2. 标语 - 复制以吸引访问者的注意力
  3. 报价副本 - 描述您的报价的副本
  4. 报价金额 - 报价的有形价值
  5. 图片资产 – 用于代表商品、品牌等的图片。
  6. 步骤数——访问者完成参与需要多少步骤

以上是促销的主要元素,因此是您的主要测试变量。

报价副本和报价金额是分开的,因为您可以更改特定报价金额而无需实际更改周围副本。

这是一个例子:

  • “从今天开始,订阅即可享受 10% 的折扣!”
  • “从今天开始,订阅可享受 15% 的折扣!”

在上面的示例中,“报价副本”是包含“报价金额”的文本。当您继续创建实际测试时,请牢记这一区别。

报价金额几乎总是具有最重要的权重。 如果您从实际角度考虑这一点,您就会明白为什么。

例如,您宁愿享受 5 美元的高级洗车优惠还是免费的高级洗车服务?

在所有其他条件相同的情况下,更多的人会更愿意获得免费洗车服务,而不是仅减 5 美元。

如何设置 A/B 测试

1.确定KPI

设置任何测试以优化转化的最重要的第一步是确定您想要影响的 KPI。

这可能是减少购物车放弃、增加电子邮件注册、增加参与度或您和您的团队已确定的任何特定于站点的 KPI。

一旦你确定了你的 KPI,从上面的组件列表中开始,就这些元素中的哪一个最能帮助你改进你的目标 KPI 开始制定假设。

让我们用一个例子为你勾勒出来,这样你就可以看到它是如何完成的:

控制提升

在这个例子中,有很多事情要做,还有很多东西要解压,所以让我们从上面的列表开始分解它。

  1. 优惠金额——在这个特定的促销活动中,实际上推出了两种不同的优惠——20% 的折扣和免费送货。
  2. 步数– 1
  3. CTA——使用代码。
  4. 图像资产- 无
  5. 标语- 即时节省
  6. 报价副本- 立即从您购物车中的商品中取出(报价金额 1)+(报价金额 2)

直观地分解促销的每个部分将使您清楚地了解所有不同的移动部分,并允许您确定测试的优先级。

继续这个例子,让我们使用平均订单价值作为我们的主要 KPI。 这是一个明确的、可衡量的 KPI,肯定会影响公司的底线。

2. 识别和假设

接下来,您需要确定您认为会对您确定的 KPI 产生最大影响的元素。 对于此示例,我们将使用 Offer Copy 和 Offer Amount。

对于每次晋升,写下你的假设很重要,这样你就可以跟踪你的思路。

这是一个示例假设:

我相信更改报价副本以包含最低订单价值并增加报价金额的可见性将增加平均订单价值。

如您所见,一个典型的假设并不过分复杂,但对行动和结果非常具体。

3. 创建一个变体

现在您已经制定了一个假设并确定了要测试的元素,您可以开始基于这些元素创建变体。

幸运的是,使用 Justuno,这部分通常非常简单。 查看以下变化:

变体 B

在设置 A/B 测试时,最好一次只测试一个元素的变体。 在上面的示例中,您会注意到只有报价副本发生了变化,而报价金额保持不变。

理论上,任何看到这个弹出窗口的用户都应该立即了解促销的基本知识:20% 的折扣,免费送货,我必须购买价值 100 美元的东西。

在这个例子中,我们还在视觉上取消了“即时储蓄”的优先级,因为该文本在很大程度上与目标无关。

4. 测试和迭代

现在你有了你的变体,你可以设置你的测试。

你应该运行测试的时间长度完全取决于达到统计显着性需要多长时间——这是一种奇特的说法,“你得到的数据是 90% 可靠的”。

在大多数情况下,您需要至少 1,200 次展示才能对结果有合理的信心。

何时运行 A/B 测试

任何测试最重要的部分之一就是弄清楚何时适合进行测试。

说“总是”很容易。 你应该一直在测试。

我自己有时仍然会陷入这种心态,但在每次测试之前,退一步问自己几个问题很重要:

下周有多少访客会看到此促销活动? 两周? 月?

这个问题的答案非常重要。 在理想情况下,您将需要几千个数据点(即实际运行您的测试的访问者)。

如上所述,您的测试至少应该运行到 1,200 次展示,才能对结果有合理的信心。

考虑到这一点,您的第一步是弄清楚每天有多少访问者会通过您的测试进行可预测的漏斗。

如果您已关联您的 Google Analytics(分析)帐户,则此数字应该很容易从您的 Google Analytics(分析)或 Justuno 仪表板获得。

谷歌分析 A/B 测试

在查看您的流量数字时,请务必记住您正在运行的促销类型和促销的定位规则。

例如,如果您正在开展退出意图促销活动,那么可以假设您网站的每个访问者都会看到此促销活动。 如果您正在运行仅显示在主页上的横幅促销,那么您应该只查看主页的访问者数据,而不是整个网站的访问者数据。

掌握了这些一般规则后,您可以进入您的 Google Analytics(分析)并查看您的促销活动所在的页面并找到您想要的信息。 转到“受众”选项卡并将日期范围设置为查看过去 3-6 个完整月,然后按周排序。 图表上可用的每个数据点都是您流量的 7 个窗口。

将每个数据点输入电子表格(Google 表格或 Excel 也同样适用),然后对这些数字取平均值。 现在,您的网站获得了相当准确的平均每周流量。

获得每天的平均访问者数量后,您可以计算出运行测试以达到 1,200 次展示所需的最短时间。

请参阅下面的便捷图表以获取入门指南:

每天的访客人数最短测试时间
0-100 14 天(2 周)
101-250 14 天(2 周)
251-500 7 天(1 周)
501-1000+ 7天(1周)

您希望运行测试的最短时间为一整周。 您的测试需要在同一天开始和停止,最好是同时开始。

这是因为即使您每天有 10,000 名访问者,您的网站也会在一周中的不同日子体验不同的用户行为。 通过在一周的同一天开始和结束您的测试,您可以帮助平滑不寻常的用户行为和模式。

这一点非常重要,因为它可以让您每天控制流量和用户行为的波动。

警告几句:

  • 避免在星期五开始考试。 如果出现任何问题,您可能要到星期一才会注意到。
  • 早上开始你的测试。 出于与上述相同的原因,尽量不要在当天晚些时候开始测试。
  • 不要在假期进行测试,因为流量和购买模式的波动会导致数据丢失并使测试无效。

一般来说,您希望运行 A/B 测试的最长时间为一个月。

这个上限的原因是基于资源分配。

如果达到最低生存能力或大约 1,000 名访问者需要超过一个月的时间,那么您需要考虑运行不同类型的测试。

该做与不该做的总结:

做:

  1. 查找您的每日流量
  2. 使用流量数字来确定测试的长度
  3. 在一周的同一天开始和停止考试

不:

  1. 在周末开始 A/B 测试
  2. 运行超过一个月的 A/B 测试
  3. 在假期运行 A/B 测试
  4. 在不同的日子、不同的时间开始和停止您的测试

A/B 测试成功的样子

如果您通过了整篇文章,那么恭喜您! 您刚刚接受了 A/B 测试速成课程。

在您开始并在 Justuno 帐户中设置您的第一个 A/B 测试之前,请查看 Shopify Plus 珠宝零售商 The GLD Shop 最近执行的案例研究。

在此 A/B 测试中,The GLD Shop 能够将转化率提高 300%!