You need to enable JavaScript to run this app.

寻求增长,不妨从A/B测试说起

最近更新时间2023.09.07 11:56:12

首次发布时间2021.02.28 17:16:56

寻求增长,不妨从A/B实验说起

人口红利退去后,互联网行业是一片厮杀激烈的红海战场。

在当今的大环境里,越来越多的互联网企业开始发现,“跑马圈地”就能获得成功的日子已经过去了,当下的第一要务是“精耕细作”,盘活存量、挖掘增量、科学决策、精细化运营,以数据驱动的思想解决产品在发展道路上所遇到的问题。

A/B实验 正是在这样的时代背景下兴起的。

什么是A/B实验

A/B实验又被称为小流量实验。通俗来说,A/B实验就是针对我们想改进的某个功能/UI/逻辑策略等,提供两种(或多种)不同的备选解决方案,从总体用户中抽取一小部分,随机地将抽取出的流量分配给不同方案,比如让一部分用户使用方案A,另一部分用户使用方案B,最终结合一定的统计方法,通过实验数据对比来确定最优方案。

image

实际上,A/B实验早就广泛地应用于科研领域,比如医学界会使用A/B实验来判断药品在治疗某种疾病时是否真的有效(实验中一半患者会领到药品,另一半患者会在不知情的情况下,领到与药品外形一样的安慰剂)。

image

现如今,A/B实验的思想被引入互联网领域,广泛地应用于产品增长之中。无论你在企业中担任何种角色,掌握A/B实验的思维方式、实践方法、实验原理,对于你和你产品来说都有着巨大益处。

为什么需要A/B实验

早在2007年,谷歌就建设了完善的A/B实验系统,随后实验的频率越来越高。现在谷歌每个月都会上线几百个A/B实验,谷歌通过这些实验可获得全年20%+的增长,增加超过10亿美元的营收。

我们可以看到:Facebook的CEO会亲自参与众多的A/B实验;Linkedin把A/B实验作为产品研发上线过程中的基本流程;在国内,以字节跳动为代表的互联网公司也有着浓浓的A/B实验氛围。

互联网届流行着一句话:“顶级的PM只能跑赢一半的A/B实验”。 以抖音、今日头条为例,这些产品每天有上千个A/B实验上线运行,相当于增加了500余个顶级PM。

实验思维已经植根于诸多头部互联网企业之中,大到商业模式的验证,小到产品功能、广告创意的优化,无一不经过A/B实验(谷歌甚至通过A/B实验的方法发现,在食堂中把数量较多的大餐盘和数量较少的小餐盘搭配着摆放,能够最大程度改善员工身体健康状况)。

那么,A/B实验究竟是有着怎样的魅力,使得大批互联网头部企业将之奉为圭臬?字节跳动的一位高级实验工程师此发表过这样的看法:

一方面我们无法承担任何一个错误特性影响上亿用户体验的 严重后果 ,另一方面我们又希望能够 分离量化 每个特性的影响。

这就需要我们设计并坚持使用一套数据驱动的方法,使得我们可以以 较小的风险 对新特性进行评估,积极试错积累经验;并且这个方法有能力排除其他因素(如同时开发的其他特性、时间因素等)的干扰;最后,除了“好’或者‘不好“,我们希望这个方法也能够给出 定量 的结果。

为了解决上述问题,普遍使用的方法是小流量随机实验,也就是 A/B实验

利用大量的实验,企业能够不断提高自己的 试错能力提升试错效率降低试错风险 。从某种程度上来说,互联网企业的实力与其实施A/B实验的能力紧密相关。

火山引擎「A/B测试」的核心价值与优势

「A/B测试」是火山引擎旗下先进的A/B实验产品。该产品长期服务于字节跳动旗下今日头条、抖音、西瓜视频等APP,提供专业的A/B实验能力,在字节系产品的增长过程中扮演了重要的角色。

在长久的产品演进中,「A/B测试」经历了字节系各产品的考验与打磨,凝聚了字节跳动增长团队对于A/B实验的理解,可满足企业各种场景的实验需求,帮助企业解决产品的策略的选择问题,预估策略效果,降低决策风险。

image

相较于市面上其他A/B实验产品,抖音、今日头条、虎扑等产品都在使用的「A/B测试」无疑拥有难以比拟的核心优势:

1)科学可靠的分流服务

相较于市面上其他的产品,「A/B测试」的分流服务更为可靠,底层算法对用户群体进行了均匀、随机地分流,从而确保各实验组样本的同质性,实验结果更为可靠。同时,「A/B测试」的分流服务性能稳定,能够支持高并发的请求场景,例如亿级DAU产品进行Push实验。

2)先进成熟的统计策略

「A/B测试」所采用的统计策略与字节跳动内部一致,依托于经典统计学的假设检验方法,从置信度、置信区间等多个层面对实验结果进行判断,同时也配备以贝叶斯统计原理为基础的实验引擎。

3)支持多种特殊实验

「A/B测试」不仅支持产品全生命周期中各场景下的实验需求,也通过长期的经验积累,在各种特殊场景下提供特殊的实验解决方案,让A/B实验更易用。

  • 可视化实验

在「A/B测试」上以可视化拖拽形式改变产品/页面布局,从而完成对照组&实验组的配置,市场和产品同学即可操作,所见即所得,无需研发介入,大大减少A/B实验在研发层面的压力。

  • MAB动态流量调优实验

在这一特殊实验应用贝叶斯统计原理,实验者可同时提交多种策略(如提供多个Push文案、多个落地页面等),由「A/B测试」智能化地动态扩量优胜版本,从而助力企业实现核心指标收益的最大化(如CTR最大化、购买率最大化)。

实验开启后,无需人工干预,流量自动向「有可能成为最优」的策略倾斜,并根据实时的指标变化,动态更新流量配置,以最低的风险,稳定获得最大的收益。

  • 多连接实验

也称为Split URL实验,用户访问统一的落地页URL后,分流至不同的URL落地页。适用于广告投放、活动运营等场景,如测试不同广告落地页转化率,活动页面效果等。

4)提供灰度发布能力

在海外,“灰度发布”以”Feature Flag“这一名字,被互联网企业所熟知。产品在新功能发布前,企业可采取小流量测试的方式,测试现有功能是否稳定,并可通过开关模式便捷地管理产品内功能的开启/关闭。相较于传统的发布流程,灰度发布更为敏捷迅速,风险更低,能够明显减少线上事故的发生。

image

火山引擎「A/B测试」解决企业A/B实验困境

现如今,越来越多的企业开始意识到A/B实验的重要性,然而,A/B实验平台的建设需要长时间的探索,对于大多数企业来说,自建A/B实验平台都是一件非常沉重的工作。这种情况下,应用「A/B测试」这类成熟的实验引擎,便不失为一种ROI极高的选择。

企业在应用「A/B测试」产品的同时,还能够享受专业实验团队为企业量身定制的专属服务方案,包括实验方案咨询,实验理论的培训,以及实验报告的分析解读等。企业能够更为迅速地落地A/B实验,并更增加专注自身产品的迭代。

image

如果您的企业也期望通过A/B实验来实现增长,欢迎点击链接「A/B测试」