一个资深旅游行业项目经理的无奈:那些年做过的伪AB测试

一说起A/B测试,相信很多产品经理都对这个名称不陌生,他们会拿出一副看外星人的眼光,心里默默的说:“太out了吧,这个概念又不是什么新概念。”诸位别急,就像那本经典的书名说的:你以为你以为的就是你以为的吗?

我最早入行的时候,在一家外包做网站的公司,我作为项目经理,公司分配我服务一家大型的国有旅游集团,这家公司成立早,在业内非常有名,主要做的是入境游业务,当时国内的线上旅游产品不像现在这么百花齐放,这家公司占据了入境游60%以上的业务。坦白讲,我接到这样的项目内心是无比激动的,做了无数的竞品分析,推翻N多次的产品原型,而这家企业也不像传统的央企,可能是因为涉外较多,他们的思路很开放,很多专业的意见他们也会接受,双方配合的很默契。

做过网站的人都知道,项目中第一个重要的里程碑就是首页设计稿,首页设计稿决定了全站的设计风格和调性,又是一家网站的“门面”,因此该企业对首页设计稿的设计是万众期待,不仅仅是领导,还有所有员工,都对这次网站首页十分的期待,这种情绪感染了我,我带着设计团队不眠不休的干了一周,出了三版设计方案,摆到了领导的桌前。

领导看到我们的成果,首先表扬了我们的工作态度,此处省略一万字,然后在拍板做决定的时候,领导真的是为难了,并不是他不知道选哪个,而是他不敢选,因为他很清楚公司上下对设计稿的期待,更清楚外界对本次网站改版的关注,毕竟该企业在中国入境游领域的话语权分量很重。领导看了我一眼,说,要不,让下面的人一起看看?我当时头就大了,下面那么多人一起看,一人提一句意见,一人提一个想法,做过乙方的都知道,我们的设计基本上就会重新推翻,我们一周的努力基本上就付水东流了啊!为了不让兄弟们的辛苦白费,我建议领导让所有人在三版设计风格中进行投票,决定设计风格走向,票数多的那个就作为最终的设计风格,并且冠上了一个“A/B测试”的名头,让领导觉得这件事的科学性和严谨性。

三版设计,A版本在整个设计中演绎了该企业的LOGO,最大的特点是更国企,如果各位不明白,请参照中石油官网;B版本我们用了大量的风景图片,最大的特点突出其“入境游”的旅游特性;C版本是我们推荐的版本,使用了颜色绚丽的设计风格,并且手绘了一个熊猫的卡通图形,整个网站的风格更加偏向国外旅游网站,因为毕竟这个网站的受众是外国人。我们一致认定,C版本必胜!但是,投票当天的结果大出意料,最后A版本选票最多,因为这家企业的员工都认为,既然是做自己企业的网站,那就必须围绕自己的企业做文章。

这件事回过头来看,其实发现当时做的A/B测试实在是称不上科学的实验,因为犯了以下几个错误:

1.采样不准确。在A/B测试中,采样是一件很重要的事情,如果采样不准确,那整个实验就算是有结果,其结果也是不准确的。什么是采样的准确?就拿上文中的例子,我们的采样就是该企业的员工,这些员工首先不是网站的受众,其次他们看问题的角度会有局限,我们想当然就把员工的想法等同于用户的想法,而这个网站的用户都是黄头发蓝眼睛的外国人,想法差距就更大了。

2.样本数量太少。该企业的入境游业务占了中国入境游的半壁江山,而他们的员工只有200多人,200多人的样本不能完全代表全流量的用户,就像我们不能说抛十次硬币如果8次正面,2次反面,我们就说抛硬币的概率就是80%的正面,这很可笑。

3.实验变量太多。科学的A/B测试为了保证实验的准确性,在变量设置上不会很多,很多时候就是改动一个按钮的颜色,或者是一句文案的改变,就是为了尽量减少变量对数据结果的影响,如果变量太多,那就算有实验结果,作为实验设计者也并不清楚,到底是哪个变量导致的数据变化。

4.实验结果分析。做A/B测试不是全民投票,票数决定一切。A/B测试的结果要经过统计学的分析,结合正态分布和随机变量等计算得出的结果才是可信的。

从上我们可以看到,一次成功的A/B测试并不是那么容易的,那有没有可以借助的工具呢?

吆喝科技的A/B测试云服务倒是可以解决上述的问题,首先我们来看看采样的问题,在吆喝科技的A/B测试后台,有一个流量控制面板,如果我们需要在运行控制界面中为实验的每个版本分配试验流量,百分比为占用全部流量的比例,控制流量可以通过一个按钮实现。


科学的流量分割一定要保证流量的选取具备代表性,如果试验结果显示B优于A有可能应用B版本到全体用户中之后,它的表现反而比A版本差,Appadhoc A/B Testing通过科学的试验流量分割算法,保证不同版本的用户都具有相同的代表性,对比结果是科学可信的。为保证用户体验,通常参与过某一个试验版本的用户,再次进入应用时,依然会看到这个版本,除非在试验运行之后调整过流量。吆喝科技建议在开始运行试验时分配较小的流量,之后为获取更准确的试验结果可逐步提升流量。

其次是对实验结果的分析,一次科学的A/B测试实验完成后,实验数据的分析和统计也决定了这是否是一次成功的实验。在吆喝科技的A/B测试后台,引入了一个置信区间的概念,置信区间描述了试验版本比对照版本提升的范围,95%指的是实际提升出现在这个范围内的概率。查看置信区间,如果上下限同为正,说明试验版本比原始版本有了提升;如果同为负,说明试验版本不如原始版本。如果置信区间的上下限位一正一负,则说明试验版本和原始版本没有显著差别,或者试验数据还不足以判断结果,需要运行试验更长时间,收集更多数据。


我们做A/B测试的目的就是为了验证实验的结果推广到全流量可信,这需要大量的统计学进行分析,吆喝科技的后台整合了这些计算方式,把最终的结果展现在实验者面前,节省了大量的时间。

这只是吆喝科技A/B测试后台的部分功能,更多的功能还需要慢慢发掘。

本文作者李龙@吆喝科技,原创发表于吆喝科技博客,转载请联系吆喝科技(微信:appadhoc)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容

  • 黑盒测试案例设计技术篇 1 概述 本章介绍黑盒测试的概念和进行黑盒测试的目的与意义,及关于等价类划分、边界值分析、...
    西边人阅读 16,916评论 0 41
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,650评论 18 139
  • 2015-07-14蒲婧吆喝科技 嘉宾简介:王晔,北京吆喝科技有限公司CEO,清华和耶鲁校友,曾在Google美国...
    Sting阅读 1,002评论 0 3
  • 一天周末的早上,我睁开惺忪的睡眼,习惯性往身边一摸,哎~我的精灵怎么不见了?爬起来往厨房一看,正在准备早餐的她...
    桧枫阅读 269评论 0 0
  • 透过车窗看去,一幕幕的景色从我身边掠过,或许是太久没有静下心来好好的发现身边之景,暮然回首,顿生韵味,可悲可叹,可...
    腾俊阅读 385评论 0 0