对于A/Btest结果的另一种表述

在进行Google Play商品详情实验时,我们一定都会注意到谷歌后台对于测试结果的展示形式:

一次不太成功的商品详情实验

这和我们平时对客户端所做的A/B测试看起来不太一样。通常我们对于AB测试的结果,都会说,B版本相比A版本提高了多少个百分点。但在谷歌后台进行的这项AB测试,我们并不能直接从图中得到,版本C要比原来版本转化率提高了多少,而是给出了一段区间。同时提供给了我们一个有点陌生的指标:90%置信区间。

从数学上来讲,90%置信区间,是这样定义的:

置信区间是指由样本统计量所构造的总体参数的估计区间。
90%置信区间意义在于,有90%的概率,真值会落在这个区间内。

翻译到这个场景中,就是,有90%的可能性,实际效果或落在“比原来差6.2%”和比“原来好11%”之间。当然也不用太过担心,采用了第三组结果反而更差。这个概率分布是正态的,实际效果更大概率地会落在均值(+2.4%)附近。

当然如果按照我们平时对于AB测试结果的描述,我们通常只会说,版本C比原版转化率高2.4%。这样对比来看,谷歌后台的结果描述更为科学。置信区间的描述结果,也和我们实际经验相符合。毕竟转化效果不可能每天都是+2.4%,有可能超过2.4,有时还可能原版低一点。

如果把置信区间的方式,用在我们平时的AB测试上,会有怎样的结果呢?下面以现在手上项目之前做过的,对于营收功能X对于用户留存影响的AB测试做一个例子:

样本范围:某渠道买量用户
A组用户:不做特殊处理,正常默认开启功能X;
B组用户:默认关闭功能X,但用户能在设置中发现这个功能的存在;
C组用户:不仅默认关闭功能X,而且隐藏了设置X的开关,让用户完全感受不到功能X的存在;

按照原来的思路,这次测试的结果图表是这样的:

针对功能X,某渠道用户留存情况

因为该渠道当时刚刚起量,三种类型的用户都不算多,但好在三条留存曲线变化比较规则平稳。因此得到初步结论:
(1)功能X的自动开启,对留存影响很大。相比于最为”纯净“的C组,留存降低至少15%。
(2)即使默认关闭功能X,但是用户仍然可以发现有X这项功能,也会对留存产生10%左右的影响,选项关闭但可见,对留存影响仍不可小看。

接下来我们分别计算这三组数据的置信区间。在计算前,需要先约定一个基础假设,那就是:我们可以将次日留存情况视作一种二项式分布,对每一个样本,都存在当天卸载(二项式分布中的0)和当天未卸载(二项式分布中的1)这两种情况,用户选择的结果,与日期无关。这样我们就可以将四天的用户数看作一个容量为n的样本库。
对于二项式分布的置信区间的计算公式如下:

其中p为二项式分布的均值,n为样本容量,1.645则是90%置信度时正态分布的临界值
根据公式计算出的得到的置信区间如下:

根据这个置信区间数值,转化成类似Google Play后台看到的图表形式,我们这次的AB实验结果变成了这样:

从这张图表中,就可以对之前给出的一些结论进行一些修正:
(1)默认开启X对留存影响很大,这个结论依然成立。相比与完全隐藏功能X,留存至少降低12%。
(2)默认关闭X时,X的设置开关是否可见,对留存的影响,没有我们之前结论中的那么大。虽然均值的差距在10%左右,但两组留存区间有一定程度的重叠。如果只说“关闭并隐藏”会比“仅关闭”高10%的留存是不太准确的。

由此可见,谷歌后台对于AB结果的表述,提供给了我们一个新的分析数据的视角。特别实在样本量较小的时候,能让我们对估算误差有一个科学的判断标准。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,588评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,456评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,146评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,387评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,481评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,510评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,522评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,296评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,745评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,039评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,202评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,901评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,538评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,165评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,415评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,081评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,085评论 2 352

推荐阅读更多精彩内容

  • 陌上花开,可缓缓归矣 今天,是2016年8月23日星期二,阴雨天。在全国大部分地区都在降雨的时候,不出意外的,我所...
    丁壮壮阅读 351评论 0 0
  • KVC除了常用的set/get方法取值赋值之外,还可以使用键值编码的方式赋值取值(说直接点,就是一个类,可以直接通...
    pingpong_龘阅读 437评论 0 0
  • 作业1 作业2 作业3
    矢志不渝i阅读 249评论 0 0
  • 很久很久以后,你是谁的某某某,是否还是有人,念着与你到白头? 风决定要走 雨该怎么挽留 风雨相拥的十字路口 谁错开...
    萧娜阅读 568评论 38 9
  • 劳动节第一天,实际已经是第三天假期。这个假过的真焦心。 30岁真的是人生中一砍,尤其是女人,20岁时无法理解25岁...
    小叮当在哪里阅读 571评论 0 0