A/B测试分析

A/B-test解读

A/B-test是为同一个目标制定两个方案,在同一时间维度,分别让组成成分相同(相似)的用户群组随机的使用一个方案,收集各群组的用户体验数据和业务数据,最后根据显著性检验分析评估出最好版本正式采用。

假设检验的四个步骤:

一.问题是什么?

(1)确定两个假设:零假设和备选假设

零假设和备选假设是对立的。零假设总是表述为研究没有改变,没有效果,不起作用

(2)判断检验类型

单样本检验——检验单个样本的平均值是否等于目标值
独立双样本检验——检验两个独立样本的平均值之差是否等于目标值

(3)确定抽样分布类型

a.当样本数量大于30时,符合中心极限定理,抽样分布呈正态分布
b.样本数量小于30时,抽样分布符合t分布或其他分布

(4)确定检验方向
单尾检验

左尾:若备选假设包含有<,则选左尾检验


image.png

右尾:若备选假设包含有>,则选右尾检验


image.png
双尾检验

将判断标准一分为二位于抽样分布的两侧,左右侧各占一半判断标准,若假设中包含不等号,则属于双尾检验。


image.png

二.构建检验统计量

单个正态总体均值的假设检验

u检验(方差已知):
image.png

t检验(方差未知):


image.png
单个正态总体比例的假设检验

根据样本比率\overline{p}与总体比率的假设值P0 之差来对总体比率进行假设检验
当作为一个等式的原假设为真时,\overline{p}的期望值等于假设值P0,即E(\overline{p})=P0\overline{p}的标准误差为:

image.png

如果np>=5并且n(1-p)>=5,则
\overline{p}
的抽样分布近似服从正态分布。在实践中通常应用的这些条件下,式
image.png
服从正态分布,其中
image.png
对总体比率进行假设检验时,使用标准正态随机变量Z为检验统计量:
image.png

两总体均值的假设检验
u1-u2的假设检验的统计量(两总体方差已知):

image.png

其中n1和n2为样本量,D0=u1-u2

u1-u2的假设检验的统计量(两总体方差未知):
image.png
两总体比例之差的假设检验

当p1=p2=p时,p的合并估计量:

image.png

p1-p2的假设检验的检验统计量:
image.png

三.求P值和判断标准

当p<=α时,拒绝零假设,接受备选假设
当p>α时,接受零假设

四.得出结论

实例:单样本

环保标准规定汽车的新排放标准:平均值<20ppm,现某汽车公司测试10辆汽车的排放结果如下:15.6 16.2 22.5 20.5 16.4 19.4 16.6 17.9 12.7 13.9 。问题:公司引擎排放是否满足新标准。

一、问题是什么

1、零假设:公司引擎排放不满足标准,即平均值>=20
  备选假设:公司引擎排放满足标准,即平均值<20
2、判断检验类型:该例子为单样本检验
3、确定抽样分布

1)用python展示统计描述(平均值、标准差)
image.png

计算的样本平均值为17.17ppm,标准差为2.98ppm

2)我们知道当样本数量大于30时,符合中心极限定理,抽样分布呈正态分布,样本数量小于30时,抽样分布符合t分布或其他分布。为了知道这是个样本的分布,我们可以使用python中的displot绘图,画出直方图和拟合曲线
image.png

从绘图中可以看出样本数据集近似正态分布,又因为该样本量小于30因此抽样分布符合t分布。自由度df=n-1=9

3)确定检验方向:

由于备选假设中包含<,则属于左尾假设

二.计算p值
1)手动计算

image.png

根据t表格,即可找出p值,这里我们也可以用下面链接中的工具得出p值。
https://www.graphpad.com/quickcalcs/pValue2/
最后得到p值为0.015,但这个工具计算的是双尾检验的p值,根据下图我们可以看出双尾检验的p值为单位检验的2倍,因此这里的p值应为 0.15/2 = 0.0075

2)调用python自带方法计算
image.png

三、判断标准

建立判断标准检验证据是否有效,给定的判断标准即显著水平α=5%
当p<=α时,拒绝零假设,接受备选假设
当p>α时,接受零假设

四、得出结论

用python代码来判断如下:
左尾判断条件:t<0 and p < alpha
右尾判断条件:t>0 and p < alpha


image.png

实例2:A/B测试

简介

对于这个项目,你将要了解的是电子商务网站运行的 A/B 测试的结果。你的目标是通过这个 notebook 来帮助公司弄清楚他们是否应该使用新的页面,保留旧的页面,或者应该将测试时间延长,之后再做出决定

I数据的基本处理

(1) 导入数据库
image.png
(2) 导入数据集,并在这里查看前几行:
image.png
(3)使用下面的单元格来查找数据集中的行数。
image.png
(4)数据集中独立用户的数量
image.png
(5)用户转化的比例
image.png
(6)new_page 与treatment 不一致的次数
image.png
(7) 是否有任何行存在缺失值?
image.png
(8)现在创建一个符合测试规格要求的新数据集。将新 dataframe 存储在 df2 中
image.png
(9)检查有无不匹配值
image.png
(10)df2 中有一个重复的 user_id 。它是什么?
image.png
(11)删除 一个 含有重复的 user_id 的行, 但需要确保你的 dataframe 为 df2
image.png
(12)不管它们收到什么页面,单个用户的转化率是多少?
image.png
(13)一个用户收到新页面的概率是多少?
image.png

II A/B测试

(1)假设:

零假设:p_new -p_old <=0
备择假设:p_new -p_old >0

(2)

假定在零假设中,不管是新页面还是旧页面,p_new and p_old都具有等于转化 成功率的“真”成功率,也就是说, p_new and p_old是相等的。此外,假设它们都等于ab_data.csv 中的 转化 率,新旧页面都是如此。
每个页面的样本大小要与 ab_data.csv 中的页面大小相同。
执行两次页面之间 转化 差异的抽样分布,计算零假设中10000次迭代计算的估计值

(3) 在零假设中,p_new和p_old 的 convert rate(转化率) 是多少?
image.png
(4)n_new和n_old是多少?
image.png
(5)在零假设中,使用 p_new 转化率模拟 n_new 交易,并将这些 n_new 1 与 0 存储在 new_page_converted 中。
image.png
(6)在零假设中,使用 p_old转化率模拟 n_old交易,并将这些 n_old 1 与 0存储在 old_page_converted 中。
image.png
(7)在 (5) 与 (6)中找到p_new-p_old模拟值
image.png
(8)使用(3). 到 (7) 中的计算方法来模拟 10,000个 p_new-p_old 值,并将这 10,000 个值存储在 p_diffs 中
image.png
(9)绘制一个 p_diffs 直方图
image.png
(10)在p_diffs列表的数值中,有多大比例大于 ab_data.csv 中观察到的实际差值
image.png
(11)得出结论

p_value=0.9
α=0.05
p_value>α,接受零假设

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容