AB测试原理(三)重抽样检验

根据中心极限定理,重抽样可以针对非正态分布的数据做检验,重抽样分为自助法、置换检验两种。(面向数据科学家的实用统计学3.3

1.自助法(bootstrap sample)

有放回地从原始样本中抽样。如使用自助法对规模为n的样本做均重值抽样:

(1)抽样一个样本值,记录后放回总体;

(2)重复n次;

(3)记录n个重抽样的均值;

(4)重复(1)~(3)多次,如r次;

(5)使用r个结果,计算标准差,生成直方图、箱线图,找出置信区间。

2.置换检验

适用于任何的分布形式的两组或多组数据差异检验方法,以AB的置换检验过程为例:

(1)将各组得出的结果组合为一个数据集;

(2)对组合得到的数据做随机混洗,然后随机无放回地抽取与A组规模相同的重抽样样本;

(3)在余下的数据中,随机无放回抽取与B组规模相同的重抽样样本;(其他多组依次做)

(4)对重抽样组计算统计量;

(5)重复1~4步骤 R次,生成检验统计量的置换分布。

(6)用观测到的组间差异,与置换分布做对比,若观测到的差异位于置换差异内,认为观测差异“有偶然性”;反之若观测差异大部分落在置换分布外,认为观测差异“与偶然性无关”。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容