本文是对《Objective Bayesian Two Sample Hypothesis Testing for
Online Controlled Experiments》的理解。
为什么选贝叶斯
相比固定水平假设检验的优势:
- 相对p值更直接;
- 正确先验前提,支持多次观测,可选择最佳停止时机;
- 无需多重检验修正;
- 可主动接受零假设。
贝叶斯检验
两个假设是对立事件,根据两种假设的后验概率之比选择接受哪种假设。
从公式可知,后验比率依赖于先验比率、贝叶斯因子,确定了两者就可以求出。
那么如何选择两者呢?
模型和先验问题
- 贝叶斯因子计算
通过大数定理、中心极限定理可知,服从正态分布,可以使用正态分布模型。
在下,;
在下,会怎么?一般我们认为,为某非零的值。 - 先验比率计算
按照主观贝叶斯,我们可按自己理解指定,但选取不好会影响敏感度甚至得到错误的结果;
如果按照客观贝叶斯,可使用经验贝叶斯或全贝叶斯。
这里介绍经验贝叶斯方案:如果我们已经进行了很多次实验,且已知各实验分别属于零假设和备择假设的数量,这是一个伯努利分布模型,则我们可以求得两者的经验分布,以及先验比率的估计。
计算细节
定义
则根据定义:
模型设计
为真概率为,则概率为
关于的先验,采用一个简单的正态分布模型:,
1.
2.
则
可求得,
则
先验概率与V的选取
我们并不知道历史实验中,哪些属于哪些属于。
如何根据历史实验求解先验?这种依赖不可观察的隐性变量的概率模型,可以使用最大期望算法:
-
求得 - 将设置为1中得到的的均值
重复上述步骤直到与收敛,作为它们的最大似然估计。