4.1 正确与错误的发现
假设我们有一种决策方式,它对个假设决策如下:
则FWER为a大于0的概率,而被称为错误发现比率(false discovery proportion)
4.2 Benjamini和Hochberg的FDR控制算法
如果在零假设下的P值服从01均匀分布
定义排序后的p值为
Benjamini–Hochberg过程为:取在0到1之间,定义为满足的最大,并拒绝所有对应的。
定理4.1
如果真正的零假设对应p值是互相独立的,则BH过程对应的错误发现比例期望值为q
其中
显然FDR比FWER更自由,那它可信么?下面是一些问题,它们会在后面通过经验贝叶斯解决。
- 定理4.1依赖于零假设对应p值是互相独立,或者它们不是负相关的也可以使用。这常常是不切实际的
- 如果,则必须定义为0;或者限制必须大于0,但这常常不大可能
- 控制错误发现率真的比控制错误率好么?
- q如何选择?
- 传统p值在零假设逻辑下进行计算,在大规模假设检验中不太合适
4.3 经验贝叶斯解释
如果用表示零假设的cdf,则p值为:
可以等于,此时。
对排序:。
由于的经验cdf值为,则的经验cdf值为
结合上节,BH的阈值可转换为:
或
结合第二章大规模假设检验2.3,左式为经验贝叶斯错误发现率(分子为H0误判累积概率,分母为推翻零假设的混合概率估计)。
根据贝叶斯规则:
由于未知,可以取它的上界1(会导致更加严格)计算,此时:
并拒绝小于的H0。此时频率派与贝叶斯派的结果得到统一!
在贝叶斯视角下,前文提到的一些问题得到解答:
- q的选择:q是零假设被错误拒绝的估计贝叶斯概率(先验取上界1)。它更好理解,而且不再是频率,因此没有时的问题。
- 独立性假设:,此处z是向量,而我们考虑的是多元累积概率。而用到的是的经验估计。因此这中间不再关注间是否独立。
- 决策标准:HB过程仅控制Fdp的期望就够了么?这依赖于Fdr估计的精确度,还有的精确度。
- 左尾、右尾和双尾推断:从贝叶斯观念看,双尾的后验推断下拒绝域范围更大、精度更低
- 假阴性发现率:从本文开头的图可知,容易发现贝叶斯解释同样适用于Fnp
4.4 FDR控制是“假设检验”么
一般认为BH过程是多重假设检验过程,但是在4.3的解释中似乎不太像,怎么理解它呢?
假设我们选择的决策区间为,H0下落入区间的期望数为,R为观测到的显著数,则估计的错误发现率为:
由于当它小于q时我们认为这R个假设显著,也就是判断等价于为R的不等式
在泊松独立假设下
显然可以找到某个显著水平为“”级别的显著规则
经验贝叶斯发现率控制后,会处于“R个发现全部为真”和“R个发现中存在真”之间。它更像是一个估计而不是检验统计量:对R个发现中的错误比例进行估计。
4.5 Benjamini–Hochberg算法的变种
以下介绍两种。
-
评估
HB相当于将取上界1来评估,会存在高估,如何更准确评估呢?
如果定义一个没有正确发现的区间
如果将的观测值带入,可以得到
一般区间的取法为,找一个以H0为中心划一个区间
事实上这个概率估算并不特别重要,取0.9与取1的差异非常小,更重要也更难的是如何计算概率密度函数,会在第6章展开。 -
微阵列的显著性分析
如第2章中的例子,如果X是一个N*n的矩阵,其分为实验组和对照组,则我们可以计算得到向量1 此算法构建B个N*n的矩阵,每一个矩阵都是由原始矩阵随机排序后得到的(将原来的实验组与对照组混合,随机分为两组得到矩阵,重复B次),可以计算对应的;
2 对每个矩阵内的值进行排序,记作,则可计算
对应的也可以将排序得到
3 绘制
4 选择一个正的常数,定义如下区间
也就是说是第一个超出经验区间的点,是第一个低于经验区间的点。
上图中,,
5 定义是区间外的的数量,而是对应的数量
6 最终可以计算得到对应的
SAM过程通过搜寻,使6中结果等于预设的q,从而控制FDR水平。
为什么可以控制?
将4区间外的认为显著,则显著的累积经验概率为
因此