3.1 p值和z值
一般性假设检验构建拒绝域使得
对应的p值为:
(是根据显著性水平构建的,而显著的则根据包含x的最小区域计算的)
显然越小越确定存在显著差异,p值引入了更多信息。
在H0下,p值服从均匀分布
接下来将主要使用Z值而不是P值
z 值使我们能够将正态理论的力量用于解决大规模推理问题。
3.2 修正的p值和FWER
控制流程目标,经典做法是Bonferroni边界
如果我们认为这是一种p值修正,则
我们通过来判断是否显著。
如果是测试数据,是为目标的控制流程,则
Holm控制过程为将p值排序后
对应修正后的p值为
从修正后的p值可以明显看出,Holm过程优于Bonferroni过程。
3.3 逐步算法
介绍几种控制FWER的逐步算法。
step-down过程会现将p值排序。因此如果被拒绝,则前面的p值也都会被拒绝。Holm方法是最早的例子之一。
通过closure principle可以将Bonferroni’s bound扩展为Holm’s procedure
如果假设p值间独立,可以得到Simes’ inequality,当全为H0时:
基于Simes’ inequality,Hochberg优化Holm’s adjusted p-values为
此方案要基于独立前提,它是step-up过程
3.4 排列算法
Bonferroni bound的好处是不用关心p值得相关性,但是如果我们已知了相关性,这就变成了劣势。Westfall和Young将相关性考虑后对Holm的过程进行了优化。
如果将p值排序,用代表原始的下标:
定义(比大的p值的原始下标集合),且
此处表示在H0(complete null hypothesis)下观测到的概率
Westfall–Young step-down min-p定义为
根据Boole’s inequality
说明效果好于Holm法。
由于p值计算相对麻烦,也可以用t值替换
现在问题的关键是,如何计算?
带回第2章的例子,是一个6033 * 102的矩阵,是对它重排列后的矩阵。
定义,是一个将参加实验人员随机排列后的顺序,对应的
仍然取前50个与后52个进行计算,得到
重复上述过程B(较大的数)轮,可以得到 (3.38)的估计值
这种评估比较科学的原因:
- 随机排列X使计算的T来及相同的混合分布
-
由于每次按病人随机排列,保留了基因之间的相关性
3.5 其它控制标准
FWER是传统多重检验控制规则,但是还有其它,比如:
per comparison error rate: PCER = E{ 错误拒绝数 } / N
excepcted error rate: EER = E{错误决策数(包含两类错误)} / N
Lehmann and Romano’s k-FWER criteria是FWER的变种,目标是控制错误拒绝零假设数不超过k,当k等于1时等于传统FWER。