生信课程笔记11-关于p值

统计假设检验 Statistical hypothesis testing

假设检验是使用来自总体的采样(sampling)提供的信息,做出关于一个对总体的决策。需注意抽样应能够代表总体。

 对总体的某种规律提出一个假设,通过样本数据推断,决定是否拒绝这一假设,这样的统计活动称为假设检验。

假设检验的基本步骤

1. 建立检验假设,确定检验水准

2. 选择并计算检验统计量

3. 确定p值,做出推断

假设 hypothesis

统计假设是一种关于感兴趣的总体的陈述。一般我们有一个原假设/零假设/无效假设/H0/ null hypothesis和一个备择假设/替代假设/HA/alternative hypothesis。无效假设通常代表“无效”的状态,即“没有影响、没有效果、没有差异”。

例如:H0 性别对身高没有影响/男女平均身高没有差异。

p值

A p-value is the probability that random chance generated the data, or something else that is equal or rarer.

p值是生成某数据的随机机率,包括三部分:随机产生这个事件的概率,产生与该事件相同概率的其它事件的概率,产生比该事件的概率更小的事件的概率,这三部分概率加起来就是p值。

统计假设检验的结果通常用p值来表示。为了从我们的变量的观测值获得p值,首先需要构造一个测试统计量,如果零假设确实成立,我们可以从理论上计算统计量的分布情况。然后,我们可以将从我们的采样数据中计算出的值与该分布进行比较,并假设如果零假设为真,那么将获得观测数据或比观测数据更极端的测试统计值的概率是p值。

p值是当原假设成立时,出现目前观察到的情况的概率、加上出现和目前情况概率相同或概率更低的事件的概率。如果p值比较小,可以认为当原假设成立时出现目前的情况是小概率事件,不太可能发生,而更有可能是原假设不成立。

注意:

 p值并不能告诉你零假设是真的可能性。同样,它也没有告诉你替代假设是真的可能性。

如果你不能拒绝零假设,你还没有证明零假设是正确的。但简单地说,当前的数据集没有提供足够的证据来拒绝它。

p值只关心数据与原假设有多么不一致,不能代表你所发现的效应(差异)的大小,更不能告诉我们这种效应是否有实际意义。

显著性水平α

规定一个显著性水平α,如果p值小于显著水平,就可以拒绝原假设,认为得到的结果是显著的。从另一个角度看,α是在原假设为真时拒绝原假设的概率(假阳性错误),是在大量重复实验时我们能承受的第一类错误的概率的上限。从相同的总体取样进行检验的p值是均匀分布的,假阳性的比率与α值相等。

假设检验的两类错误

第I类错误(type I error):假阳性错误。 把没有差异说成有差异,把没病说成有病,把无效说成有效等。

第II类错误(type II error):假阴性错误。 把有差异说成没有差异,把有病说成没病,把有效说成无效等。

多重假设检验

如果我们只执行一个测试(在数据集中只有一个变量),那么使用p值来解释统计测试的结果很好。一旦测试次数增加,p值作为显著性度量的有用性就会降低。

多重比较使假阳性的概率大量增加。对一个变量进行统计检验,假阳性的概率为α=5%,不犯假阳性错误的概率为95%;对5个变量一起进行检验,不犯假阳性错误的概率为0.95^5=0.77,至少出现一次第I类错误的概率就是1-0.95^5=0.23;如果检验的次数m更多,几乎必然会有至少1个假阳性错误。我们把这个“至少有1个错误”的概率称为总体错误率(Family-Wise Error Rate,FWER),FWER = 1- (1- α)^m。

假设我们的数据集中有10000个变量,并且对于每一个变量,原假设都是正确的(没有差异)。现在对每个变量进行统计检验。在这个例子中我们将有大约0.05×10000=500个变量的p值低于0.05。这些都被称为假发现或假阳性(false discoveries or false positives)。如果数据中存在一些确实有差异的变量,则它们将与假阳性混合。在判断差异表达基因时,大部分基因都是没有明显变化的,小部分基因是显著差异的,这样统计得到的显著性结果中,会有很大比例的假阳性。

p值校正

在进行多次假设检验的时候,为了避免增大犯I型错误的概率,常用bonferroni、fdr(BH) 以及q值等方法对比较结果的p值进行校正(严格来说,q值并不是用来校正p值的)。

padj

adjust p-values是经过校正后的p值,通过一些算法,比如Benjamini-Hochberg method,使p值变的更大一些,从而控制假阳性的数量。

bonferroni校正

bonferroni是特别保守的一种多重比较校正方法,它拒绝了所有的假阳性结果发生的可能性。FWER = 0.05,α = 0.05/m,p<0.05/m时才拒绝原假设。相当于每一个检验做出来的p值都要乘以m,作为校正后的P值。这样进行10000次检验后,平均假阳性次数也依然被控制在0.05次。

t.df1$bon <- p.adjust(t.df1$sim_p, method = "bonferroni")

FDR

错误发现率(false discovery rate,FDR)是假阳性的预期分数,即假阳性数量除以所有认为是阳性结果的数量,FDR=FP/(FP+TP)

如果FDR<0.05,那么在显示为显著性的结果里,有不到5%为假阳性。当FDR=0.05时,一共有1805个阳性,但是这些阳性样本中,有5%是假阳性,即有90个是误诊的。

有多种模型用来从p-value估算FDR值,其中使用的最多的是Benjaminiand Hochberg的方法,简称 BH法。BH法虽然不够精确,但是简单好用。

Benjamini-Hochberg校正方法

fdr默认Benjamini-Hochberg method,仍然略显保守。它关注的是所有认为是阳性的结果中,假阳性的比例,FDR的目的就是要将这个比例降低到α。

其方法是:把所有的p值从小到大排序并编号i,然后最大的p值不变,其余的p值调整后变成 原始p值×(p值总数m/这个p值排序的编号i)。可以从数学上证明经过BH方法校正后的adjust p-values(即q-values或FDR)可以控制FDR在α以内。

实际上,BH法的原始算法是找到一个最大的编号i,满足P≤i/m*FDR阈值,此时所有编号小于i的数据就都可以认为是显著的。在实践中,为了能够在比较方便的用不同的FDR阈值对数据进行分析,会计算所有的FDR,这样无论FDR阈值选择多少,都可以直接根据FDR的数值来直接找到所有显著的数据。

t.df1$fdr <- p.adjust(t.df1$sim_p, method = "fdr")

q值

FDR的控制方法,延伸出了一个被校正后的p value的概念(比P value更严格),称之为Q value,这个概念是最早是John Storey(2002)提出的。一般情况下,我们可以认为q value = FDR = adjusted p value。据说Storey方法是最流行的FDR control procedure(For details see Storey's paper published on PNAS ,2003)。这是一种利用多重比较结果中的p value 分布,来预估真实的阳性率的方法,从而提高了FDR值预估的准确性。

q值是传统p值的FDR模拟(analog)。对于给定的变量(p-value = p*),q值估计p值低于p*的所有变量中错误发现的分数。q值表示在检测阳性个体中,假阳性个体所占的比例。取q=0.05,假阳性/(假阳性+真阳性)=0.05。此时p值并不是0.05(可能是0.058)。

t.q1 <- qvalue(t.df1$sim_p)

t.df1$qval <- t.q1$qvalue

独立筛选 independent filtering

FDR控制了假阳性,但是也丢失了很多真正有差异的结果。所以还有独立筛选(independent filtering)减少假阴性。独立筛选认为表达量很低的基因可能不能提供有用信息,可以先把它们去掉,减少参与分析的基因总数,从而减少丢失的真阳性结果。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容