2021-11-27

超几何分布的应用

超几何分布(hypergeometric)是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的个数(不归还)。

超几何分布和Fisher's Exact Test是完全一模一样的原理,只是两种不同的称谓。

例如在有N个样本,其中m个是不及格的。超几何分布描述了在该N个样本中抽出n个,其中k个是不及格的机率:

公式

上式可如此理解:n^N 表示所有在N个样本中抽出n个,而抽出的结果不一样的数目。

k^m 表示在m个样本中,抽出k个的方法数目。剩下来的样本都是及格的,而及格的样本有N-m个,剩下的抽法便有(n-K^N-m)种。

若n=1,超几何分布还原为伯努利分布。

若N接近∞,超几何分布可视为二项分布。注意二项分布是有归还 (with replacement) 的抽取。

然后计算得到的p-value通过Bonferroni校正之后,以0.05为阈值(小于0.05),满足此条件的GO term定义为显著富集。

(1)超几何分布的模型是不放回抽样

(2)超几何分布中的参数是M,N,n上述超几何分布记作X~H(n,M,N)。

具体例子可参考以下网址:

https://www.jianshu.com/p/3d01a66e235b

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 1. 简介 超几何分布(hypergeometric)是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物...
    LeoinUSA阅读 26,588评论 3 23
  • 基本知识点: 必然现象和随机现象:必然(不)发生和可能发生 随机现象的统计规律性:相同条件下进行大量重复实验,实验...
    梦想总是要有的阅读 2,251评论 0 5
  • 补充知识 ——wikipedia 伯努利试验: 是只有两种可能结果(成功或失败)的单次随机试验,即对于一个随机变量...
    由此可得Monster阅读 1,087评论 0 0
  • 二项检验 二项分布是指统计变量中只有性质不同的两箱群体的概率分布,两个观测值是对立的。二项分布描述了n次实验中恰好...
    中孚阅读 6,868评论 0 0
  • 0x00 前言 在统计学中,随机变量就是指一个随机的事件结果的取值X,比如一次抛硬币随机事件会出现两种情况,一个正...
    KeKe_W阅读 1,131评论 0 1

友情链接更多精彩内容