生物统计学笔记03 2024-12-30

第4章 离散概率分布

4.1 随机变量

随机变量X是一个数值量,它以不同的概率取特定的值。值与它们对应的概率之间的关系称为概率质量函数。

例如:色盲测试 假设我们对一个受试者进行4次色盲测试。我们想要确定如果该受试者是色盲的话,在4次测试中正确选择特定数量(k)的概率。正确选择的数量X是一个随机变量,它可以取0, 1, ..., 4这些值,对应的概率分别是 P_{0} ,P_{1} ,P_{2} ,P_{3} ,P_{4} 。我们可以使用二项分布来获得这种情况下正确选择数量的概率质量函数(或概率分布)。

4.2 组合,排列和阶乘

为了理解二项分布,我们首先需要讨论排列和组合的概念的关系。

组合

不考虑选取顺序的情况下,从n个对象中选取k个对象的方式的数量。组合可表示\binom{n}{k}\quad {}_n C_k,并且指的是从n个元素中每次取k个元素的数量。可证明下列等式成立

\quad {}_n C_k=\binom{n}{k}=\frac{n(n-1)\times ...\times (n-k+1)}{k(K-1)\times ...\times 1}

例如:假设在一个阅读中心有4位阅读者,他们都有资格对一张具有糖尿病视网膜病变特征的照片进行评分。每张幻灯片需要由2位阅读者进行阅读。读者的选择组合数是\binom{4}{2}=\frac{4(3)}{2(1)} =6

排列

考虑选取顺序的情况下,从n个元素中选取k个元素的方式数量定义为排列。排列可表示为\quad {}_n P_k,并且指的是一次从n个元素中选取k个排列数。可证明下列等式成立

\quad {}_n P_k=n\times ...\times (n-k+1)

例如:假设在一个关于血清胆固醇的膳食研究中,受试者将在第1阶段和第2阶段分别接受4种可能膳食(假设为A、B、C和D)中的不同膳食方案。由于膳食实施顺序可能很重要,膳食分配给受试者的方式数量是\quad {}_4 P_2=4\times 3=12种。

阶乘

k!这个特殊的符号用于表示\quad {}_k P_k=k(k-1)\times ...\times 2\times 1称为k的阶乘。例如:4!=4\times 3\times 2\times 1=246!=6\times 5\times 4\times 3\times 2\times 1=720。按照惯例,0!\equiv 1.组合也可用阶乘表示如下:

\quad {}_n C_k=\binom{n}{k}=\frac{n!}{k!(n-k)!}

例如:\quad {}_4 C_2=\frac{4!}{2!(4-2)!} =\frac{4(3)(2)(1)}{2(1)(2)(1)} =6

4.3二项概率分布

二项概率分布由以下公式给出

Pr(X=k) = \binom{n}{k} p^k q^{n-k}     k=0,1,...,n

我们可用这个分布将n次试验中成功k次的概率分布做成模型,此处每次试验成功的概率为p,失败的概率为q=1-p,并且每次试验之间是独立的。

 我们可以用阶乘来表示二项分布,如下所示:

Pr(X = k) = \binom{n}{k} p^k q^{n-k} = \frac{n(n-1)\times\ldots\times(n-k+1)}{k!} p^k q^{n-k} = \frac{n!}{k!(n-k)!} p^k q^{n-k}

例如:上述以色板为例中,4次试验中获得2次成功的概率是多少?在这种情况下,n=4,p=\frac{1}{4} ,且

Pr(X=2)= \binom{4}{2}(\frac{1}{4} )^2(\frac{3}{4} )^{4-2}=6(\frac{1}{4} )^2(\frac{3}{4} )^2=0.211

4.4使用二项分布的方法

1.根据4.3节的公式计算各个概率(蛮力法)

2.利用二项分布表(教材附表1给定的n 和 k值)

3.利用计算机程序如Excel和MINITAB 提供的电子表格

4.利用Poisson分布近似二项分布(在33页有详细说明)。利用假设n\geq 100,p<0.001.

5.利用正态分布近似二项分布(在47页有详细说明)。利用假设npq\geq 5.

4.5节 利用电子表

例如,假设我们研究色盲试验,设我们希望对n=4,p=0.25生成所有的二项分布的概率,也就是

Pr(X=0),...,Pr(x=4).

我们可以用Excel的BINOMDIST函数轻易地计算它们的每一个概率。这个函数可以对任一n 和p值同时计算特定的二项分布的概率例如Pr(X=k),也可以计算累计概率例如Pr(X\leq k)。在这种情况下,请注意概率可以从二项分布表获得(参见教材附表1)。

要使用这个函数,我们必须指定n,p,k以及一个逻辑参数v。如果需要累积概率,则v应设为 TRUE;如果需要特定概率,则v应设为 FALSE。在上述例子中为了计算Pr(X=0)或Pr(X=4),我们设v=FALSE 如下电子表格所示。为计算Pr(X\leq 2),我们设v=TRUE。电子表格的优点是我们能对二项分布的任一n和p 计算,不只表格1这些。关于使用这个函数的更多细节在附录中给出。在MINITAB软件中,CALC菜单下的“概率分布”子菜单里提供了一个类似的函数。

4.6 二项分布的期望

与我们使用样本均值作为样本位置度量的方法类似,我们使用“总体均值”或期望值(用E(X)μ表示)作为随机变量的位置度量。

对一般的随机变量,

                          E(X) = \sum_{i=1}^{m} x_i \Pr(X = x_i) = \mu

也就是说,期望值是m个可能值的加权平均数,这些值由它们各自的概率加权。

对于二项分布,一般公式简化为:

                                E(X)=np

例如,设我们给100位色盲人士每人做一次色盲测试。

                              n=100,p=\frac{1}{4} ,E(X)=25

我们预计会有25名色盲人士在100人中通过测试。

4.7二项分布的方差

我们也可以用方差描述随机变量的离散度量,表示为Var(X) 和定义为

                    \sigma ^2=Var(X)=\sum_{i=1}^m(x_i-\mu ) ^2Pr(X=x_i)

与样本方差S^2 相对的是总体方差。它表示每个可能值与均值之间的平均平方距离,按其发生的概率加权。它让我们了解可能值相对于均值(或期望值)的分布范围。 随机变量的标准差定义如下

                             \sigma =\sqrt{\sigma^2} =\sqrt{Var(X)}

对二项分布,一般公式简化为

                            Var(X)=npq

假设n=100,p=0.01,Var(X)=0.99\approx 1

       n=100,p=0.99,Var(X)=0.99\approx 1

        n=100,p=\frac{1}{4} ,Var(X)=18.75

         n=100,p=\frac{1}{2} ,Var(X)=25

对于给定的n,当p=\frac{1}{2} 时,二项分布的变异性最大;而当p接近 0 或 1 时,变异性最小。

4.8 Poisson分布

假设一家医院在很长一段时间内观察到每两年出现1例罕见癌症病例。突然之间,它在一年内出现了3例。这种情况有多不可能发生,或者更具体地说,一年内至少出现3例病例的概率是多少?

已知这家医院服务了大量的人,但不知道确切的人数。泊松分布可以用来模拟在T年时间段内病例数的概率分布。

假设

1.Pr(在\Delta t时间内新发1例)\approx \lambda \Delta t,此处\lambda =每单位时间内的病例数,并且\Delta t 是时间的一个小的增量。

2.平稳性;即在整个时间周期T中单位时间新病例发生的频率。

3.独立性;不同时间间隔事件的概率是独立随机变量。

在这些假设下,

Pr(k \text{ cases in time } T) = \frac{(\lambda T)^k e^{-\lambda T}}{k!} = \frac{\mu^k e^{-\mu}}{k!}, \quad k = 0, 1, \ldots

此处\mu=\lambda T.

在本例中,T=1,\lambda =\frac{1}{2} ,所以Pr(k \text{ new cases in 1 year}) = \frac{(0.5)^k e^{-0.5}}{k!}。我们想Pr(X\geq 3)。 我们有

                              Pr(0) =e^{-\frac{1}{2} }=0.607

                            Pr(2)=\frac{(0.5)^2}{2} e^{-\frac{1}{2}} =0.076

                             Pr(3+)=1-(0.607+0.303+0.076)=0.014

1年内出现3个或更多病例的可能性不大。

4.9 Poisson分布概率电子表格的使用

我们可以使用泊松分布表(附录中的表2)来获得选定的\mu值下的泊松分布概率。这个分布的参数通过单个参数\mu=\lambda T。对于表中没有的\mu值,我们可以使用电子表格,例如Excel中的POISSON函数。使用这个函数,我们可以通过设置逻辑运算符\nu =FALSE来计算单个泊松概率,也可以通过设置\nu =TRUE来计算累积泊松概率(关于\nu 的进一步讨论见第4.5节)。例如,让我们使用Excel来计算在一年内观察到3个或更多事件的概率,如果发病率是每两年1个案例。我们有λ=0.5,T=1,λT=μ=0.5:

                      Pr(X\geq 3|\mu=0.5)=1-Pr(X\leq2 |\mu=0.5)

下表显示了泊松分布的单个概率和累积概率。

4.10 Poisson分布的期望和方差

              E(X)=\lambda T=Var(X)=\lambda T=\mu

判断一个分布是否可能是泊松分布的一个好方法是比较样本均值和样本方差。如果这两个量大致相等,那么泊松分布通常能够很好地拟合数据。

4.11 Poisson分布近似二项分布

假设n \geq 100,p\leq 0.01,我们可以通过参数\mu =np的泊松分布来近似参数为n和p的二项分布。使用这种近似的原因是泊松分布比二项分布更容易使用,尤其是当n较大时。具体来说,对于给定的n,p和k,我们近似二项分布的概率:

通过 {Pr}(X = k) = \frac{e^{-np} (np)^k}{k!}计算 Pr(X=k)=\binom{n}{k}p^kq^{n-k}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,458评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,030评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,879评论 0 358
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,278评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,296评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,019评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,633评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,541评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,068评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,181评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,318评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,991评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,670评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,183评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,302评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,655评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,327评论 2 358

推荐阅读更多精彩内容