超几何分布的期望与方差

超几何分布

1、定义

超几何分布:若随机变量 X 的分布列为

P(X = k) = \frac{C_M^k C_{N-M}^{n-k}}{C_N^n}, \quad k = 0, 1, 2, \cdots, n

其中 n \leq N, M \leq N 则称 X 服从超几何分布,记为 X \sim H(N, n, M)

利用组合的性质 \sum_{k=0}^{n} C_M^k C_{N-M}^{n-k} = C_N^n,易知它满足分布列应当具备的性质,因此定义是合理的。注意到,上面的分布列中只有 k 满足 n - (N - M) \leq k \leq \min(n, M) 的项是非 0 的,约定 k < 0n < k 时,C_k^n \equiv 0,则上述总成立。

  • 例子

下面举一个关于超几何分布常用模型的例子,

【超几何分布典型模型(次品模型)】N 件产品中有次品 M 件,从中任取 n 件,以 X 记这 n 件产品中的次品数,则 X 服从超几何分布。

2、期望

超几何分布的期望:

E(X) = \frac{n \cdot M}{N} = n \cdot \frac{M}{N}

证明:

E(X) = \sum_{k=0}^{n} k \frac{C_M^k C_{N-M}^{n-k}}{C_N^n}

= \frac{M}{C_N^n} \sum_{k=1}^{n} (C_{M-1}^{k-1} C_{N-M}^{n-k})

= \frac{M C_{N-1}^{n-1}}{C_N^n}

= \frac{nM}{N}

注:证明过程中应用了组合恒等式

\sum_{k=0}^{n} (C_M^k C_{N-M}^{n-k}) = C_N^n

\Leftrightarrow \sum_{k=1}^{n} (C_{M-1}^{k-1} C_{N-M}^{n-k}) = C_{N-1}^{n-1}

【从实际意义的方面就很好理解组合恒等式的意义】下面方差的证明也应用到了该组合恒等式。

3、方差

超几何分布的方差:

D(X) = \frac{nM(N-n)(N-M)}{N^2(N-1)}

= n \cdot \frac{M}{N} \cdot \frac{N-M}{N} \cdot \frac{N-n}{N-1}

证明:

E(X^2) = \sum_{k=0}^{n} \frac{k^2 C_M^k C_{N-M}^{n-k}}{C_N^n}

= \frac{M}{C_N^n} \sum_{k=1}^{n} [k C_{M-1}^{k-1} C_{N-M}^{n-k}]

= \frac{M}{C_N^n} \left( \sum_{k=1}^{n} [(k-1) C_{M-1}^{k-1} C_{N-M}^{n-k}] + \sum_{k=1}^{n} [C_{M-1}^{k-1} C_{N-M}^{n-k}] \right)

= \frac{M}{C_N^n} \left( \sum_{k=2}^{n} [(M-1) C_{M-2}^{n-2} C_{N-M}^{n-k}] + \sum_{k=1}^{n} (C_{M-1}^{k-1} C_{N-M}^{n-k}) \right)

= \frac{M}{C_N^n} [(M-1) C_{N-2}^{n-2} + C_{N-1}^{n-1}]

= \frac{M(M-1)n(n-1)}{N(N-1)} + \frac{nM}{N}

因此:

D(X) = E(X^2) - [E(X)]^2

= \frac{M(M-1)n(n-1)}{N(N-1)} + \frac{nM}{N} - \frac{(nM)^2}{N^2}

= \frac{nM(N-n)(N-M)}{N^2(N-1)}

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容