超几何分布

概率论中, 超几何分布是一种常见的概率分布. 考虑以下情景: 假设口袋中有 个小球, 其中有 个白球和 个黑球. 从口袋中随机拿出 个小球, 并假设其中有 个白球和 个黑球. 则随机变量 的概率分布就是超几何分布.

类似地, 也可以考虑有多种颜色小球的情况, 得到的概率分布称为多元超几何分布.

1定义

定义 1.1 (超几何分布).自然数, 满足 . 设 为取值于 离散型随机变量. 如果对任意 , 有则称 服从超几何分布, 记为 .

在上述记号下, 能以非零概率取到的所有值为

定义 1.2 (多元超几何分布).自然数, 满足 . 设自然数 满足 . 如果离散型随机向量 满足: 对任意自然数 , 如果 , 则那么称 服从 元超几何分布.

在上述记号下, 能以非零概率取到的所有值为

2性质

基本性质

设随机变量 .

期望.

方差.

特征函数可以用超几何函数来表示: 这也是超几何分布得名原因.

设随机向量 按定义 1.2 服从多元超几何分布.

多元超几何分布的任意 维边缘分布是 元超几何分布, 其中 . 特别地: .

各分量的期望和方差与一元情形一致. 协方差

超几何分布的近似

超几何分布在 很大时趋于二项分布. 这是因为, 例如在引言的例子中, 如果小球的个数 非常大, 则取出每个小球对总体的影响很小, 故取出每个小球时, 它是白球的概率近似不变, 从而白球的个数近似满足二项分布.

命题 2.1 (超几何分布近似于二项分布).随机变量 服从超几何分布 . 如果则对任意的 , 有

进一步, 根据中心极限定理, 二项分布在 很大时接近于正态分布. 于是, 如果在 都很大 (但需满足 ), 则有近似表达式其中 , 是标准正态分布的累积分布函数.

3相关概念

术语翻译

超几何分布英文 hypergeometric distribution德文 hypergeometrische Verteilung (f)法文 loi hypergéométrique (f)日文 超幾何分布 (ちょうきかぶんぷ)韩文 초기하 분포 (超幾何分布)