5.2. 大数定律
给定一列随机变量 , 记并将其称为样本均值. 大数定律所研究的, 就是当 满足哪些条件时, 可以保证其样本均值 在 时能够收敛于一个确定性的实数; 这里的 “收敛” 可以是几乎必然收敛或依概率收敛, 也可以是概率论中其它有意义的收敛方式. 通常, 若在某些条件下, 我们证明了 几乎必然收敛于一个实数, 则相应的定理被称为一个强大数定律 (strong law of large numbers); 若证明的是 依概率收敛于一个实数, 则相应的定理被称为一个弱大数定律 (weak law of large numbers).
下面我们给出经典的 Kolmorogov 强大数定律.
定理 5.2.1 (Kolmorogov). 设 为一列独立同分布的随机变量.
1. | 若 存在, 则有 , 也就是说, 事件的概率等于 . |
2. | 反之, 若 在 时几乎必然收敛于某个实数, 则 必定存在. |
Kolmogorov 强大数定律的完整证明超出本讲义的范围, 这里只对其结论进行介绍, 而在第 5.4 节第 2 小节中将给出一个较弱版本的强大数定律的证明.
接下来我们介绍一个较为一般的弱大数定律.
定理 5.2.2 (Feller). 设 为一列独立同分布的随机变量.
1. | 若则 , 也就是说, 给定任意 , 均有特别是, 若 存在, 则 . |
2. | 反之, 若存在某个实数 使得 , 则 |
Feller 弱大数定律的证明同样超出了本讲义的范围. 这里我们给出如下 Chebyshev 弱大数定律的证明:
定理 5.2.3 (Chebyshev). 设 为一列独立同分布的随机变量, 且 存在. 则 .
为了证明 Chebyshev 弱大数定律, 我们先做一些准备.
引理 5.2.4.
1. | Markov 不等式: 设随机变量 非负, 且 存在, 则对任意 , 有 |
2. | Chebyshev 不等式: 设随机变量 的方差 存在, 则对任意 , 有 |
证明.
1. | 注意到待证不等式等价于 , 而因此 的一个充分条件是 . 现任取 , 则上式右端始终非负, 故 , 从而待证不等式成立. |
2. | 令 , 则有其中的不等号利用了 Markov 不等式. |
在得到 Chebyshev 不等式之后, Chebyshev 弱大数定律的证明就变得比较直接了.
以 Kolmogorov 强大数定律为代表的各种大数定律是现代概率论的重要成果, 为概率的频率诠释 (即概率代表频率在试验次数趋于无穷时的极限) 提供了重要依据. 例如, 考虑最简单的独立重复掷骰子试验, 我们用随机变量 代表第 次投掷的点数, 则
1. | 为前 次试验投出的点数的平均值. 由于 独立同分布且期望存在, 由 Kolmogorov 强大数定律可得以概率 (也就是几乎必然) 成立. |
2. | 对任意 的子集 , 令即 为 次投掷后点数属于集合 的频率. 由于 独立同分布且期望存在, 由 Kolmogorov 强大数定律可得以概率 成立. 换句话说, 频率 几乎必然收敛于概率 . |
3. | 现固定一 的非空子集 , 再任取 的非空子集 , 我们把 次投掷中点数属于 的那几次挑出来, 并计算其中点数同时属于 的次数的占比 (暂时将其称作 “条件频率”): 而由 Kolmogorov 强大数定律可得以概率 成立, 这意味着条件频率也几乎必然收敛于条件概率. |
此外, 大数定律也为数理统计中众多点估计方法 (例如矩方法) 等提供了基本的理论依据.