5.2. 大数定律

给定一列随机变量 , 记并将其称为样本均值. 大数定律所研究的, 就是当 满足哪些条件时, 可以保证其样本均值 时能够收敛于一个确定性的实数; 这里的 “收敛” 可以是几乎必然收敛或依概率收敛, 也可以是概率论中其它有意义的收敛方式. 通常, 若在某些条件下, 我们证明了 几乎必然收敛于一个实数, 则相应的定理被称为一个强大数定律 (strong law of large numbers); 若证明的是 依概率收敛于一个实数, 则相应的定理被称为一个弱大数定律 (weak law of large numbers).

下面我们给出经典的 Kolmorogov 强大数定律.

定理 5.2.1 (Kolmorogov). 为一列独立同分布的随机变量.

1.

存在, 则有 , 也就是说, 事件的概率等于 .

2.

反之, 若 时几乎必然收敛于某个实数, 则 必定存在.

Kolmogorov 强大数定律的完整证明超出本讲义的范围, 这里只对其结论进行介绍, 而在第 5.4 节第 2 小节中将给出一个较弱版本的强大数定律的证明.

接下来我们介绍一个较为一般的弱大数定律.

定理 5.2.2 (Feller). 为一列独立同分布的随机变量.

1.

, 也就是说, 给定任意 , 均有特别是, 若 存在, 则 .

2.

反之, 若存在某个实数 使得 , 则

Feller 弱大数定律的证明同样超出了本讲义的范围. 这里我们给出如下 Chebyshev 弱大数定律的证明:

定理 5.2.3 (Chebyshev). 为一列独立同分布的随机变量, 且 存在. 则 .

为了证明 Chebyshev 弱大数定律, 我们先做一些准备.

引理 5.2.4.

1.

Markov 不等式: 设随机变量 非负, 且 存在, 则对任意 , 有

2.

Chebyshev 不等式: 设随机变量 的方差 存在, 则对任意 , 有

证明.

1.

注意到待证不等式等价于 , 而因此 的一个充分条件是 . 现任取 , 则上式右端始终非负, 故 , 从而待证不等式成立.

2.

, 则有其中的不等号利用了 Markov 不等式.

在得到 Chebyshev 不等式之后, Chebyshev 弱大数定律的证明就变得比较直接了.

Chebyshev 弱大数定律的证明., 并令 , 则有且由 的独立性, 有则由 Chebyshev 不等式, 可得令上式中 , 即得到待证结论.

以 Kolmogorov 强大数定律为代表的各种大数定律是现代概率论的重要成果, 为概率的频率诠释 (即概率代表频率在试验次数趋于无穷时的极限) 提供了重要依据. 例如, 考虑最简单的独立重复掷骰子试验, 我们用随机变量 代表第 次投掷的点数, 则

1.

为前 次试验投出的点数的平均值. 由于 独立同分布且期望存在, 由 Kolmogorov 强大数定律可得以概率 (也就是几乎必然) 成立.

2.

对任意 的子集 , 令 次投掷后点数属于集合 的频率. 由于 独立同分布且期望存在, 由 Kolmogorov 强大数定律可得以概率 成立. 换句话说, 频率 几乎必然收敛于概率 .

3.

现固定一 的非空子集 , 再任取 的非空子集 , 我们把 次投掷中点数属于 的那几次挑出来, 并计算其中点数同时属于 的次数的占比 (暂时将其称作 “条件频率”): 而由 Kolmogorov 强大数定律可得以概率 成立, 这意味着条件频率也几乎必然收敛于条件概率.

此外, 大数定律也为数理统计中众多点估计方法 (例如矩方法) 等提供了基本的理论依据.