5.3. 中心极限定理

对于一列独立同分布的随机变量 , 大数定律保证了样本均值 时将 (在某种意义下) 收敛于期望, 而中心极限定理考虑的则是对这个收敛过程更细致的刻画, 即 足够大时, 样本均值 相对于其期望的涨落情况. 这里给出一个经典版本的中心极限定理:

定理 5.3.1. 为一列独立同分布的随机变量, 且 均存在. 令则对任意 , 有

证明. () 令 . 这里仅考虑矩母函数 在某个包含 的开区间 上有定义的情形. 任取 , 则对足够大的正整数 , 有而由于 , 故将 附近做泰勒展开到二阶可得因此 即可得到上式右端恰好给出标准正态分布 的矩母函数, 接下来我们需要用到如下引理:

引理 5.3.2. 为一列随机变量, 它们的分布函数为 , 矩母函数为 . 又设随机变量 的分布函数为 , 矩母函数 上有定义. 若对任意 , 总对足够大的 有定义, 且则对任意 , 只要 在点 处连续, 就有

该引理的证明不做要求. 由上述引理可立即得到因此待证结论成立.

注 5.3.3. () 实际上在上述证明中, 我们只需把矩母函数 换成特征函数 (characteristic function)即可将该证明比较直接地推广到一般的情形. 特征函数与矩母函数有许多相似的性质, 例如 独立时有 , 又如引理 5.3.2 也有特征函数的版本. 但可以证明, 对于任意随机变量, 其特征函数在整个实数轴上均有定义, 而对各阶矩的存在性没有要求, 因此特征函数相比矩母函数有着更广泛的适用范围.

结合大数定律与中心极限定理, 可以不严格地认为, 对于一列独立同分布的随机变量 , 当 足够大时有其中 , , 而随机变量 服从正态分布 . 上式指出, 样本均值相对于期望的涨落幅度正比于标准差 而反比于 . 此外, 在数理统计的部分, 我们还将用上式来设计期望的区间估计方法.

定理 5.3.1 给出的是一个经典版本的中心极限定理, 其它版本的中心极限定理还包括 Lyapunov 中心极限定理、Lindeberg 中心极限定理等, 它们在不同条件下证明了样本均值相对于期望的涨落渐近服从正态分布; 见 [12] 第 27 节. 这些中心极限定理为如下经验性结论提供了理论支持: 若一个随机变量 是由大量微小而相互独立的随机因素叠加作用而产生的, 则 服从正态分布 1. 这也解释了为什么实际应用中会大量出现服从正态分布的随机变量.

利用中心极限定理近似计算概率

中心极限定理的另一大用处是对涉及大量独立同分布随机变量的和的概率进行近似计算. 设某个概率分布 的期望为 , 标准差为 , 而 是一列服从分布 的相互独立的随机变量. 记 , 则当 足够大时, 由中心极限定理可得上式意味着我们可以近似认为 服从正态分布 .

例 5.3.4 (二项分布的正态近似). 设随机变量 服从参数为 的二项分布, 并记 . 由二项分布与伯努利分布的关系, 可知 同分布, 其中 相互独立且服从参数为 的伯努利分布. 现取 为任意自然数, 则基于中心极限定理给出的 的近似值为(5.3.1)注意到我们在利用中心极限定理之前先将 改写为 , 该步通常被称为连续性修正 (continuity correction). 对于 为离散型随机变量的情形, 施加这类连续性修正通常能给出更精确的估计结果. 文献 [13] 第 VII.3 节对二项分布情形的连续性修正给出了更定量的解释.

一般来说, 若要使得式 (5.3.1) 具有较好的精度, 则 应取得比较大, 且 不能太接近 . 一些理论分析以及数值经验指出, 当 时, 式 (5.3.1) 通常能够给出可接受的精度.

例 5.3.5. 设有一枚立方体骰子, 我们将这枚骰子重复投掷 次, 并将掷出的点数之和记为 . 我们希望对概率 进行估计. 考虑到 服从的依然是离散型分布, 我们在用中心极限定理前先采取连续性修正: 计算中我们还利用了函数 的对称性 . 实际上, 利用卷积公式交由计算机可算出精确值: 可看出中心极限定理 (附加连续性修正) 给出的估计值与精确值相差不到 . 感兴趣的读者可尝试计算不采取连续性修正时的估计值, 并将其与精确值进行比较.

脚注

1.

^ 一个典型的例子就是布朗运动.