2.4. 随机变量的独立性

定义 2.4.1. 个随机变量. 我们称 相互独立 (mutually independent), 若对任意区间 , 都有

利用条件概率的概念, 可证明 相互独立当且仅当如下条件成立: 任取 的一个非空真子集 以及区间 , 只要就有直观上看, 上述条件就是说, 从 当中任意挑出一组随机变量, 则这组随机变量 (作为随机向量) 取值的统计规律不会受到其它随机变量取值的影响, 而这也就是随机变量独立性的一种直观的理解方式. 值得指出, 在对实际问题进行概率建模时, 我们往往不是从定义出发来推导/验证随机变量的独立性, 而是从产生这些随机变量的实际背景出发, 并根据上述独立性的直观理解方式, 直接判断独立性 (或近似独立性) 是否得到满足, 再利用独立性定义及相关性质导出其它结论; 当基于独立性假定所建立的概率模型与实际现象不符时, 我们再考虑替换掉独立性假设.

接下来我们将重点放在离散型随机变量上. 以下定理指出, 两个离散型随机变量的独立性可以根据其联合分布列来判断; 该定理也不难推广到多个离散型随机变量的情况.

定理 2.4.2. 为两个离散型随机变量, 为各自的分布列, 则以下三个命题等价:

1.

相互独立.

2.

的联合分布列 满足(2.4.1)

3.

存在函数 使得(2.4.2)

证明.

命题 1 命题 2: 设 相互独立. 则对任意 , 令 , 由独立性定义即得到故式 (2.4.1) 成立.

命题 2 命题 1: 设式 (2.4.1) 成立. 任取区间 , 则由区间 的任意性, 可得 相互独立.

命题 2 命题 3: 显然.

命题 3 命题 2: 设式 (2.4.2) 成立. 两边对 求和, 并由边缘分布列与联合分布列的关系, 可得两边再对 求和并利用 可得类似地有故对任意 , 有因此式 (2.4.1) 成立.

例 2.4.3 (独立离散型随机变量的和). 为相互独立的离散型随机变量, 我们考察 的分布. 由例 2.3.4 的结果可知, 是离散型随机变量, 其分布列为(该式对于 不独立的情形也是成立的). 接下来, 利用 的独立性与定理 2.4.2 即可得到同理有以上两个计算 的公式又被称为卷积公式 (convolution formula).

以下定理指出, 相互独立的离散型随机变量在经过函数变换后依然保持独立性.

定理 2.4.4. 个离散型随机变量 相互独立, 为任意函数. 则随机变量 相互独立.

证明. 为符号上的简洁, 我们以 的情形为特例给出证明, 但不难将该证明推广到一般情况.

, , 则 的联合分布列为则有 , 故由定理 2.4.2 相互独立.

实际上, 定理 2.4.4 为一般随机变量 (也就是不全为离散型随机变量) 的时候也是成立的, 其证明超出本课程的范围, 但直观上可以这样理解: 由于 相互独立, 故 取值的统计规律不会受到 取值的影响, 而这意味着 取值的统计规律不会受到 取值的影响, 从而对任意 中的区间 均成立 (只要条件概率存在). 接下来由条件概率与独立性的定义即可看出 相互独立.

最后, 我们给出一列 (可数无限个) 随机变量的独立性的定义.

定义 2.4.5. 为一列随机变量. 我们称这列随机变量相互独立, 若任取大于等于 的正整数 , 均有 相互独立.