设 X1,…,Xn 为 n 个随机变量. 我们称 X1,…,Xn 相互独立 (mutually independent), 若对任意区间 I1,…,In⊆R, 都有P(X1∈I1,…,Xn∈In)=i=1∏nP(Xi∈Ii).
利用条件概率的概念, 可证明 X1,…,Xn 相互独立当且仅当如下条件成立: 任取 {1,…,n} 的一个非空真子集 I 以及区间 I1,…,In⊆R, 只要P(Xk∈Ik,∀k∈/I)>0,就有P(Xi∈Ii,∀i∈I∣Xk∈Ik,∀k∈/I)=P(Xi∈Ii,∀i∈I).直观上看, 上述条件就是说, 从 X1,…,Xn 当中任意挑出一组随机变量, 则这组随机变量 (作为随机向量) 取值的统计规律不会受到其它随机变量取值的影响, 而这也就是随机变量独立性的一种直观的理解方式. 值得指出, 在对实际问题进行概率建模时, 我们往往不是从定义出发来推导/验证随机变量的独立性, 而是从产生这些随机变量的实际背景出发, 并根据上述独立性的直观理解方式, 直接判断独立性 (或近似独立性) 是否得到满足, 再利用独立性定义及相关性质导出其它结论; 当基于独立性假定所建立的概率模型与实际现象不符时, 我们再考虑替换掉独立性假设.
接下来我们将重点放在离散型随机变量上. 以下定理指出, 两个离散型随机变量的独立性可以根据其联合分布列来判断; 该定理也不难推广到多个离散型随机变量的情况.
设 X,Y 为两个离散型随机变量, pX,pY 为各自的分布列, 则以下三个命题等价:
1. | X,Y 相互独立. |
2. | (X,Y) 的联合分布列 pX,Y 满足pX,Y(x,y)=pX(x)⋅pY(y),∀(x,y)∈R2.(2.4.1) |
3. | 存在函数 g,h:R→R 使得pX,Y(x,y)=g(x)⋅h(y),∀(x,y)∈R2.(2.4.2) |
证明.
• | 命题 1 ⇒ 命题 2: 设 X,Y 相互独立. 则对任意 (x,y)∈R2, 令 I=[x,x]={x},J=[y,y]={y}, 由独立性定义即得到pX,Y(x,y)=P(X∈I,Y∈J)=P(X∈I)⋅P(Y∈J)=pX(x)⋅pY(y).故式 (2.4.1) 成立. |
• | 命题 2 ⇒ 命题 1: 设式 (2.4.1) 成立. 任取区间 I,J⊆R, 则P(X∈I,Y∈J)=(x,y)∈I×J∑pX,Y(x,y)=(x,y)∈I×J∑pX(x)⋅pY(y)=x∈I∑y∈J∑pX(x)⋅pY(y)=x∈I∑pX(x)y∈J∑pY(y)=P(X∈I)⋅P(Y∈J).由区间 I,J 的任意性, 可得 X,Y 相互独立. |
• | 命题 2 ⇒ 命题 3: 显然. |
• | 命题 3 ⇒ 命题 2: 设式 ( 2.4.2) 成立. 两边对 y 求和, 并由边缘分布列与联合分布列的关系, 可得 pX(x)=g(x)y∑h(y),两边再对 x 求和并利用 ∑xpX(x)=1 可得 1=x∑g(x)y∑h(y).类似地有 pY(y)=h(y)x∑g(x),故对任意 (x,y)∈R2, 有 pX(x)⋅pY(y)=g(x)h(y)x∑g(x)y∑h(y)=g(x)h(y)=pX,Y(x,y).因此式 ( 2.4.1) 成立. |
设 X,Y 为相互独立的离散型随机变量, 我们考察 Z=X+Y 的分布. 由例 2.3.4 的结果可知, Z 是离散型随机变量, 其分布列为pZ(z)=(x,y):x+y=z∑pX,Y(x,y)=x∑pX,Y(x,z−x)(该式对于 X,Y 不独立的情形也是成立的). 接下来, 利用 X,Y 的独立性与定理 2.4.2 即可得到pZ(z)=x∑pX(x)pY(z−x).同理有pZ(z)=y∑pX(z−y)pY(y).以上两个计算 pZ(z) 的公式又被称为卷积公式 (convolution formula).
以下定理指出, 相互独立的离散型随机变量在经过函数变换后依然保持独立性.
设 n+m 个离散型随机变量 X1,…,Xn,Y1,…,Ym 相互独立, f:Rn→R 与 g:Rm→R 为任意函数. 则随机变量 f(X1,…,Xn) 与 g(Y1,…,Ym) 相互独立.
证明. 为符号上的简洁, 我们以 n=2,m=1 的情形为特例给出证明, 但不难将该证明推广到一般情况.
令
U=f(X1,X2),
V=g(Y1), 则
(U,V) 的联合分布列为
pU,V(u,v)====P(U=u,V=v)(x1,x2,y1):f(x1,x2)=u,g(y1)=v∑P(X1=x1,X2=x2,Y1=y1)(x1,x2):f(x1,x2)=u∑y1:g(y1)=v∑P(X1=x1)⋅P(X2=x2)⋅P(Y1=y1)(x1,x2):f(x1,x2)=u∑P(X1=x1)P(X2=x2)⋅y1:g(y1)=v∑P(Y1=y1).令
h1(u)=(x1,x2):f(x1,x2)=u∑P(X1=x1)P(X2=x2),h2(v)=y1:g(y1)=v∑P(Y1=y1),则有
pU,V(u,v)=h1(u)⋅h2(v), 故由定理
2.4.2 得
U,V 相互独立.
实际上, 定理 2.4.4 在 X1,…,Xn,Y1,…,Ym 为一般随机变量 (也就是不全为离散型随机变量) 的时候也是成立的, 其证明超出本课程的范围, 但直观上可以这样理解: 由于 X1,…,Xn,Y1,…,Ym 相互独立, 故 X1,…,Xn 取值的统计规律不会受到 Y1,…,Ym 取值的影响, 而这意味着 f(X1,…,Xn) 取值的统计规律不会受到 g(Y1,…,Ym) 取值的影响, 从而P(f(X1,…,Xn)∈I1∣g(Y1,…,Ym)∈I2)=P(f(X1,…,Xn)∈I1)对任意 R 中的区间 I1,I2 均成立 (只要条件概率存在). 接下来由条件概率与独立性的定义即可看出 f(X1,…,Xn) 与 g(Y1,…,Ym) 相互独立.
最后, 我们给出一列 (可数无限个) 随机变量的独立性的定义.
设 X1,X2,X3,… 为一列随机变量. 我们称这列随机变量相互独立, 若任取大于等于 2 的正整数 n, 均有 X1,…,Xn 相互独立.