一般随机变量的期望属于高等概率论的内容, 由于数学工具的匮乏, 本课程将不给出一般随机变量期望的定义, 而将主要介绍一些一般情形下期望的重要性质.
我们首先用如下定理给出一种理解一般随机变量期望的方法, 即一般随机变量的期望都可以用离散型随机变量的期望进行逼近. 该定理的证明不做要求.
设 X 为任一随机变量. 任取一严格递减且趋于 0 的序列 (δn)n=1∞, 并令 X1,X2,… 为一列离散型随机变量, 使得 {∣Xn−X∣≤δn} 均为必然事件. 则 E[X] 存在当且仅当每个 E[Xn] 均存在, 且 E[X] 存在时有E[X]=n→∞limE[Xn].
定理 3.6.1 说明, 对于任意的随机变量 X, 可通过构造一列离散型随机变量 (Xn)n=1∞ 对 X 进行逼近, 并考察 E[Xn] 的存在性以及极限来判断 E[X] 的存在性并求 E[X] 的值. 满足定理 3.6.1 条件的离散型随机变量列 (Xn)n=1∞ 则可通过如下方式构造: 给定 (δn)n=1∞, 令θn(x)=⎩⎨⎧kδn,0,−kδn,若存在正整数 k 使得 kδn≤x<(k+1)δn,若 −δn<x<δn,若存在正整数 k 使得 −(k+1)δn<x≤−kδn,(3.6.1)则有 ∣θn(x)−x∣≤δn,∀x∈R, 因而令 Xn=θn(X) 即可使得随机变量列 (Xn)n=1∞ 满足定理 3.6.1 条件. 此外, 上式给出的函数 θn 还具有如下几条性质: (i) θn 单调不减; (ii) θn(x) 与 x 具有相同的符号; (iii) ∣θn(x)∣=θn(∣x∣)≤∣x∣.
基于以上结果, 我们可以比较方便地将离散随机变量期望的许多结果推广到一般随机变量的期望.
设 X,Y 为两个同分布的随机变量, 也就是说对任意区间 I⊆R 均有P(X∈I)=P(Y∈I).则 E[X] 存在当且仅当 E[Y] 存在, 且 E[X] 与 E[Y] 存在时有E[X]=E[Y].
证明. (⋆) 这里仅给出思路: 令函数 θn 由式 (3.6.1) 给出, 其中取 δn=1/n. 再令 Xn=θn(X), Yn=θn(Y), 则 Xn,Yn 均为离散型随机变量. 接下来由 P(X∈I)=P(Y∈I) 以及 θn 的单调性可证明对任意正整数 n, Xn=θn(X) 与 Yn=θn(Y) 具有相同的分布列, 故 E[Xn] 存在当且仅当 E[Yn] 存在, 且它们都存在时有 E[Xn]=E[Yn]. 最后, 由于 ∣Xn−X∣≤1/n 以及 ∣Yn−Y∣≤1/n, 可利用定理 3.6.1 得到E[X]=n→∞limE[Xn]=n→∞limE[Yn]=E[Y].□
设 X,Y 为随机变量.
1. | E[X] 存在当且仅当 E[∣X∣] 存在. |
2. | 若 ∣X∣≤Y 必然成立, 且 E[Y] 存在, 则 E[X] 存在, 且 ∣E[X]∣≤E[Y]. |
证明. (⋆) 令函数 θn 由式 (3.6.1) 给出, 其中取 δn=1/n. 再令 Xn=θn(X), 则有 ∣Xn−X∣≤1/n, 且因 θn 满足 θn(∣x∣)=∣θn(x)∣, 故 ∣∣Xn∣−∣X∣∣=∣θn(∣X∣)−∣X∣∣≤1/n.
我们先证明 E[X] 的存在性等价于 E[∣X∣] 的存在性. 由定理 3.6.1 可得, E[X] 的存在性等价于每个 E[Xn] 的存在性, 而 E[∣X∣] 的存在性等价于每个 E[∣Xn∣] 的存在性, 而由离散型随机变量期望的 LOTUS (定理 2.5.3), 可得 E[Xn] 的存在性等价于 E[∣Xn∣] 的存在性. 综上可得 E[X] 的存在性等价于 E[∣X∣] 的存在性.
接下来设
0≤X≤Y 且
E[Y] 存在. 令
Yn=θn(Y), 则由
θn 的单调性可得
Xn=θn(X)≤θn(Y)=Yn, 故
1E[Yn]=≥y:y≥0∑y⋅P(Yn=y)=(x,y):0≤x≤y∑y⋅P(Xn=x,Yn=y)(x,y):0≤x≤y∑x⋅P(Xn=x,Yn=y)=x:x≥0∑x⋅P(Xn=x)=E[Xn].最后利用定理
3.6.1 并令
n→∞ 即得
E[X] 存在且有
E[Y]≥E[X].
设随机变量 X,Y 的期望 E[X] 与 E[Y] 均存在, α,β 为任意两个实数. 则E[αX+βY]=αE[X]+βE[Y].
证明. 不妨设 α,β 不全为 0, 否则等式是显然的.
令函数
θn 由式 (
3.6.1)
给出, 其中取
δn=1/n. 再令
Xn=θn(X),Yn=θn(Y), 则由定理
3.6.1 可得
E[X]=n→∞limE[Xn],E[Y]=n→∞limE[Yn].令
Zn=αXn+βYn, 则有
∣Zn−(αX+βY)∣≤∣α∣⋅∣Xn−X∣+∣β∣⋅∣Yn−Y∣≤n∣α∣+∣β∣.因
Zn 均为离散型随机变量, 且
(∣α∣+∣β∣)/n 严格单调递减趋于
0, 故
(Zn)n=1∞ 满足定理
3.6.1 的条件, 从而
E[αX+βY]=n→∞limE[Zn]=n→∞lim(αE[Xn]+βE[Yn])=αE[X]+βE[Y].其中第二步用到了离散型随机变量期望的线性.
设 X 为随机变量, 满足 P(X≥0)=1. 则如下命题成立:
1. | 若 E[X] 存在, 则 E[X]≥0. |
2. | E[X]=0 当且仅当 P(X=0)=1. |
证明.
1. | 令函数 θn 由式 (3.6.1) 给出, 其中取 δn=1/n. 再令 Xn=θn(X), 则定理 3.6.1 保证了 limn→∞E[Xn]=E[X]. 另一方面, 由 ∣Xn−X∣≤1/n 可得 Xn+1/n≥X, 故 P(Xn+1/n≥0)=1. 而由于 Xn+1/n 也是离散型随机变量, 由定理 2.5.5 可得0≤E[Xn+n1]=E[Xn]+n1.令 n→∞ 并由 limn→∞E[Xn]=E[X] 即得到 E[X]≥0. |
2. | P(X=0)=1⇒E[X]=0: 由于 E[X] 仅取决于 X 的分布, 而 P(X=0)=1 意味着 X 与常函数 0 同分布, 故 E[X]=E[0]=0. ( ⋆) E[X]=0⇒P(X=0)=1: 用反证法, 假设 E[X]=0 但 P(X=0)<1. 对任意正整数 n, 令 En={X>1/n}, 则不难看出 E1,E2,… 为单调递增事件列, 且 limn→∞En={X>0}. 由概率的连续性可得 n→∞limP(En)=P(X>0).由 P(X=0)<1 可得 P(X>0)>0, 从而存在自然数 N 使得 P(EN)>0. 另一方面, 注意到 {X−N11EN≥0}为必然事件, 故由定理第 1 部分以及期望的线性得 0≤E[X−N11EN]=E[X]−N1P(EN)=−N1P(EN)<0,产生矛盾. |
下面我们证明连续型随机变量期望的 LOTUS, 即定理 3.4.3.
定理 3.4.3 的证明. (
⋆) 简单起见, 这里只给出二元函数情形的证明, 且不论证
E[g(X,Y)] 的存在性. 令函数
θn 由式 (
3.6.1)
给出, 其中取
δn=1/n. 再令
Zn=θn(g(X,Y)), 则
Zn 为离散型随机变量, 且有
E[Zn]=z∑z⋅P(Zn=z)=z∑z⋅∬θn(g(x,y))=zfX,Y(x,y)dxdy=z∑∬θn(g(x,y))=zθn(g(x,y))⋅fX,Y(x,y)dxdy=∬R2θn(g(x,y))⋅fX,Y(x,y)dxdy.而由于
≤≤∣∣∬R2θn(g(x,y))⋅fX(x)dxdy−∬R2g(x,y)⋅fX,Y(x,y)dxdy∣∣∬R2∣θn(g(x,y))−g(x,y)∣⋅fX,Y(x,y)dxdy∬R2n1⋅fX,Y(x,y)dxdy=n1,故取
n→∞ 的极限即可得到
E[g(X,Y)]=n→∞limE[Zn]=n→∞lim∬R2θn(g(x,y))⋅fX,Y(x,y)dxdy=∬R2g(x,y)⋅fX,Y(x,y)dxdy,其中第一个等号来自于定理
3.6.1.
以上介绍的一般情形下期望的性质希望读者能够记住并学会如何运用, 但它们的证明只要求读者能够顺下来即可, 不要求掌握.
最后, 我们利用定理 3.4.3 证明, 两个独立的连续型随机变量乘积的期望等于各自期望的乘积; 该结论的证明要求读者能够掌握.
设 X,Y 为相互独立的连续型随机变量, 且二者的期望均存在, 则E[XY]=E[X]⋅E[Y].
证明. 由于
X,Y 互相独立, 由定理
3.3.1 可得
(X,Y) 为连续型随机向量, 且
fX,Y(x,y)=fX(x)⋅fY(y). 接下来由定理
3.4.3 得
E[XY]=∬R2xy⋅fX,Y(x,y)dxdy=∬R2(x⋅fX(x))(y⋅fY(y))dxdy=∫−∞+∞x⋅fX(x)dx∫−∞+∞y⋅fY(y)dy=E[X]⋅E[Y].定理得证.
实际上, 只要两个独立随机变量的期望存在, 则不管它们是不是离散型或连续型, 其乘积的期望都等于期望的乘积; 该结论的证明这里就不展开了, 但读者仍可基于离散型随机变量逼近的思路来进行直观理解.
脚注