我们首先对矩的概念进行简单介绍.
设 X 为一随机变量, k 为一正整数. 若 E[Xk] 存在, 则称其为随机变量 X 的 k 阶矩 (kth moment).
不难看出期望 E[X] 就是 X 的一阶矩, 而方差则是二阶矩与一阶矩平方之差. 下面的命题则指出, 由高阶矩的存在性可推出低阶矩的存在性.
若 X 的 k 阶矩 E[Xk] 存在, 则对任意 j=1,…,k, 其 j 阶矩 E[Xj] 均存在.
证明. 由命题
3.6.3 第 1 部分可知
E[∣∣Xk∣∣] 存在. 接下来, 注意到对任意
t∈R 与
0<α≤1 有
∣t∣α≤1+∣t∣, 故
∣∣Xj∣∣=∣∣Xk∣∣kj≤1+∣∣Xk∣∣,再利用命题
3.6.3 第 2 部分以及期望的线性, 可得
E[∣Xj∣] 存在, 最后由命题
3.6.3 第 1 部分得
E[Xj] 存在.
由命题 4.3.2 可得到这样一个推论: 若二阶矩 E[X2] 存在, 则一阶矩 E[X] 存在, 故由 Var(X)=E[X2]−(E[X])2 可得, Var(X) 的存在性等价于 E[X2] 的存在性.
下面我们引入矩母函数的概念.
设 X 为一随机变量. 若存在包含 0 点的开区间 I⊆R, 使得对任意 t∈I, 期望 E[etX] 均存在, 则称函数MX(t)=E[etX],t∈I为 X 的矩母函数 (moment generating function).
以下定理解释了为何把 MX(t)=E[etX] 称作 X 的 “矩母函数”.
设 X 的矩母函数 MX 在 0 的某个开邻域上有定义, 则对任意正整数 k, E[Xk] 均存在, 且MX(k)(0)=E[Xk],其中 MX(k) 表示 MX 的 k 阶导数.
证明. 这里只给出 MX 高阶导数与高阶矩关系的证明, 而高阶矩存在性的证明不做要求 (可参考 [12] 第 21 节 Moment Generating Functions 部分).
设 MX(t) 在 −δ<t<δ 时有定义, 其中 δ>0. 由指数函数的幂级数展开可得etX=k=0∑∞k!Xk⋅tk,故MX(t)=E[k=0∑∞k!Xk⋅tk]=k=0∑∞k!E[Xk]⋅tk,∀t∈]−δ,δ[,推导中我们交换了无穷级数与期望的次序, 其合法性的来由不做要求. 注意到上式最右端给出了一个关于 t 的幂级数, 对其进行逐项求导 (可参考 [7] 第十九章 4.4b 节定理 3) 可得MX(k)(t)=j=k∑∞(j−k)!E[Xj]⋅tj−k,∀t∈]−δ,δ[.故MX(k)(0)=E[Xk].□
接下来我们介绍矩母函数的其它重要性质.
设随机变量 X 的矩母函数为 MX, α,β 为任意实数. 则 Y=αX+β 的矩母函数为MY(t)=eβtMX(αt),其中 t 须使得 MX(t) 有定义.
证明. 由简单的计算即可得MY(t)=E[et(αX+β)]=eβtE[e(αt)X]=eβtMX(αt).□
设随机变量 X,Y 相互独立, 且二者的矩母函数 MX 与 MY 均存在, 则 X+Y 的矩母函数 MX+Y 为MX+Y(t)=MX(t)⋅MY(t),其中 t 须使得 MX(t) 与 MY(t) 均有定义.
证明. 由 X 与 Y 相互独立可得 eX 与 eY 相互独立, 故MX+Y(t)=E[et(X+Y)]=E[etX⋅etY]=E[etX]⋅E[etY]=MX(t)⋅MY(t).□
需要注意定理 4.3.6 当中要求 X 与 Y 相互独立.
设 X 与 Y 的矩母函数在 0 的某个邻域上处处相等, 则 X 与 Y 同分布, 也就是说对任意区间 I⊆R, 有 P(X∈I)=P(Y∈I).
定理 4.3.7 说明随机变量的分布可由其矩母函数唯一决定. 该定理的证明不做要求.
将定理 4.3.6 与 4.3.7 结合, 可得到求解独立随机变量 X 与 Y 和的分布的另一种方法: 我们先算出 X 与 Y 各自的矩母函数, 再将二者相乘算出 X+Y 的矩母函数 MX+Y, 最后将 MX+Y 与已知的各种分布的矩母函数进行对照, 找到 X+Y 服从的分布. 表 1 列出了一些常用概率分布的矩母函数.
X 的分布 | 参数 | 分布列/概率密度函数 | 矩母函数 MX(t) |
---|
伯努利分布 | p | pX(0)=1−p, pX(1)=p | 1−p+pet |
二项分布 | (n,p) | pX(k)=(kn)pk(1−p)n−k(k=0,…,n) | (1−p+pet)n |
几何分布 | p | pX(k)=(1−p)k−1p(k=1,2,…) | 1−(1−p)etpet(t<−ln(1−p)) |
负二项分布 | (r,p) | pX(k)=(r−1k−1)pr(1−p)k−r(k=r,r+1,…) | (1−(1−p)etpet)r(t<−ln(1−p)) |
泊松分布 | λ | pX(k)=e−λλk/k!(k=0,1,2,…) | exp(λ(et−1)) |
均匀分布 | [a,b] | fX(x)=b−a1 (x∈[a,b]) | (b−a)tebt−eat |
指数分布 | λ | fX(x)=λe−λx (x≥0) | 1−λ−1t1 (t<λ) |
正态分布 | (μ,σ2) | fX(x)=2πσ1exp(−2σ2(x−μ)2) | exp(μt+21σ2t2) |
Gamma 分布 | (α,β) | fX(x)=Γ(α)βαxα−1e−βx (x>0) | (1−β−1t)−α (t<β) |
表 1. 一些常用概率分布的矩母函数 设 X 服从参数为 λ 的泊松分布, 则其矩母函数为MX(t)==k=0∑∞etk⋅e−λk!λk=e−λk=0∑∞k!(λet)ke−λ⋅exp(λet)=exp(λ(et−1)),(4.3.1)其中 t∈R. 现设 Y 与 X 独立且服从参数为 μ 的泊松分布, 则 X+Y 的矩母函数为MX+Y(t)==MX(t)⋅MY(t)=exp(λ(et−1))⋅exp(μ(et−1))exp((λ+μ)(uet−1)),∀t∈R.将上式与式 (4.3.1) 比较可得, X+Y 服从参数为 λ+μ 的泊松分布.
设 X∼N(μ,σ2), 则其矩母函数为MX(t)====∫−∞+∞exp(tx)⋅2πσ1exp(−2σ2(x−μ)2)dx2πσ1∫−∞+∞exp(−2σ2x2−2μx−2tσ2x+μ2)dxexp(−2σ2−2μtσ2−t2σ4)2πσ1∫−∞+∞exp(−2σ2(x−μ−tσ2)2)dxexp(μt+21σ2t2),(4.3.2)其中 t∈R. 现设 X1∼N(μ1,σ12), X2∼N(μ2,σ22) 且 X1,X2 独立, 则 X1+X2 的矩母函数为MX1+X2(t)==MX1(t)⋅MX2(t)=exp(μ1t+21σ12t2)⋅exp(μ2t+21σ22t2)exp((μ1+μ2)t+21(σ12+σ22)t2),∀t∈R.将上式与式 (4.3.2) 比较, 可得 X1+X2∼N(μ1+μ2,σ12+σ22).
利用类似的方法可证明如下更一般的结论: 设 X1,…,Xn 相互独立, 且 Xi 服从正态分布 N(μi,σi2). 令 α1,…,αn 与 β 为任意实数, 则Y=i=1∑nαiXi+β服从正态分布 N(∑i=1nαiμi+β,∑i=1nαi2σi2). 证明的具体步骤留给读者完成.
设 N,X1,X2,… 为相互独立的随机变量, N 服从参数为 p 的几何分布 (其中 0<p<1), 而 X1,X2,… 服从参数为 λ 的指数分布. 我们希望求出 Y=∑i=1NXi 的概率分布.
首先考察 Xi 的矩母函数: MXi(t)=∫0+∞etx⋅λe−λxdx=1−λ−1t1,∀t<λ.接下来, 为求出 Y 的分布, 我们从它的矩母函数入手. 注意到MY(t)===E[exp(t⋅i=1∑Nxi)]=E[exp(t⋅i=1∑Nxi)⋅n=1∑∞1{N=n}]n=1∑∞E[exp(t⋅i=1∑Nxi)⋅1{N=n}]=n=1∑∞E[exp(t⋅i=1∑nxi)⋅1{N=n}]n=1∑∞E[1{N=n}⋅i=1∏netXi],再利用 N,X1,X2,… 的独立性, 并由指数分布的矩母函数, 可得MY(t)==n=1∑∞P(N=n)⋅i=1∏nE[etXi]n=1∑∞(1−p)n−1p⋅(1−λ−1t1)n=1−(pλ)−1t1,其中 t<pλ. 故可得 Y 服从参数为 pλ 的指数分布.