3.5. 一般随机变量与分布函数

本节中, 我们对一般随机变量的理论进行简单介绍.

首先回答一个问题: 任一随机变量是否必定是离散型或连续型之一? 答案是否定的.

例 3.5.1. 为一概率空间, 随机变量 服从参数为 的伯努利分布, 随机变量 服从标准正态分布, 相互独立. 令随机变量 可以证明 不是连续性随机变量: 注意到由于连续型随机变量取某个给定值的概率总是 , 故 不是连续型随机变量. 但另一方面, 也可证明 不是离散型随机变量: 若 是离散型随机变量, 令其分布列为 , 则有 , 故必定存在 使得 , 但若取充分小的 使得 , 则有 即可得到 , 与 矛盾.

例 3.5.2. () 设 为一概率空间, 随机变量 服从 上的均匀分布. 任取 , 将 展开为二进制小数 1再令由此可以得到一个随机变量 . 可以证明, 对任意 , 均有 , 故 不可能是一个离散型随机变量. 但也可以证明, 并不存在定义在 上的非负函数 使得 , 因此 也不是一个连续型随机变量.

为了研究那些既非离散型也非连续型的随机变量, 并且也为了用一个统一的数学工具去刻画随机变量取值的统计规律, 我们引入分布函数的概念.

定义 3.5.3. 为一随机变量, 令函数 定义如下: 我们称 为随机变量 分布函数, 也称为累积分布函数 (cumulative distribution function, c.d.f).

对于任意的随机变量 , 其分布函数 都是有定义的, 这是因为随机变量的定义要求 必须是一个事件, 从而其概率有定义. 后面我们将看到, 分布函数能够完整刻画单个随机变量的统计规律性, 并且大多数随机变量的数字特征 (包括期望、方差等) 仅依赖于其分布函数.

以下定理总结了分布函数所具有的基本性质.

定理 3.5.4. 为一概率空间, 为一随机变量, 为其分布函数. 则

1.

上单调不减.

2.

, 并且

3.

上右连续, 即对任意的 , 有

定理 3.5.4 中分布函数单调不减的证明较为直接: 注意到 时有再由概率的非负性可直接得到 时有 . 则是概率测度定义的直接推论. 其余性质的证明超出本课程的范围, 我们将其放在本节倒数第二小节作为选读内容.

定理 3.5.4 的逆定理也同样成立: 若函数 满足 (i) 上单调不减; (ii) , ; (iii) 上右连续, 则存在一概率空间 及随机变量 , 使得 的分布函数, 此时我们称函数 给出了一个概率分布. 这个结论的证明不做要求.

分布函数 直接给出了 的概率, 而 的概率则由如下命题给出, 其证明放在本节最后一小节中作为选读内容:

命题 3.5.5. 为一随机变量, 为其分布函数, , 则有

基于命题 3.5.5, 我们可以进一步由概率的可加性得到 落于任意区间内的概率, 例如而对于更加一般的 的子集 , 只要它可以表示为可数个互不相交的区间的并, 我们就可以利用概率的可数可加性来求得 . 在这个意义上, 我们可以说分布函数能够完整刻画单个随机变量的统计规律性.

对于离散型或连续型的随机变量 , 不难由它的分布列 或概率密度函数 求出分布函数 : 而反过来, 给定 的分布函数, 我们也可以去求它的分布列或概率密度函数:

的值域是可数集, 即 为离散型随机变量时, 其分布列为

为连续函数时, 令若进一步有 , 则 是连续型随机变量, 上式算出的 即为 的概率密度函数; 否则 不是连续型随机变量 2.

1 2 分别给出了一些离散型与连续型概率分布的分布函数图像.

Cdf discrete distributions.png
图 1. 一些离散型概率分布的分布函数.
Cdf continuous distributions.png
图 2. 一些连续型概率分布的分布函数.

例 3.5.6 (均匀分布的分布函数). 服从区间 上的均匀分布, 其中 , 则其分布函数 它是一个分段线性函数, 其图像如图 2(a) 所示.

例 3.5.7 (指数分布的分布函数与无记忆性).

服从参数为 的指数分布. 则其分布函数为指数分布的分布函数图像如图 2(b) 所示.

指数分布具有如下意义上的无记忆性: 若 服从参数为 的指数分布, 则对任意非负实数 , 均有这意味着, 若我们把 看成从零时刻开始到某件事情发生所需要等待的时间, 则已知 的作用相当于把时间原点向右平移了 , 而 时刻以后所需要的额外的等待时间依然服从原来的指数分布, 它 “忘记” 了这件事情在 时刻之前并未发生的这段历史.

例 3.5.8 (正态分布的分布函数)., 则其分布函数为等号右端的积分并没有初等函数表达式, 我们将它作为特殊函数处理, 记作

更一般地, 设 , 则其分布函数为其中第二步做了换元 . 正态分布的分布函数图像如图 2(c) 所示.

随机向量的联合分布函数

对于一般的二维随机向量 , 我们可定义其联合分布函数 (又称作联合累积分布函数, joint cumulative distribution function, joint c.d.f.) 为该定义可以很容易推广到更高维的随机向量.

理论上可以证明, 只要已知分布函数 , 那么对于常见的平面上的区域 , 其概率 都能被唯一确定下来. 然而, 直接由 出发来计算 对于许多问题而言并不方便, 更常见的做法是先考察 是否是离散型或连续型随机向量并求出其联合分布列或联合概率密度, 或是以之后将要介绍的条件期望为工具进行求解. 本讲义中, 我们不对联合分布函数进行较为详细的介绍, 而仅罗列一些相关结论如下:

为连续型随机向量当且仅当其联合分布函数可表示为如下形式:

此外, 若已知 为连续型随机向量, 且 在某个平面上的开区域 内二阶连续可导, 则有

上述结果常用于求解连续型随机向量 的联合概率密度函数.

已知 的联合分布函数, 则 各自的分布函数 (也就是边缘分布函数) 被唯一确定:

相互独立的充要条件是

() 定理 3.5.4 其余结论的证明

记样本空间为 . 我们先证明 . 注意到 为单调不减的函数, 因此只需证数列 时的极限为 . 现对任意正整数 , 令 , 则 为递增的事件列, 且故由概率的连续性可得

接下来证明 . 注意到 作为随机变量 的分布函数满足 , 故令上式中 即可得到 .

最后我们证明 的右连续性. 给定任意 , 记 , 则 为递减的事件列, 且故由概率的连续性可得 的单调性保证了右极限 存在且等于 , 故 .

() 命题 3.5.5 的证明

记样本空间为 . 令由于 的增大单调递减, 故 成立时 必定成立, 因此 为一递增的事件列. 另一方面, 其中利用了 . 故由概率的连续性可得其中 的存在性由 的单调性保证.

脚注

1.

^ () 若存在正整数 使得 , 则 存在两种二进制小数表示, 为明确起见, 这种情况下我们取 的那种二进制小数表示.

2.

^ “否则” 部分的严格证明超出本讲义范围, 不做要求.