2.1. 随机变量的定义

在许多随机试验中, 相较于直接考察试验结果的统计规律, 我们往往会从各个试验结果中提炼出一些定量特征来进行研究, 这些定量特征可以看成是试验结果的函数. 在概率论中, 我们将试验结果的实值函数称为随机变量. 引入随机变量能够带来如下几个方面的好处:

在某些随机试验中, 我们只关心试验结果的某个函数的取值情况, 此时将研究重点放在相应的随机变量上能使我们更有针对性地揭示统计规律;

样本空间作为一个一般的集合, 有时难以直接对其元素进行运算或比较大小关系, 而样本空间上的实值函数则可进行各种运算及大小关系的比较, 从而能帮助我们挖掘更深层次的统计规律;

随机变量将 “底层” 的概率空间 包装为分布函数、分布列、概率密度函数等利用微积分知识即可方便使用的 “接口”, 这为概率建模与相关的推导提供了莫大的便利.

定义 2.1.1. 为一概率空间. 我们将定义在 上的实值函数 称作一个随机变量 (random variable), 若对任意 中的区间 , 均有

定义 2.1.1 中要求形如 的集合都在事件域 中, 它保证了 的概率是有定义的, 也就是说对任意区间 , 我们都可以谈论 “随机变量的取值落在区间 中” 这一事件的概率.

给定随机变量 以及关于实数 的命题 , 我们经常用记号 来表示集合 , 例如对于实际问题中所关心的绝大多数命题 , 原则上均可证明 为一事件, 也就是说 的概率是有定义的 1, 此时我们用 表示 的概率. 例如

从已有的随机变量出发, 可以构造出新的随机变量. 具体而言, 给定 个随机变量 以及函数 , 我们用 表示将 映为 的函数. 对于绝大多数实际问题中遇到的函数 , 原则上均可证明 为一随机变量; 特别是, 给定随机变量 以及实数 , 则 均为随机变量.

在本讲义中, 若无特别说明, 均假定形如 的集合是一个事件 (也就是说其概率 有定义), 而形如 的函数为一随机变量.

例 2.1.2 (指示函数). 事件的指示函数是最简单的一类随机变量. 设 为任意集合, 的任一子集, 我们定义 指示函数 (indicator function) 现设 为一概率空间, 任给一事件 , 我们证明其指示函数 为随机变量: 任取区间 , 有 均为事件, 故 为一随机变量. 不难看出, 随机变量 在事件 发生时取值为 , 而在 没有发生时取值为 .

指示函数在概率论中有着基础性作用, 从指示函数出发, 可以构造一系列更加复杂的随机变量. 例如, 设 为一列两两互斥的事件, 为任意一列实数, 则可以证明为一随机变量, 该随机变量在事件 发生时的取值即为

例 2.1.3. 设概率空间 , 概率测度 对任意 的子区间 均有定义, 且 等于 的长度. 现任取 , 并定义 则对任意区间 , 有由于 是严格单调的连续函数, 可知上式右端为 的子区间或空集, 故 有定义, 从而由区间 的任意性可得 为一随机变量.

注意到对任意区间 , 有其中我们进行了积分换元 . 上式意味着 可以表示为一个非负函数在区间 上的积分.

2.1.2 2.1.3 各自给出了如下两类随机变量的典型例子: 前一类随机变量可能的取值只有可数多个; 后一类随机变量可能的取值有不可数个, 且它取值于任一区间的概率等于某个非负函数在该区间上的积分. 我们将前一类随机变量称为离散型随机变量, 而后一类随机变量则称为连续型随机变量. 考虑到数学工具上的限制以及大多数实际应用的情形, 本讲义中将分别对这两类随机变量进行较为详细的讨论, 而一般性的随机变量理论则只做简要介绍.

脚注

1.

^ 相关证明超出本讲义范围, 属于高等概率论的内容.