2.5. 期望与方差
离散型随机变量的分布列能够完整刻画其统计规律性, 但不一定能较为直观地给出随机变量取值上的一些特点. 本节中我们引入一些随机变量的数字特征, 这些数字特征能够更加直观地揭示随机变量取值在某些方面的性质.
我们首先介绍离散型随机变量的期望, 它是随机变量的所有取值相对于各自概率的加权平均.
定义 2.5.1. 设 为离散型随机变量, 为其分布列. 若 收敛, 则定义 的期望 (expected value 或 expectation) 为若 发散, 则称 不存在.
直观上, 我们可以把随机变量 的期望 看作是最能代表 的一个确定性数值. 此外, 由期望的定义式, 我们也可以将 直观理解为分布列 的 “质心”.
定义 2.5.1 之所以要求 收敛时 才能存在, 是为了保证 的值与求和式中各项的排列顺序没有关系; 对此不太熟悉的读者可回顾数学分析中级数的绝对收敛以及黎曼重排定理的相关知识, 例如可参阅 [7] 第十八章第 5 节.
例 2.5.2. 设 为任一事件, 则有换句话说, 任一事件的概率就等于其指示函数的期望. 从该结论还可看出, 若一个随机变量服从参数为 的伯努利分布, 则其期望就等于 .
接下来我们介绍一个计算期望的重要方法.
定理 2.5.3. 设 为离散型随机变量, 为其分布列, 为任意函数. 则 存在当且仅当 收敛, 且 存在时有
类似地, 若 为离散型随机向量, 为其分布列, 为任意二元函数, 则 存在当且仅当 收敛, 且 存在时有
在一些英文文献中, 定理 2.5.3 又被称为 law of the unconscious statistician (LOTUS). 该定理为计算随机变量函数的期望提供了一条简单的途径, 特别是我们并不需要先求出随机变量函数的分布.
以下定理则给出了期望的几条重要性质. 首先介绍的是期望的线性, 它不仅是期望最重要的理论性质之一, 而且在许多问题中是简化期望计算的重要工具.
定理 2.5.4 (期望的线性). 设 为离散型随机变量, 且 与 均存在, 为任意两个实数. 则
接下来的定理则给出了非负随机变量期望的基本性质.
定理 2.5.5. 设 为离散型随机变量, 满足 . 则如下命题成立:
1. | 若 存在, 则 . |
2. | 当且仅当 . |
证明. 记 的分布列为 .
1. | 由 可知, 当 时必定有 , 再由期望的定义式即可直接得到 . |
2. | : 由 可得 时有故对任意 均有 , 代入期望的定义即得 . : 当 时, 由于期望定义式中求和的各项均非负, 可得 时必定有 , 从而 仅在 时为正数, 而在 时均为零. 故 |
以下定理指出, 若两个随机变量相互独立, 则它们的乘积的期望等于各自期望的乘积.
定理 2.5.6. 设 为相互独立的离散型随机变量, 且二者的期望均存在, 则
方差
定义 2.5.7. 设 为一离散型随机变量. 若 与 均存在, 则定义 的方差 (variance) 为并定义 的标准差 (standard deviation) 为 .
若 或 不存在, 则称 不存在.
根据方差的定义, 我们可以直观上认为 度量了 的取值相对于期望 的分散/偏离/波动程度, 也就是说, 越大, 则 的取值相对于 的分散/偏离/波动的程度也就越大, 而 越小, 则 的取值越集中于 附近. 这个直观解释可以由如下等式进一步佐证: (2.5.1)其中 为任意实数. 换句话说, 对 的取值进行整体性的平移不会改变其方差, 而若对其取值进行倍数为 的放缩, 则方差将变为原来的 倍. 该等式的证明是直接的:
将 展开并利用期望的线性不难算得(2.5.2)在许多情况下用上式计算方差会更加方便.
例 2.5.8. 设 服从参数为 的伯努利分布, 则
接下来的定理指出, 相互独立的随机变量的和的方差等于它们的方差的和. 这个便利的性质也是人们更愿意用方差来衡量随机变量相对于期望分散程度的原因之一.
定理 2.5.9. 设 相互独立, 且它们的方差存在, 则
证明. 这里只给出 时的证明. 一般情形的证明是类似的.
脚注
1. | ^ 这里实际上涉及到了绝对收敛级数的重排定理, 对此有了解的读者可进一步验证相关的推导细节. 也可参考 附录 A.1 中的定理 A.1.2. |