4.2. 协方差与相关系数

让我们考虑这样一个问题: 给定两个随机变量 , 它们的和 的方差等于什么? 由方差的定义可得我们看到 的方差不仅包含了 的方差与 的方差的和, 还包括了一个交叉项 . 我们将这个交叉项定义为随机变量 的协方差.

定义 4.2.1. 给定随机变量 , 设 均存在. 若期望存在, 则将该期望称作 协方差 (covariance), 记作 .

由定义不难看出协方差具有对称性 , 且方差其实是协方差的一个特例, 即 . 我们将协方差 的定义式展开, 可得在许多场合中用上式计算协方差是更加方便的.

以下命题指出, 协方差具有 “双线性” 的性质.

命题 4.2.2. 为两组随机变量, 且协方差 对任意 均存在. 为两组取值任意的实数, 则有

证明. 由协方差的定义与期望的线性, 可得证毕.

例 4.2.3. 为两个随机变量, 二者各自的方差与协方差均存在, 且 . 我们考虑如何用 的一次函数 来近似 . 具体而言, 我们希望找到 使得近似误差的均方值达到最小.

为求得最优的 , 首先注意到观察上式右端的形式不难看出, 若要使 取到最小值, 则 应满足也就是说, 若以误差的均方值为衡量标准, 则(4.2.1)是在所有 的一次函数中对 的最佳近似. 此外, 不难得到最佳近似导致的误差的均方值为(4.2.2)

式 (4.2.1) 进一步揭示了协方差 的直观意义:

1.

时, 最佳近似 的系数是正的. 直观上看, 这可以解释为当 的取值增加时, 的取值具有增加的趋势. 此时我们称 正相关 (positively correlated).

2.

类似地, 的情形可以直观解释为当 的取值增加时, 的取值具有减小的趋势. 此时我们称 负相关 (negatively correlated).

3.

时, 直观上可认为 取值的增减对 取值的变化趋势没有影响. 此时我们称 不相关 (uncorrelated). 由式 (4.2) 可得 不相关的充要条件是 .

不难看出若 相互独立且二者的期望均存在, 则 不相关; 但需注意该结论的逆命题不成立: 不相关推不出 相互独立.

例 4.2.4., 为连续型随机向量且联合概率密度函数为则由对称性不难看出 以及从而 不相关. 另一方面, 的边缘分布分别为并由对称性可得 , 从而但显然有 , 故 不相互独立.

下面我们给出两个反例, 提醒读者在处理不相关的随机变量时需小心, 有些对于相互独立随机变量成立的性质不一定能推广到互不相关的随机变量上.

例 4.2.5. 相互独立且均服从参数为 的伯努利分布. 令显然 不相关. 而由以及可得 , 故 不相关. 同理可得 不相关. 因而 这三个随机变量两两互不相关. 但另一方面, 不难看出乘积 总是等于 , 故这说明对于三个或三个以上两两互不相关的随机变量, “乘积的期望等于期望的乘积” 这一性质一般不再成立.

例 4.2.6., . 则其中我们利用了期望的 LOTUS. 故 , 也就是说 不相关. 另一方面, 令 , 则显然 不是互不相关的. 这说明 “互不相关的随机变量各自被函数作用后依然互不相关” 一般是不成立的, 这与随机变量相互独立的情形是不同的.

以下定理指出, 两两不相关的随机变量和的方差等于这些随机变量方差的和.

定理 4.2.7. 设随机变量 两两不相关且方差均存在, 则

证明. 由方差定义以及期望的线性可得由于 两两不相关, 可知 时交叉项 均等于 , 故

相关系数

现假设 . 由式 (4.2.2) 以及 , 可得其中 分别为 的标准差. 这提示我们可以对 进行归一化来更好地刻画两个随机变量之间的相关性.

定义 4.2.8. 给定两个随机变量 , 并设 , . 则其相关系数 (correlation) 被定义为通常将 的相关系数记为 .

相关系数 的取值范围为 , 且

1.

正相关, 负相关, 不相关.

2.

为例 4.2.3 给出的 的一次函数中对 的最佳近似. 我们考虑用 近似 所导致的相对均方误差: 因此 越接近于 , 则 近似 的相对均方误差越小. 换句话说, 越接近于 , 则可以认为 之间具有越显著的线性关系. 特别地, 当且仅当存在 使得 几乎必然成立, 而 当且仅当存在 使得 几乎必然成立.

上述结论中 的充要条件的证明留作习题 4.6.8.