让我们考虑这样一个问题: 给定两个随机变量 X,Y, 它们的和 X+Y 的方差等于什么? 由方差的定义可得Var(X+Y)=E[(X−E[X]+Y−E[Y])2]=E[(X−E[X])2]+E[(Y−E[Y])2]+2E[(X−E[X])(Y−E[Y])].我们看到 X+Y 的方差不仅包含了 X 的方差与 Y 的方差的和, 还包括了一个交叉项 E[(X−E[X])(Y−E[Y])]. 我们将这个交叉项定义为随机变量 X 与 Y 的协方差.
定义 4.2.1. 给定随机变量 X,Y, 设 E[X] 与 E[Y] 均存在. 若期望E[(X−E[X])(Y−E[Y])]存在, 则将该期望称作 X 与 Y 的协方差 (covariance), 记作 Cov(X,Y) 或 σXY.
当 Cov(X,Y)>0 时, 最佳近似 f∗(X) 中 X 的系数是正的. 直观上看, 这可以解释为当 X 的取值增加时, Y 的取值具有增加的趋势. 此时我们称 X 与 Y 正相关 (positively correlated).
2.
类似地, Cov(X,Y)<0 的情形可以直观解释为当 X 的取值增加时, Y 的取值具有减小的趋势. 此时我们称 X 与 Y 负相关 (negatively correlated).
3.
当 Cov(X,Y)=0 时, 直观上可认为 X 取值的增减对 Y 取值的变化趋势没有影响. 此时我们称 X 与 Y 不相关 (uncorrelated). 由式 (4.2)可得 X 与 Y 不相关的充要条件是 E[XY]=E[X]E[Y].
不难看出若 X 与 Y 相互独立且二者的期望均存在, 则 X 与 Y 不相关; 但需注意该结论的逆命题不成立: X 与 Y 不相关推不出 X 与 Y 相互独立.
例 4.2.4. 记 D={(x,y)∈R2∣x2+y2≤1}, (X,Y) 为连续型随机向量且联合概率密度函数为fX,Y(x,y)=⎩⎨⎧π1,0,(x,y)∈D,(x,y)∈/D.则由对称性不难看出 E[X]=E[Y]=0 以及E[XY]=∬Dxy⋅π1dxdy=0.从而Cov(X,Y)=E[XY]−E[X]E[Y]=0,即 X 与 Y 不相关. 另一方面, X 的边缘分布分别为fX(x)=∫−∞+∞fX,Y(x,y)dy=⎩⎨⎧π21−x2,0,∣x∣<1,∣x∣≥1.并由对称性可得 fY=fX, 从而P(X>2/2)⋅P(Y>2/2)==∫2/21π21−x2dx∫2/21π21−y2dy(4ππ−2)2,但显然有 P(X>2/2,Y>2/2)=0, 故 X 与 Y 不相互独立.