4.5. () 二维正态分布

定义 4.5.1. 为连续型随机向量, 为实向量, 为实对称正定矩阵. 我们称 服从参数为 正态分布高斯分布 (normal/Gaussian distribution) 并记为 , 若 的联合概率密度函数可表示为(4.5.1)其中 为某个正实数.

利用 , 可求得式 (4.5.1) 中的常数 我们将具体的计算过程放在了习题 4.6.23 中.

本节随后的重点是给出二维正态分布的几个核心性质:

1.

正态分布的参数 直接给出了期望、方差与协方差信息.

2.

二维正态分布的边缘分布为一维正态分布.

3.

服从二维正态分布的随机向量经过可逆仿射变换后仍服从二维正态分布.

为了一步步推导上述性质, 我们从几个引理入手.

引理 4.5.2. 服从正态分布 , 则 相互独立, 且 各自均服从标准正态分布 .

引理 4.5.2 的证明思路是非常直接的: 为了证明 独立, 只需考察 是否能写为一个关于 的函数与一个关于 的函数的乘积, 而对这两个函数分别归一化即可得到边缘概率密度函数; 我们将具体的证明步骤留给读者自己完成.

引理 4.5.3., 而 为实对称正定矩阵, 随机向量 .则存在可逆矩阵 以及随机向量 满足

证明. 这里给出的证明需要一些线性代数的知识, 对此比较生疏的读者可阅读附录 A.3 进行回顾.

为实对称正定矩阵, 故可对其做特征值分解: 其中 为一对角阵, 其对角元 均大于 , 而 为正交阵, 满足 .令则不难看出 为对称阵, 且由于 的对角元均大于 , 可知 可逆.此外, 接下来, 令则有 , 且由推论 4.1.10 可得, 引理得证.

接下来我们即可考察正态分布参数 的具体意义.

命题 4.5.4.. 则

证明. 先考虑 的情况.由引理 4.5.2, 可得 相互独立, 且每个 均服从 .故以及故待证命题对于 的情形成立.

接下来考虑一般情形.记由引理 4.5.3 可得, 存在可逆矩阵 以及随机向量 满足 以及 , 即 取期望即得到 的方差则为其中我们利用了定理 4.2.7 以及式 (2.5.1). 的协方差则为证毕.

在搞清了二维正态分布参数的意义后, 我们可以将二维正态分布的密度函数写成另外一种形式: 设 服从二维正态分布, 令 , , 的相关系数, 则由可得

下面我们考虑二维正态分布的边缘分布.

定理 4.5.5. 服从二维正态分布, 则 各自均服从一维正态分布.

证明. 为了证明上的简洁, 不妨设 , 其中 正定; 一般情形的证明方法是类似的.

, 则 也是正定矩阵, 其对角元 大于 .将 展开: (4.5.2)其中我们对 做了配方. 由此得 可表示为将上式对 在实数轴上求积分, 即得到对上式右端的积分做换元 后, 不难看出该积分为一个与 无关的常数, 将这个常数暂记为 , 则有而由式 (4.5.2) 可看出 : 否则可以令 以及 , 则此时 非零且满足 , 与 是正定矩阵相矛盾.再结合上式给出的 的表达式, 即可看出 服从某个一维正态分布.同理可得 服从某个一维正态分布.

接下来, 我们证明正态分布的随机变量经过可逆的仿射变换后依然服从正态分布.

定理 4.5.6., 为一可逆矩阵, , 则随机向量服从正态分布

证明. 由引理 4.5.3 可知, 存在可逆矩阵 以及随机向量 满足 以及 , 从而有其中我们记 . 由于 均为可逆矩阵, 因此 也可逆. 此外, 接下来即可利用推论 4.1.10 得到

由定理 4.5.5 4.5.6, 还可得到如下推论:

推论 4.5.7., 为非零向量, 为一实数. 令.

证明. 由于 非零, 故可以找到一个非零向量 使得 线性无关. 令并令 , 则 就是随机向量 的第一个分量. 由定理 4.5.6 可知 服从二维正态分布, 再由定理 4.5.5 可得 服从一维正态分布, 该正态分布的参数可通过计算 的期望与方差直接得到, 具体的计算过程交给读者完成.