4.5. 一些例子

可逆矩阵开根

命题 4.5.1. 阶可逆复方阵. 则存在可逆方阵 使得 .

我们首先考虑 是一个 Jordan 块的情况, 即

我们把 写成 . 利用函数 处的 Taylor 展开我们得到级数恒等式

代入矩阵 并利用 , 我们得到因此我们可以取

对于一般的情况, 我们可以作相似变换这里每个 都是 Jordan 块, 因此可以如上构造 使得 . 取则满足 .

注记. 类似的方法可以证明, 对于 阶可逆复方阵和正整数 , 存在可逆方阵 使得 .

指数矩阵

命题 4.5.2. 阶复方阵. 则如下矩阵级数收敛到一个可逆矩阵, 并且

我们同样也是先考虑 是一个 Jordan 块的情况, 即利用 易知 收敛到 (计算留作练习) 此时有 .

对于一般的情况, 我们可以作相似变换并且成立. 由于 , 是可逆矩阵. 实际上, 的逆易知是 .

例子 4.5.3. 考虑方阵可以验证它相似于如下 Jordan 标准型 有两个 Jordan 块. 因此

极小多项式

由 Cayley–Hamilton 定理, 我们知道 阶方阵 的特征多项式 的一个化零多项式, 即满足

实际上满足 的多项式, 即 的化零多项式中, 特征多项式 并不一定是次数最低的. 例如对于方阵容易验证 满足一个 3 次代数方程

定义 4.5.4. 方阵 的所有非平凡化零多项式中次数最小的首一多项式称为 的极小多项式, 记为 . 这里首一多项式指的是多项式最高次项的系数是 , 即 .

由 Cayley–Hamilton 定理知 有化零多项式, 因此 的极小多项式是存在的且次数不超过 的阶数. 另一方面, 的极小多项式是唯一的. 假设 均为 的极小多项式. 则 的次数相同, 并且 是次数更低的化零多项式. 由极小多项式的次数最小性, 说明 是平凡的, 即 .

首先我们注意到, 如果 不是 的特征值, 则线性方程组只有零解, 即 是可逆矩阵. 因此如果 的化零多项式且 的一个根, 即有 , 则 也是 的化零多项式且次数比 低. 这说明 的根只包含 的特征值.

例子 4.5.5. 阶 Jordan 块, 则 的最小多项式为

实际上, 只有一个特征值 , 其最小多项式形如 . 由于满足 , 我们得到 . 此时 的极小多项式等于特征多项式.

命题 4.5.6. 阶复方阵, 的所有互不相同的特征值. 则 的最小多项式为其中 是特征值 的 Jordan 块的最大阶数, 即 是特征值 最高次数的初等因子.

证明: 相似于 Jordan 标准型
对任何多项式 , 我们有因此 当且仅当对每个 均有 =0. 而每个 是形如由 Jordan 块构成的方阵因此 当且仅当对每个 . 由例 4.5.5 易知

例子 4.5.7. 方阵 的极小多项式为 .

Google PageRank

PageRank 是 Google 搜索引擎用来排名网页相关性和重要性的算法. 其核心思想是一个网页的重要性与其链接到的网页的重要性的数量和质量有关. 基本数学原理是通过网页数据得到一个大型的矩阵, 然后通过求解最大特征值的特征向量得到排名数据.

我们将互联网看作一个巨大的有向图, 每个节点代表一个网页, 每条有向边代表一个链接, 边的方向表示链接的方向.

上图表示有 4 个网页 A、B、C、D, 链接关系如下:

A 链接到 B 和 C

B 链接到 C

C 链接到 A 和 D

D 链接到 A

PageRank 算法将给每个网页 匹配一个 PageRank 值 , 的值越大表示其越重要. 其基本思想是这个 PageRank 值是通过网络关系来体现的: 如果更多更重要的网页关联到某个网页, 那么这个网页本身也更重要. 具体而言, 引入链接关系矩阵 :

如果网页 链接到网页 , 则其中 是所有从网页 链出的边数.

如果网页 没有链接到网页 , 则

表现了从网页 链接到网页 的权重. 例如对上图所示 4 个网络, 其链接关系矩阵为这里我们用 来分别表示网页 A,B,C,D. 例如

, 因为网页 C 链接到网页 A, 且网页 C 的出链数量为 2 (链接到 A 和 D) .

, 因为网页 A 链接到网页 B, 且网页 A 的出链数量为 2 (链接到 B 和 C) .

, 因为网页 B 链接到网页 C, 且网页 B 的出链数量为 1 (链接到 C) .

, 因为没有链接从网页 C 链接到网页 B.

PageRank 算法用来计算每个网页 PageRank 权重 的方法为: 一个网页的 PageRank 值等于所有链接到它的网页的 PageRank 值的加权平均, 权重为链接概率. 具体公式为:

我们把所有网页的 PageRank 权重 组合为列向量 , 则上述方程可以写成矩阵形式因此寻找网页的 PageRank 值即为求解链接关系矩阵 属于特征值 的特征向量.

上述 4 个网页的例子中, 求解 可以得到归一化的 PageRank 值因此 重要性最高, 次之. 这个结果和图示是相符合的.

是否有特征值 ?

首先观察到每个网页链出的总权重是 , 即对每个 写成矩阵的形式为这表明 的转置 有一个属于特征值 的特征向量. 由于 具有相同的特征多项式, 这说明 一定有特征值 , 因此方程 是有解的.

的属于特征值 的特征子空间 是否是 维的?

如果特征子空间 维的话, 那么得到唯一的一个 PageRank 向量 (不同特征向量差一个系数, 可以通过设置归一化条件 把这个系数固定) . 然而实际上很容易找到 的例子, 这给用 PageRank 算法来准确地衡量网页的重要性造成了困难.

为了解决这个困难, PageRank 算法引入了一个阻尼因子 (通常设置为 0.85). 阻尼因子表示用户有 的概率点击链接, 的概率随机跳转到任意一个网页. 改进后的链接关系矩阵为这里 的每个矩阵元都是 ( 是网页的总个数) 的每一列加起来仍然是 , 因此仍然有特征值 . 改进的 PageRank 计算公式为

命题 4.5.8. 的特征子空间 是 1 维的.

证明: 首先观察到 的每个矩阵元 . 假设 是任意一个特征向量, 即满足我们说明 的每个分量不可能即有正数又有负数. 实际上, 假如 中即有正数也有负数. 由于 , 我们有

由特征向量方程 , 得到两边对 求和, 并利用 , 我们得到矛盾. 这说明 的每个分量不可能即有正数又有负数.

现在假设 . 设 中两个线性无关的特征向量. 不妨设 的分量都是非负的, 因此 . 取非零实数 使得

考虑线性组合 . 由于 , 上述讨论知它每个分量不可能即有正数又有负数. 由 的取法, 向量 的所有分量求和是 , 因此必然有 . 这与 线性无关的假设矛盾. 因此假设 不成立, 故 .

这个命题说明, 在考虑阻尼因子后, 用改进的算法的确得到一个确定的 PageRank 向量. 可以进一步证明 (见习题) , 的根子空间 也是 维的, 即 .

如何计算 PageRank 向量?

实际应用中网页的数量是非常多的, 改进的链接关系矩阵 是一个巨大的矩阵. 如何有效的计算 PageRank 向量  ? 这里关键的一个性质是如下命题.

命题 4.5.9. 是改进的链接关系矩阵 的一个特征值, 则 .

证明: 设复列向量 是属于特征值 的一个特征向量: . 考虑如下行向量

由于 并且每个

由方程 得到 , 即因此

可以进一步证明, 满足 的特征值只有 (见习题) . 由命题 4.5.8 和命题 4.5.9 以及 Jordan 标准型知, 改进的链接关系矩阵 相似于这里 Jordan 块 对应的特征值 均满足 . 对于这样的 Jordan 块, 可以证明 (见习题)

因此

的列向量为由构造知 是特征值 的特征向量. 我们得到

现在取一个初始向量 , 设并且 . 则收敛到特征值 的一个特征向量!

这给出了如下计算 PageRank 向量 的算法: 取初始向量即初始时把所有网页的 PageRank 值都设置为 . 然后开始迭代计算

注意到因此每个迭代的向量 的所有分量的和都是 , 即都是归一化的. 当 充分大时, 多次迭代得到的向量 即给出了 PageRank 向量 的近似值.