特征值与特征向量 我们知道 n 阶方阵 A 对应于线性映射 f : k n → k n (这里数域 k = R 或者 C ) f : ⎣ ⎡ x 1 x 2 ⋯ x n ⎦ ⎤ ↦ ⎣ ⎡ a 11 a 21 ⋯ a n 1 a 12 a 22 ⋯ a n 2 ⋯ ⋯ ⋯ ⋯ a 1 n a 2 n ⋯ a nn ⎦ ⎤ ⎣ ⎡ x 1 x 2 ⋯ x n ⎦ ⎤ 即把列向量 x 映射为f ( x ) = A x
为了更好地刻画这个映射的结构和几何性质, 我们可以寻找一些特殊的向量使得这个线性映射把这些特殊向量映射到相对简单的形式. 其中最自然的一类向量, 就是使得线性映射把它映射到它自己的一个倍数. 这类向量称为特征向量, 其伸缩的倍数称为特征值.
设 A 是一个 n 阶方阵. 如果存在一个非零向量 x 和一个数 λ 使得A x = λ x 则 λ 称为 A 的一个特征值, x 称为 (属于特征值 λ 的) 一个特征向量.
这个概念类似地也可以对线性变换来定义.
设 f : V → V 是线性空间 V 到自身的一个线性映射. 如果存在一个非零向量 x ∈ V 和一个数 λ 使得f ( x ) = λ x 则 λ 称为 f 的一个特征值, x 称为 (属于特征值 λ 的) 一个特征向量.
考虑矩阵 A = ⎣ ⎡ 2 0 1 4 0 1 4 2 1 4 2 0 4 2 0 1 ⎦ ⎤ . 观察到
⎣ ⎡ 2 0 1 4 0 1 4 2 1 4 2 0 4 2 0 1 ⎦ ⎤ ⎣ ⎡ 1 1 1 1 ⎦ ⎤ = 7 ⎣ ⎡ 1 1 1 1 ⎦ ⎤ 因此 7 是 A 的一个特征值, ⎣ ⎡ 1 1 1 1 ⎦ ⎤ 是一个特征向量.
并不是任何 λ 都能成为给定方阵 A 的特征值. 例如考虑 A = ⎣ ⎡ 3 0 0 0 3 0 0 0 3 ⎦ ⎤ , 由于A x = 3 x 对任意向量 x 成立, 因此 A 的特征值只有 λ = 3 .
A 也可能有多个不同的特征值. 例如考虑 A = [ 2 0 0 3 ] , 容易看出
[ 2 0 0 3 ] [ 1 0 ] = 2 [ 1 0 ] [ 2 0 0 3 ] [ 0 1 ] = 3 [ 0 1 ] 因此 λ = 2 和 λ = 3 均为 A 的特征值.
下面这个命题是特征值的等价描述.
λ 是 n 阶方阵 A 的特征值当且仅当齐次线性方程组( λ I n − A ) x = 0 具有非零解.
证明: 假设如上齐次线性方程组有非零解
x , 则
A x = λ I n x = λ x 因此
λ 是特征值,
x 是属于
λ 的特征向量. 反之亦然.
上述命题给出了特征值的具体判别方法.
λ 是 n 阶方阵 A 的特征值当且仅当det ( λ I n − A ) = 0
证明: 齐次线性方程组
( λ I n − A ) x = 0 具有非零解当且仅当
det ( λ I n − A ) = 0 .
特征多项式 设 A 是 n 阶方阵. 则 n 次多项式φ ( λ ) := det ( λ I n − A ) 称为 A 的特征多项式.
由命题 4.1.5 知, A 的特征值即为特征多项式的根.
A = ⎣ ⎡ 2 1 0 1 2 1 0 1 2 ⎦ ⎤ , 特征多项式为φ ( λ ) = = ∣ ∣ λ − 2 − 1 0 − 1 λ − 2 − 1 0 − 1 λ − 2 ∣ ∣ = ( λ − 2 ) ∣ ∣ λ − 2 − 1 − 1 λ − 2 ∣ ∣ + ∣ ∣ − 1 0 − 1 λ − 2 ∣ ∣ ( λ − 2 ) (( λ − 2 ) 2 − 2 ) = ( λ − 2 ) ( λ − 2 − 2 ) ( λ − 2 + 2 ) 因此 A 有 3 个特征值 2 , 2 + 2 , 2 − 2 .
对于 n 阶方阵 A = ( a ij ) , 其特征多项式φ ( λ ) = ∣ ∣ λ − a 11 − a 21 ⋯ − a n 1 − a 12 λ − a 22 ⋯ − a n 2 ⋯ ⋯ ⋯ ⋯ − a 1 n − a 2 n ⋯ λ − a nn ∣ ∣ = λ n + α 1 λ n − 1 + ⋯ + α n − 1 λ + α n 是首项为 λ n 的 n 次多项式. 由代数学基本定理, 我们可以把 φ ( λ ) 分解为φ ( λ ) = ( λ − λ 1 ) ( λ − λ 2 ) ⋯ ( λ − λ n ) 这里 λ 1 , ⋯ , λ n 是 φ ( λ ) 的所有复数根 (可以有重根) .
设 λ 1 , ⋯ , λ n 是 A 的特征多项式 φ ( λ ) 的所有复数根 (可以有重根) , 则det A = λ 1 λ 2 ⋯ λ n
证明: 由
φ ( λ ) = ( λ − λ 1 ) ( λ − λ 2 ) ⋯ ( λ − λ n ) , 知
φ ( 0 ) = ( − 1 ) n λ 1 λ 2 ⋯ λ n . 另一方面由定义
φ ( 0 ) = det ( − A ) = ( − 1 ) n det A 对比两个表达式即得命题.
证明: 由
det A = λ 1 λ 2 ⋯ λ n 即得命题.
假设 A = ⎣ ⎡ a 11 0 0 ⋮ 0 a 12 a 22 0 ⋮ 0 a 13 a 23 a 33 ⋮ 0 ⋯ ⋯ ⋯ ⋱ ⋯ a 1 n a 2 n a 3 n ⋮ a nn ⎦ ⎤ 是上三角方阵, 则
φ ( λ ) = ∣ ∣ λ − a 11 0 0 ⋮ 0 − a 12 λ − a 22 0 ⋮ 0 − a 13 − a 23 λ − a 33 ⋮ 0 ⋯ ⋯ ⋯ ⋱ ⋯ − a 1 n − a 2 n − a 3 n ⋮ λ − a nn ∣ ∣ = i = 1 ∏ n ( λ − a ii ) 此时 A 的特征值即为所有对角元的值.
方阵 A = ⎣ ⎡ a 11 a 21 ⋯ a n 1 a 12 a 22 ⋯ a n 2 ⋯ ⋯ ⋯ ⋯ a 1 n a 2 n ⋯ a nn ⎦ ⎤ 的迹 (trace) 定义为Tr A := a 11 + a 22 + ⋯ + a nn 即为 A 的所有对角元的和.
迹的一个重要性质是如下关于乘法的对称性.
设 A 是 m × n 矩阵, B 是 n × m 矩阵. 则Tr A B = Tr B A
证明 : 留作练习.
设 n 阶方阵 A 的特征多项式为 φ ( λ ) = λ n + α 1 λ n − 1 + ⋯ + α n − 1 λ + α n . 则α 1 = − Tr A
证明: φ ( λ ) = ∣ ∣ λ − a 11 − a 21 ⋯ − a n 1 − a 12 λ − a 22 ⋯ − a n 2 ⋯ ⋯ ⋯ ⋯ − a 1 n − a 2 n ⋯ λ − a nn ∣ ∣ 由行列式组合公式,
λ n − 1 项只能来源于
i = 1 ∏ n ( λ − a ii ) 的贡献, 由此易得
α 1 = − i = 1 ∑ n a ii = − Tr A .
因此 A 的特征多项式可以表达为φ ( λ ) = λ n − ( Tr A ) λ n − 1 + ⋯ + ( − 1 ) n det A 实际上, 特征多项式中其他的系数 α k 也可以通过 A 的 k 阶余子式来得到, 我们这里不作讨论.
设 λ 1 , ⋯ , λ n 是 A 的特征多项式 φ ( λ ) 的所有复数根 (可以有重根) , 则Tr A = λ 1 + λ 2 + ⋯ + λ n
证明: φ ( λ ) = ( λ − λ 1 ) ( λ − λ 2 ) ⋯ ( λ − λ n ) 的
λ n − 1 项系数为
− λ 1 − λ 2 − ⋯ − λ n . 对比公式
φ ( λ ) = λ n − ( Tr A ) λ n − 1 + ⋯ 即得命题.
设 A = [ a c b d ] 是 2 阶方阵Tr A = a + d det A = a d − b c 因此 A 的特征多项式为φ ( λ ) = λ 2 − ( Tr A ) λ + det A = λ 2 − ( a + d ) λ + ( a d − b c ) 这个公式也可以通过计算行列式直接验证.
Cayley–Hamilton 定理 设 n 阶方阵 A 的特征多项式为 φ ( λ ) = λ n + α 1 λ n − 1 + ⋯ + α n − 1 λ + α n . 则矩阵 φ ( A ) := A n + α 1 A n − 1 + ⋯ + α n − 1 A + α n I n 是零矩阵, 即满足 φ ( A ) = 0 .
证明: 令
B = λ I n − A , 则
φ ( λ ) = det B . 观察到
B 的每个余子式
B ij 至多是
λ 的
( n − 1 ) 次多项式. 因此
B 的伴随矩阵
B ∗ 可以写成
B ∗ = λ n − 1 C 1 + λ n − 2 C 2 + ⋯ + C n 其中 C i 是不含 λ 的 n 阶方阵. 由伴随矩阵的性质B B ∗ = det ( B ) I n = φ ( λ ) I n 代入上述表达式, 我们得到等式( λ I n − A ) ( λ n − 1 C 1 + λ n − 2 C 2 + ⋯ + C n ) = φ ( λ ) I n
比较两边的
λ 多项式的系数矩阵, 我们得到
C 1 C 2 − A C 1 ⋮ C n − A C n − 1 − A C n = I n = α 1 I n = α n − 1 I n = α n I n 把这组方程依次左乘以
A n , A n − 1 , ⋯ , A , I n 相加, 即得到
φ ( A ) = 0 .
设 A 是 n 阶方阵. 一个非零多项式 f ( λ ) 称为 A 的一个化零多项式, 如果 f ( A ) = 0 是零矩阵.
Cayley–Hamilton 定理表明, 每个 n 阶方阵 A 都会满足一个多项式的代数关系: 它的特征多项式是一个化零多项式. 需要指出的是, 特征多项式不一定是 A 的最小化零多项式: 可能存在次数比 n 小的化零多项式.
例如对于 A = ⎣ ⎡ 2 0 0 0 2 0 0 0 3 ⎦ ⎤ , 其特征多项式为 φ ( λ ) = ( λ − 2 ) 2 ( λ − 3 ) . 另一方面A − 2 I = ⎣ ⎡ 0 0 0 0 0 0 0 0 1 ⎦ ⎤ A − 3 I = ⎣ ⎡ − 1 0 0 0 − 1 0 0 0 0 ⎦ ⎤ 容易看出 ( A − 2 I ) ( A − 3 I ) = 0 . 因此 f ( λ ) = ( λ − 2 ) ( λ − 3 ) 是 A 的一个化零多项式, 它的次数比特征多项式 φ ( λ ) 的次数低.
Cayley–Hamilton 定理有很多重要的应用. 我们这里举一个例子, 它给出了一种矩阵逆的代数表达方法. 设 A 是 n 阶方阵, 其特征多项式为φ ( λ ) = λ n + α 1 λ n − 1 + ⋯ + α n − 1 λ + α n
假设 A 可逆, 则 α n = ( − 1 ) n det A = 0 . 由 Cayley–Hamilton 定理, 我们有等式A n + α 1 A n − 1 + ⋯ + α n − 1 A + α n I n = 0 把 α n I n 移到右边, 两边同除以 − α n − α n 1 ( A n − 1 + α 1 A n − 2 + ⋯ + α n − 1 I n ) A = I n 由此得A − 1 = − α n 1 ( A n − 1 + α 1 A n − 2 + ⋯ + α n − 1 I n ) 特别地, A − 1 可以通过 A 的一个多项式来表达.
设 A = ⎣ ⎡ 2 2 − 1 − 2 3 1 4 2 − 1 ⎦ ⎤ . 它的特征多项式为φ ( λ ) = det ( λ I 3 − A ) = λ 3 − 4 λ 2 + 7 λ − 10 因此A − 1 = 10 1 ( A 2 − 4 A + 7 I 3 ) = 10 1 ⎣ ⎡ − 5 0 5 2 2 0 − 16 4 10 ⎦ ⎤