由命题 5.4.9 知对于半正定对称方阵 A, 我们有唯一确定的半正定对称方阵 B 使得 B2=A 成立. 我们把这个半正定对称方阵记作 A, 其满足(A)2=AA 称为 A 的平方根. 类似的方法可以证明, 存在唯一的开 k 次方的半正定对称方阵 kA.
奇异值分解
设 A 是 m×n 实矩阵. 考虑 n 阶矩阵 ATA. 对于任意 x∈RnxT(ATA)x=(Ax)T(Ax)≥0因此 ATA 是 n 阶半正定对称方阵. 同理, AAT 是 m 阶半正定对称方阵.
由第三章习题 9 知λmdet(λIn−ATA)=λndet(λIm−AAT)这说明 ATA 和 AAT 具有相同的非零特征值.
定义 5.4.10. 设 A 是 m×n 实矩阵. 则 n 阶半正定对称方阵 ATA (或 AAT) 的非零特征值的平方根称为 A 的奇异值.
设 ATA 的所有非零特征值为 μ1,⋯,μr, 则 A 的所有奇异值为 μ1,⋯,μr.
命题 5.4.11. 设 A 是 n 阶实对称方阵. 则 A 的所有奇异值为所有非零特征值的绝对值.
证明: 设 A 的所有特征值为 λ1,⋯,λn. 由命题 5.4.5 知 A 可对角化. 由此易知 ATA=A2 的特征值为 λ12,⋯,λn2. 由此即得命题.
□
例子 5.4.12. 考虑方阵 A=[1011]. ATA=[1101][1011]=[1112]ATA 的特征多项式为 ∣∣λ−1−1−1λ−2∣∣=λ2−3λ+1, 解得 ATA 的两个特征值为 23±5. 故 A 有两个奇异值23±5而 A 的两个特征值均为 1. 因此当方阵 A 不对称时候, 奇异值和特征值的绝对值并不一样.
定理 5.4.13 (奇异值分解). 设 σ1≥⋯≥σr>0 是 m×n 阶实矩阵 A 的所有奇异值. 则存在 m 阶正交方阵 U 和 n 阶正交方阵 V 使得 A=UΣVT, 其中Σ=⎣⎡⎣⎡σ10⋯00σ2⋯⋯⋯⋯⋯000⋯σr⎦⎤0(m−r)×r0r×(n−r)0(m−r)×(n−r)⎦⎤这里 0k×l 表示 k×l 的零矩阵.
证明: 由奇异值的定义, 存在 n 阶正交方阵 V 使得VTATAV=diag(σ12,⋯,σr2,0,⋯,0)把 AV=[α1⋯αn] 写成 Rm 中列向量, 则VTATAV=(AV)T(AV)=⎣⎡α1T⋮αnT⎦⎤[α1⋯αn]=⎣⎡α1Tα1⋯αnTα1⋯⋯⋯α1Tαn⋯αnTαn⎦⎤