特征子空间
设 A 是数域 k 上的 n 阶方阵, λ0 是 A 一个特征值. 定义向量空间 kn 的子集Vλ0:={x∈kn∣Ax=λ0x}称为特征值 λ0 的特征子空间.
换言之, Vλ0 是由所有属于 λ0 的特征向量以及零向量构成的集合.
证明: 设
x,y∈Vλ0,
α 是一个数. 则
A(x+y)=A(αx)=Ax+Ay=λ0x+λ0y=λ0(x+y)αAx=αλ0x=λ0(αx)即
x+y∈Vλ0,αx∈Vλ0. 由此命题得证.
考虑 n 阶方阵 A=⎣⎡λ00⋯001λ0⋯0001⋯⋯⋯⋯⋯⋯λ0000⋯1λ0⎦⎤. 它只有一个特征值 λ0, 其特征子空间 Vλ0 是 1 维的, 由向量 ⎣⎡10⋮00⎦⎤ 张成.
设 φ(λ) 是 A 的特征多项式, λ0 是 A 的特征值.
• | 记 φ(λ)=(λ−λ0)mg(λ), 其中 g(λ0)=0. 称 m 为特征值 λ0 的代数重数, 即 λ0 作为特征多项式的根的重数 |
• | dimVλ0 称为特征值 λ0 的几何重数 |
n 阶方阵 A=⎣⎡λ00⋯001λ0⋯0001⋯⋯⋯⋯⋯⋯λ0000⋯1λ0⎦⎤ 的特征多项式φ(λ)=(λ−λ0)n因此特征值 λ0 的代数重数为 n, 几何重数为 1.
证明: 设
λ0 是
n 阶方阵
A 的特征值, 其几何维数是
r, 即
dimVλ0=r. 设
{β1,⋯,βr} 是
Vλ0 的一组基. 我们可以把它扩展为整个
n 维空间的一组基
{β1,⋯,βr,βr+1,⋯,βn}. 把这组基作为列向量, 记
P 为方阵
P=[β1β2⋯βn] 由于
{β1,⋯,βr} 是
λ0 的特征向量, 我们有
A[β1β2⋯βn]===[Aβ1Aβ2⋯Aβn][λ0β1⋯λ0βrAβr+1⋯Aβn][β1β2⋯βn][λ0Ir0CD]这里
C 是
r×(n−r) 矩阵,
D 是
(n−r)×(n−r) 矩阵, 它们表示
Aβr+1,⋯,Aβn 按照基
{β1,⋯,βn} 展开的系数. 我们得到相似变换关系
A=P[λ0Ir0CD]P−1 . 因此
det(λIn−A)=det(λIn−[λ0Ir0CD])=∣∣(λ−λ0)Ir0−CλIn−r−D∣∣=(λ−λ0)rdet(λIn−r−D)这说明
λ0 的代数重数
≥r.
子空间的和与直和
设 V 是数域 k 上的线性空间, V1,⋯,Vm 是 V 的线性子空间. 定义 V 的子集V1+⋯+Vm={α1+⋯+αm∣αi∈Vi}⊂V称为子空间 V1,⋯,Vm 的和.
V 的线性子空间的和 V1+⋯+Vm 是 V 的线性子空间.
证明: 设
x,y∈V1+⋯+Vm. 则存在
αi,βi∈Vi 使得
x=α1+⋯+αmy=β1+⋯+βm则
x+y=(α1+β1)+⋯+(αm+βm)由于
Vi 是线性子空间,
(αi+βi)∈Vi, 因此
x+y∈V1+⋯+Vm. 同理可证保乘法.
设 V=R4, {ei} 是标准基. 考虑子空间 V1=Span{e1,e2}, V2=Span{e2,e3}, V3=Span{e3,e4}. 则V1+V2=Span{e1,e2,e3}V1+V3=V
设 V 是数域 k 上的线性空间, V1,⋯,Vm 是 V 的线性子空间. 如果 V1+⋯+Vm 中的任意向量 α, 存在唯一的向量 αi∈Vi 使得α=α1+⋯+αm则此时 V1+⋯+Vm 称为子空间 V1,⋯,Vm 的直和, 记为 V1⊕⋯⊕Vm.
V 的子空间 V1,⋯,Vm 的和是直和的充分必要条件是如下性质成立: 若 αi∈Viα1+⋯+αm=0⟹α1=⋯=αm=0即只需要验证零向量表达的唯一性 (零向量只能通过各个子空间的零向量相加得到) .
证明: 假设
V 的子空间
V1,⋯,Vm 的和是直和, 则零向量只能唯一地表达为零向量相加, 因此命题所述性质成立.
反之, 假设命题所述性质成立. 设
α 是
V1+⋯+Vm 中的向量, 有两种表达方式
α=α1+⋯+αmα=β1+⋯+βm这里αi,βi∈Vi两式相减得到
(α1−β1)+⋯+(αm−βm)=0由零向量表达的唯一性知
α1=β1,⋯,αm=βm. 由此证得表达的唯一性.
设 V=R4, {ei} 是标准基. 考虑子空间V1=Span{e1,e2}V2=Span{e2,e3}V3=Span{e3,e4}
• | V1+V2 不是直和, 例如我们有两种不一样的方法来表达相加e2=e2+0e2=0+e2其中第一种表达里 e2 看作是 V1 中的向量, 第二种表达里 e2 看作是 V2 中的向量. |
• | V1+V3=V1⊕V3 是直和, 可以由 e1,e2,e3,e4 的线性无关性证明. |
V 的子空间 V1,⋯,Vm 的和是直和的充分必要条件是dim(V1+⋯+Vm)=dimV1+⋯+dimVm此时每个 Vi 选一组基合在一起构成 V1⊕⋯⊕Vm 的一组基.
证明: 设
{β1(i),⋯,βti(i)} 是
Vi 的一组基. 由定义,
V1+⋯+Vm=Span{β1(1),⋯,βt1(1),⋯,β1(m),⋯,βtm(m)}假设 V1+⋯+Vm=V1⊕⋯⊕Vm 是直和. 我们说明 {β1(1),⋯,βt1(1),⋯,β1(m),⋯,βtm(m)} 是线性无关的, 因此构成 V1+⋯+Vm 的一组基. 由此即得 dim(V1+⋯+Vm)=dimV1+⋯+dimVm.
若c1(1)β1(1)+⋯+ct1(1)βt1(1)+⋯+c1(m)β1(m)+⋯+ctm(m)βtm(m)=0记 βi=c1(i)β1(i)+⋯+cti(i)βti(i). 则 βi∈Vi 且0=β1+⋯+βm
另一方面零向量显然可以写成零向量的和. 由直和的表达唯一性, 对每个 i 我们有 βi=0. 又由于 β1(i),⋯,βti(i) 是 Vi 的一组基, c1(i)=⋯=cti(i)=0. 这证明了 {β1(1),⋯,βt1(1),⋯,β1(m),⋯,βtm(m)} 是线性无关的.
反之, 假设
dim(V1+⋯+Vm)=dimV1+⋯+dimVm 成立. 由
V1+⋯+Vm=Span{β1(1),⋯,βt1(1),⋯,β1(m),⋯,βtm(m)}知
{β1(1),⋯,βt1(1),⋯,β1(m),⋯,βtm(m)} 是线性无关的. 因此
V1+⋯+Vm 中的任一向量可以唯一地写成
{β1(1),⋯,βt1(1),⋯,β1(m),⋯,βtm(m)} 的线性组合. 由此易证直和性.
设 λ1,⋯,λs 是 A 的 s 个互不相同的特征值. 则它们的特征子空间的和是直和. Vλ1+⋯+Vλs=Vλ1⊕⋯⊕Vλs
证明: 设
{β1(j),⋯,βtj(j)} 是
Vλj 中的一组基. 我们只需证明这些向量
{β1(1),⋯,βt1(1),⋯,β1(s),⋯,βts(s)} 合在一起构成的向量集是线性无关的. 假设有线性组合满足
c1(1)β1(1)+⋯+ct1(1)βt1(1)+⋯+c1(s)β1(s)+⋯+cts(s)βts(s)=0记β(j)=c1(j)β1(j)+⋯+ctj(j)βtj(j)则 β(j)∈Vλj 并且β(1)+β(2)+⋯+β(s)=0两边依次乘以 A,A2,⋯,As−1, 我们得到⎩⎨⎧β(1)+β(2)+⋯+β(s)=0λ1β(1)+λ2β(2)+⋯+λsβ(s)=0⋯λ1s−1β(1)+λ2s−1β(2)+⋯+λss−1β(s)=0
把这组方程写成矩阵的形式
[β(1)β(2)⋯β(s)]⎣⎡11⋯1λ1λ2⋯λsλ12λ22⋯λs2⋯⋯⋯⋯λ1s−1λ2s−1⋯λss−1⎦⎤=0记
s 阶矩阵
P=⎣⎡11⋯1λ1λ2⋯λsλ12λ22⋯λs2⋯⋯⋯⋯λ1s−1λ2s−1⋯λss−1⎦⎤, 由 Vandermonde 行列式知
P 可逆. 上式两边同时从右边乘以
P−1, 我们得到
[β(1)β(2)⋯β(s)]=0即每个向量
β(j)=c1(j)β1(j)+⋯+ctj(j)βtj(j)=0. 由
{β1(j),⋯,βtj(j)} 的线性无关性, 我们得到
c1(j)=⋯=ctj(j)=0 对每个
j=1,⋯,s 成立.
这个命题说明, 不同特征值的特征向量之间是相互线性无关的. 特别地, 如果 n 阶方阵 A 有 n 个互不相同的特征值, 则其对应的特征向量构成 n 维空间一组基, 即得到命题 4.2.7.
设 n 阶方阵 A 满足 A2=A (称为幂等方阵) . 则 A 相似于对角阵 [Ir000], 这里 r=rankA. 实际上, 考虑如下两个线性子空间V1={x∈kn∣Ax=x}V0={x∈kn∣Ax=0}如果 i 是 A 的特征值 (i=0,1) , 则 Vi 是特征子空间, 否则 Vi={0}.
对任意向量 x∈Rn, 我们把它分解为x=Ax+(In−A)x由 A 的幂等性A(Ax)=Ax,A(In−A)x=0⟹Ax∈V1,(In−A)x∈V0这个分解说明V1+V0=kn
设 {α1,⋯,αr} 是 V1 的一组基, {β1,⋯,βs} 是 V0 的一组基. 由命题 4.3.14 知, {α1,⋯,αr,β1,⋯,βs} 构成 kn 的一组基. 由命题 4.2.5, A 相似于对角阵 [Ir000].
根子空间
这一节我们假设数域 k 上 n 阶方阵 A 的所有特征值都在数域 k 中 (若 k=R, 即要求特征值均为实数) . A 的特征多项式可以分解为φ(λ)=(λ−λ1)m1(λ−λ2)m2⋯(λ−λs)ms这里 λ1,⋯,λs 是互不相同的特征值, mi 是 λi 的代数重数.
设 Vλi 是 λi 的特征子空间. 我们知道m1+m2+⋯+ms=n由命题 4.3.6dimVλi≤mi,i=1,⋯,s
如果 dimVλi=mi 对每个 i 成立, 那么每个 Vλi 选一组基, 合起来构成整个 kn 的一组基. 若 dimVλi<mi, 我们似乎 “缺失” 了某些向量. 这些 “缺失” 的向量可以通过根子空间找回来.
设 λ0 是 n 阶方阵 A 的一个特征值. 定义 λ0 的根子空间为Rλ0={x ∣ 存在某个m>0使得(λ0In−A)mx=0}即 x∈Rλ0 当且仅当对 x 乘以 λ0In−A 足够多次后会变成 0.
λ0 的特征子空间可以刻画为Vλ0={x∣(λ0In−A)x=0}即对 x 乘以 λ0In−A 一次变成 0. 因此 Vλ0⊂Rλ0.
证明: 设
x,y∈Rλ0. 则存在
m1,m2>0 使得
(λ0In−A)m1x=0(λ0In−A)m2y=0 取
m=max{m1,m2}, 则
(λ0In−A)m(x+y)=(λ0In−A)mx+(λ0In−A)my=0即
x+y∈Rλ0. 易知
Rλ0 也保数乘.
n 阶方阵 A=⎣⎡λ00⋯001λ0⋯0001⋯⋯⋯⋯⋯⋯λ0000⋯1λ0⎦⎤. 易知(λ0In−A)n=0因此任意向量 x 都属于根子空间 Rλ0 中. 可以看出根子空间的确找回来了 “缺失” 的向量.
设 A 是 n 阶矩阵. 线性子空间 V⊂kn 称为是 A 的不变子空间如果对任意x∈V,Ax∈V
证明: 设
x∈Rλ0,
(λ0In−A)mx=0. 则
(λ0In−A)m(Ax)=A((λ0In−A)mx)=0故
Ax∈Rλ0.
由于 Rλ0 是 A 的不变子空间, 把 A 的作用限制在 Rλ0 上得到一个线性映射A:Rλ0→Rλ0
线性映射 A:Rλ0→Rλ0 在 Rλ0 的任一组基下的表示矩阵的特征值只有 λ0.
证明: 考虑这个线性映射在
Rλ0 的一组基
{β1,⋯,βt} 下的表示矩阵
s 阶方阵
B=(bij), 即
Aβj=i∑βibij写成矩阵的形式
A[β1⋯βt]=[β1⋯βt]B由根子空间定义, 存在充分大
m>0 使得
(λ0In−A)mβi=0, 对
i=1,⋯,t 成立. 由
(λ0It−A)m[β1⋯βt]=[β1⋯βt](λ0It−B)m左边是零, 因此
[β1⋯βt](λ0It−B)m=0由
{β1,⋯,βt} 的线性无关性, 得
(λ0It−B)m=0. 由此易知 (或参考命题
4.4.3)
λ0It−B 的特征值只有
0, 即
B 的特征值只有
λ0.
设 λ1,⋯,λs 是互不相同的特征值. 则它们的根子空间的和是直和. Rλ1+⋯+Rλs=Rλ1⊕⋯⊕Rλs
证明: 设
βi∈Rλi 并且
β1+β2+⋯+βs=0我们只需证明一定有
β1=⋯=βs=0.
假设 β1=0. 则存在正整数 m 使得 (λ1In−A)m−1β1=0, (λ1In−A)mβ1=0. 记 γ1=(λ1In−A)m−1β1=0, 则(λ1In−A)γ1=0即 γ1 是 λ1 的特征向量. 则对任意多项式 f(x)f(A)γ1=f(λ1)γ1
取 N 充分大使得(λiIn−A)Nβi=0,i=1,⋯,s
令
f(x)=(λ2−x)N(λ3−x)N⋯(λs−x)N. 则
f(A)γ1=f(λ1)γ1,f(A)β2=⋯=f(A)βs=0其中
f(λ1)=(λ2−λ1)N(λ3−λ1)N⋯(λs−λ1)N=0. 在等式
β1+β2+⋯+βs=0两边乘以
(λ1In−A)m−1f(A), 我们得到
f(λ1)γ1=0由于
f(λ1)=0⟹γ1=0, 与假设矛盾. 因此
β1=0. 同理可证
β1=⋯=βs=0.
设 λ1,⋯,λs 是 n 阶方阵 A 所有互不相同的特征值. 则kn=Rλ1⊕⋯⊕Rλs
证明: 由命题
4.3.22, 我们只需证明任意向量
x∈kn 可以分解为
x=β1+⋯+βs,βi∈Rλin 阶方阵 A 的特征多项式为φ(λ)=(λ−λ1)m1(λ−λ2)m2⋯(λ−λs)ms这里 λ1,⋯,λs 是互不相同的特征值. 考虑如下的多项式φi(λ)=(λ−λ1)m1⋯(λ−λi−1)mi−1(λ−λi+1)mi+1⋯(λ−λs)ms即把 φ(λ) 中去掉 (λ−λi)mi 因子得到的多项式. 多项式 φ1(λ),⋯,φs(λ) 的公因子只有常数函数, 因此存在多项式 hi(λ) 使得φ1(λ)h1(λ)+⋯+φs(λ)hs(λ)=1
代入矩阵
A, 我们得到
φ1(A)h1(A)+⋯+φs(A)hs(A)=In因此
x=(φ1(A)h1(A)+⋯+φs(A)hs(A))x=β1+⋯+βs这里
βi=φi(A)hi(A)x. 由 Cayley-Hamilton 定理,
(λiIn−A)miφi(A)=φ(A)=0因此
(λiIn−A)miβi=φ(A)hi(A)x=0, 即
βi∈Rλi.
设 λ1,⋯,λs 是 A 的所有互不相同的特征值. 设 {β1(j),⋯,βtj(j)} 是 Rλj 的一组基. 由命题 4.3.23, 向量组{β1(1),⋯,βt1(1),⋯,β1(s),⋯,βts(s)}构成 kn 的一组基. 由命题 4.3.20, Rλj 是 A 的不变子空间, 因此 Aβi(j) 是 {β1(j),⋯,βtj(j)} 的线性组合. 写成矩阵的形式=A[β1(1)⋯βt1(1)⋯β1(s)⋯βts(s)][β1(1)⋯βt1(1)⋯β1(s)⋯βts(s)]⎣⎡B10⋯00B2⋯⋯⋯⋯⋯000⋯Bs⎦⎤这里 Bj 是 tj 阶方阵, 其特征多项式为 (λ−λj)tj (命题 4.3.21) . 因此 A 的特征多项式为det(λIn−A)=det(λ−B1)⋯det(λ−Bs)=(λ−λ1)t1⋯(λ−λs)ts对比det(λIn−A)=(λ−λ1)m1⋯(λ−λs)ms我们得到tj=mj
由此我们证明了如下命题.
总结如上, 我们有 Vλi⊂RλidimVλi=几何重数≤dimRλi=代数重数根子空间给出直和分解kn=Rλ1⊕Rλ2⊕⋯⊕Rλs