我们这一节将系统讨论线性方程组的解空间的结构.
齐次线性方程组的解空间
考虑齐次线性方程组Ax=0这里 A 是 m×n 矩阵, x∈Rn, 即A=⎣⎡a11a21⋮am1a12a22⋮am2⋯⋯⋯⋯a1na2n⋮amn⎦⎤x=⎣⎡x1x2⋮xn⎦⎤
该齐次线性方程组的所有解构成 Rn 的子集, 记为K:={x∈Rn∣Ax=0}.
证明: 假设
x1,x2∈K,λ∈R, 则
A(x1+x2)=Ax1+Ax2=0A(λx1)=λAx1=0即
x1+x2∈K,λx1∈K. 故
K 保持加法和数乘.
设 u1,⋯,us 是 K 的一组基, s=dimK. 则 K 中的元素 x 可以唯一地写成线性组合x=c1u1+⋯+csus,ci∈R这构成了齐次线性方程组 Ax=0 的通解, 这里 ci 是任意常数.
考虑以下齐次线性方程组: x1+2x2−x3+x4−x52x1+4x2−2x3+3x4−x5−x1−2x2+x3−2x4+2x5=0=0=0对应的增广矩阵的形式为⎣⎡12−124−2−1−2113−2−1−12000⎦⎤
我们用初等变换来解方程⎣⎡12−124−2−1−2113−2−1−12000⎦⎤⟹⎣⎡100200−10011−1−111000⎦⎤⟹⎣⎡100200−100110−112000⎦⎤得到等价的方程组x1+2x2−x3+x4−x5x4+x52x5=0=0=0
由此可以解得x5=0,x4=0,x1=x3−2x2其中 x2 和 x3 可以取任意数. 设 x2=c1,x3=c2, 则通解可以写成⎣⎡x1x2x3x4x5⎦⎤=⎣⎡c2−2c1c1c200⎦⎤=c1⎣⎡−21000⎦⎤+c2⎣⎡ 1 0 1 0 0 ⎦⎤c1,c2∈R
从而该齐次线性方程组的解空间是 2 维的, 一组基为 u1=⎣⎡−21000⎦⎤,u2=⎣⎡ 1 0 1 0 0 ⎦⎤.
矩阵的秩与解空间维数
矩阵的行秩
我们把一个 m×n 矩阵 A 写成A=⎣⎡a11a21⋮am1a12a22⋮am2⋯⋯⋯⋯a1na2n⋮amn⎦⎤=⎣⎡v1v2⋮vm⎦⎤这里 vi 是 Rn 中的行向量vi=(ai1 ai2 ⋯ain)∈Rn
矩阵 A 的行秩定义为 A 的行向量张成的线性空间的维数, 即A的行秩=dimSpan{v1,⋯,vm}
对矩阵作初等行变换得到的行向量与原行向量是等价的. 特别的, 初等行变换不改变矩阵的行秩.
为了说明这个命题, 我们回顾矩阵的三种初等行变换
1. | 交换两行: 将矩阵的两行交换位置. |
2. | 将矩阵中的一行乘以一个非零常数. |
3. | 将矩阵的一行乘以一个数加到另一行. |
例如交换两行, 比如第 1 行和第 2 行, 容易看出线性等价{v1,v2,⋯,vm}⟺{v2,v1,⋯,vm}例如将第 2 行乘以一个非零常数 λ, 我们有线性等价{v1,v2,⋯,vm}⟺{v1,λv2,⋯,vm}例如将矩阵的第 1 行乘以一个数加到第 2 行, 容易证明如下的线性等价{v1,v2,⋯,vm}⟺{v1,v2+λv1,⋯,vm}因此矩阵的行秩在初等行变换下是不变的.
由命题 2.2.3, 我们总是可以通过初等行变化将 A 变为阶梯形A′=⎣⎡a1p1′⋯⋯a2p2′⋯⋯⋯⋯⋯⋯⋯⋯arpr′⋯⋯⋯⋯a1n′a2n′⋮arn′⎦⎤=⎣⎡v1′v2′⋮vr′0⎦⎤这里 a1p1′,⋯,arpr′ 均不为 0. 观察到行向量 v1′,⋯,vr′ 是线性无关的. 实际上, 如果有λ1v1′+λ2v2′+⋯+λrvr′=0则比较第 p1 列系数, 我们得到 λ1a1p1′=0⇒λ1=0. 然后可以依此得到 λ2=⋯=λr=0.
因此 A′ 的行秩是 r. 由此我们证明了A的行秩=A′的行秩=r这给出了用初等行变换计算行秩的方法.
另一方面, 矩阵 A′ 对应的齐次线性方程组为a1p1′xp1+⋯+⋯+⋯+a1pn′xn⋮a1pr′xpr+⋯+a1pn′xn=0=0这里 p1<p2<⋯<pr. 因此 xp1,⋯,xpr 可以通过其他变量表达出来, 而其他变量可以取任意值. 总共有 n−r 个自由变量, 因此解空间的维数是 n−r.
总结如上, 对于 m×n 矩阵 A, 通过初等行变换变成阶梯形矩阵 A′, 可以看出A的行秩=r,且{x∣Ax=0}解空间的维数=n−r。
矩阵 A 对应的齐次线性方程组解空间的维数为A的列数(即未知变量数)−A的行秩。
矩阵的列秩
我们把一个 m×n 矩阵 A 写成A=⎣⎡a11a21⋮am1a12a22⋮am2⋯⋯⋯⋯a1na2n⋮amn⎦⎤=[u1u2⋯un]这里 ui 是 Rm 中的列向量 ui=⎣⎡a1ia2i⋮ami⎦⎤∈Rm.
矩阵 A 的列秩定义为 A 的列向量张成的线性空间的维数, 即A的列秩=dimSpan{u1,⋯,un}
需要注意的是, 初等行变换不改变行向量张成的空间, 但是会改变列向量张成的空间 (但是维数不变) . 这个命题成立是因为初等行变换不会改变列向量的线性相关性. 具体而言, 考虑A=[u1u2⋯un]⟹初等行变换A′=[u1′u2′⋯un′]由于线性方程组在行变换下是等价的, 我们知道对任意的向量子集 {ui1,ui2,⋯,uis}, 矩阵 [ui1ui2⋯uis] 对应的齐次线性方程组[ui1ui2⋯uis]⎣⎡λ1⋮λs⎦⎤=0和矩阵 [ui1′ui2′⋯uis′] 对应的齐次线性方程组[ui1′ui2′⋯uis′]⎣⎡λ1⋮λs⎦⎤=0是等价的方程, 即λ1ui1+⋯λsuis=0当且仅当λ1ui1′+⋯λsuis′=0由此可以证明: 如果列向量组 {uk1,uk2,⋯,ukr} 是 A 的列向量的极大线性无关组, 则 {uk1′,uk2′,⋯,ukr′} 是 A′ 的列向量的极大线性无关组. 因此 A 和 A′ 的列秩相等. 证明细节留作练习.
我们通过初等行变化将 A 变为阶梯型
A′=⎣⎡a1p1′⋯⋯a2p2′⋯⋯⋯⋯⋯⋯⋯⋯arpr′⋯⋯⋯⋯a1n′a2n′⋮arn′⎦⎤这里 a1p1′,⋯,arpr′ 均不为 0. 很容易看出列向量up1′=⎣⎡a1p1′0⋮0⋮0⎦⎤up2′=⎣⎡a1p2′a2p2′⋮0⋮0⎦⎤⋯upr′=⎣⎡a1pr′a2pr′⋮arpr′⋮0⎦⎤构成 A′ 列向量的极大线性无关组, 因此 A′ 的列秩是 r.
因此通过初等行变换将 A 变成阶梯型, 我们证明了如下结论行秩=r=列秩
因此我们把这个行秩/列秩称为矩阵的秩, 记为
rankA.我们把上述关于齐次线性方程组的解总结如下:
设 A 是 m×n 矩阵, rankA=r.
• | 如果 r=n, 则 Ax=0 只有零解 |
• | 如果 r<n, 则 Ax=0 具有非零解, 且它的通解具有 n−r 个独立参数 |
非齐次线性方程组的解空间
下面我们考虑非齐次线性方程组Ax=b的解空间. 这里
A=⎣⎡a11a21⋮am1a12a22⋮am2⋯⋯⋯⋯a1na2n⋮amn⎦⎤x=⎣⎡x1x2⋮xn⎦⎤b=⎣⎡b1b2⋮bm⎦⎤
由于非齐次通解=非齐次特解+齐次通解由命题 2.3.5, 我们已经知道了齐次方程组的通解结构 (解空间的维数即自由参数的个数为 n−rankA) , 因此我们只需要讨论能否找到非齐次线性方程组的一个特解, 即解的存在性问题.
我们把矩阵 A 写成列向量的样子A=[u1u2⋯un]则线性方程组可以写成x1u1+⋯+xnun=b
如果线性方程组有解, 即存在 x1,⋯,xn 使得x1u1+⋯+xnun=b即 b 可以写成 {u1,⋯,un} 的线性组合. 则{u1,⋯,un}⟺等价{u1,⋯,un,b}
反之, 如果{u1,⋯,un}⟺等价{u1,⋯,un,b}则 b 可以通过 {u1,⋯,un} 线性表达, 即方程有解.
因此线性方程组有解当且仅当{u1,⋯,un}⟺等价{u1,⋯,un,b}即这两组向量张成的线性空间的维数是一样的. 由此我们证明了如下结论
非齐次线性方程组 Ax=b 有解当且仅当 A 的列秩和增广矩阵 A=[A b] 的列秩相等, 即rankA=rankA
我们把上述关于非齐次线性方程组的解总结如下:
设 A 是 m×n 矩阵, rankA=r. 考虑非齐次线性方程组 Ax=b, 设 A 是增广矩阵.
• | Ax=b 有解当且仅当 rankA=r |
• | 假设 rankA=r ∘ | 如果 r=n, 则 Ax=b 有唯一解 | ∘ | 如果 r<n, 则 Ax=b 的解不唯一, 且它的通解具有 n−r 个独立参数 |
|
考虑如下线性方程组⎩⎨⎧x+y+z=32x+3y+5z=4x+2y+4z=1这组方程在之前的例子中计算过, 其通解为 ⎩⎨⎧x=2c+5y=−2−3cz=c 这里 c 是任意常数. 把其写作通解为⎣⎡xyz⎦⎤=⎣⎡5−20⎦⎤+c⎣⎡2−31⎦⎤这里 ⎣⎡5−20⎦⎤ 是线性方程组的一个特解, c⎣⎡2−31⎦⎤ 是对应齐次方程组的通解.
秩-零化度定理
我们讨论线性方阵组解的结构定理的几何解释.
设f:Rn→Rm是一个线性映射. 映射 f 的像是 Rm 中的子集记为 im(f). 定义 f 的核为 Rn 中如下子集ker(f):={x∈Rn∣ f(x)=0}
设线性映射 f:Rn→Rm 对应的矩阵表达为f(x)=Axx∈Rn这里 A 是 m×n 矩阵, 记为A=⎣⎡a11a21⋯am1a12a22⋯am2⋯⋯⋯⋯a1na2n⋯amn⎦⎤
f 的核通过矩阵 A 等价表达为ker(f):={x∈Rn∣ Ax=0}因此核的概念即刻画了齐次线性方程组的解ker(f)={齐次线性方程组Ax=0的解}由命题 2.3.1 知, ker(f)⊂Rn 是线性子空间.
f 的像也可以通过矩阵 A 来刻画. 把 A 写成列向量的样子A=[α1α2⋯αn]这里αj=⎣⎡a1ja2j⋮amj⎦⎤∈Rm则 y∈im(f) 当且仅当存在 x∈Rn 使得 y=Ax. 写成 A 的列向量的样子y=x1α1+x2α2+⋯+xnαn即等价于 y 可以通过 {α1,α2,⋯,αn} 线性表达. 因此im(f)=Span{α1,α2,⋯,αn}特别的, im(f)⊂Rm 也是线性子空间.
设 f:Rn→Rm 是一个线性映射. 则dimim(f)+dimker(f)=n
证明: 由矩阵的秩的定义, 我们知道
dimim(f)=dimSpan{α1,α2,⋯,αn}=A的列秩=rankA由定理
2.3.9,
dimker(f)=n−rankA=n−dimim(f)秩-零化度定理的几何是非常直观的. 我们可以把映射 f 看作把 Rn“压缩” 到它的像 im(f), 其中被 “压缩” 的部分是它的核 ker(f). 则 Rn 的维数是像的维数加上被压缩的维数, 即秩-零化度定理.
秩-零化度定理也可以表述在抽象的线性空间里.
设 V,W 是有限维线性空间, f:V→W 是一个线性映射. 则dimim(f)+dimker(f)=dimV
这里像 im(f)⊂W 与核 ker(f)⊂V 的定义与上述类似. 通过选取一组基, 可以把定理 2.3.15 转化为定理 2.3.14 的情形, 具体细节留作练习.