本节, 我们讨论线性方程组与阵的秩.
回想, 线性方程组是形如 AX=B 的阵等式, 其中, A, B 是 m×n, m×1 阵, 且 X 是未知的 n×1 阵. 若 n×1 阵 C 适合 AC=B, 则 C 是 AX=B 的一个解.
在第一章, 节 27, 我们有
设 A 是 m×n 阵. 设 B 是 m×1 阵. 作一个 m×(n+1) 阵 G, 其中, [G]i,j={[A]i,j,[B]i,1,j⩽n;j=n+1.(通俗地, 在 A 的最后一列的右侧加入一列 B, 得到尺寸较大的阵 G.) 设 A 有一个行列式非零的 r 级子阵, 但没有行列式非零的 r+1 级子阵.
(1) 若 G 也没有行列式非零的 r+1 级子阵, 则 AX=B 有解. 进一步地, 若 r<n, 则 AX=B 的解不唯一; 若 r=n, 则 AX=B 的解唯一.
(2) 若 G 有一个行列式非零的 r+1 级子阵, 则 AX=B 无解.
本节, 我们推广此事, 且定义与讨论阵的秩.
我们说, 行列式是方阵的一个重要的属性. 不过, 不是方阵的阵没有行列式, 故行列式不是不是方阵的阵的属性. 但是, 秩是每一个阵都有的一个重要的属性.
设 A 是 m×n 阵. 设 B 是 m×t 阵. 作 m×(n+t) 阵 G, 其中, [G]i,j={[A]i,j,[B]i,j−n,j⩽n;j>n.设 A 有一个行列式非零的 r 级子阵, 但没有行列式非零的 r+1 级子阵.
(1) 设存在 n×t 阵 C, 使 AC=B. 则 G 没有行列式非零的 r+1 级子阵.
(2) 反过来, 设 G 没有行列式非零的 r+1 级子阵. 则存在 n×t 阵 C, 使 AC=B. 进一步地, 若 r<n, 则这样的 C 不唯一; 若 r=n, 则这样的 C 唯一.
注意, 若我们取 t=1, 则这就是上个定理.
证. (1) 设 n×t 阵 C 使 AC=B.
若 G 没有 r+1 级子阵, 则 G 没有行列式非零的 r+1 级子阵.
下设 G 有 r+1 级子阵. 则 r+1⩽m, 且 r+1⩽n+t.
作 n×(n+t) 阵 H, 其中, [H]i,j={[In]i,j,[C]i,j−n,j⩽n;j>n.则 AH 是 n×(n+t) 阵. 当 j⩽n 时, [AH]i,j=====1⩽ℓ⩽n∑[A]i,ℓ[H]ℓ,j1⩽ℓ⩽n∑[A]i,ℓ[In]ℓ,j[AIn]i,j[A]i,j[G]i,j;当 j>n 时, [AH]i,j=====1⩽ℓ⩽n∑[A]i,ℓ[H]ℓ,j1⩽ℓ⩽n∑[A]i,ℓ[C]ℓ,j−n[AC]i,j−n[B]i,j−n[G]i,j.则 AH=G.
设 1⩽i1<i2<⋯<ir+1⩽m. 设 1⩽j1<j2<⋯<jr+1⩽n+t. 作 G 的一个 r+1 级子阵G′=G(j1,j2,…,jr+1i1,i2,…,ir+1).我们证明, det(G′)=0.
考虑A′=A(1,2,…,ni1,i2,…,ir+1),H′=H(j1,j2,…,jr+11,2,…,n).则 [A′]u,v=[A]iu,v, 且 [H′]u,v=[H]u,jv. 则 A′H′ 是 r+1 级阵. 注意, [G′]u,v=[G]iu,jv. 注意, [A′H′]u,v=====1⩽ℓ⩽n∑[A′]u,ℓ[H′]ℓ,v1⩽ℓ⩽n∑[A]iu,ℓ[H]ℓ,jv[AH]iu,jv[G]iu,jv[G′]u,v.则 A′H′=G′.
设 A′ 的列 1, 2, …, n 分别是 a1, a2, …, an. 设 H′ 的列 1, 2, …, r+1 分别是 h1, h2, …, hr+1. 则G′====A′H′[A′h1,A′h2,…,A′hr+1]⎣⎡k1=1∑n[h1]k1,1ak1,k2=1∑n[h2]k2,1ak2,…,kr+1=1∑n[hr+1]kr+1,1akr+1⎦⎤⎣⎡k1=1∑n[H′]k1,1ak1,k2=1∑n[H′]k2,2ak2,…,kr+1=1∑n[H′]kr+1,r+1akr+1⎦⎤.由行列式的多线性, ======det(G′)det⎣⎡k1=1∑n[H′]k1,1ak1,k2=1∑n[H′]k2,2ak2,…,kr+1=1∑n[H′]kr+1,r+1akr+1⎦⎤k1=1∑n[H′]k1,1det⎣⎡ak1,k2=1∑n[H′]k2,2ak2,…,kr+1=1∑n[H′]kr+1,r+1akr+1⎦⎤k1=1∑nk2=1∑n[H′]k1,1[H′]k2,2det⎣⎡ak1,ak2,…,kr+1=1∑n[H′]kr+1,r+1akr+1⎦⎤…k1=1∑nk2=1∑n⋯kr+1=1∑n[H′]k1,1[H′]k2,2…[H′]kr+1,r+1det[ak1,ak2,…,akr+1]1⩽k1,k2,…,kr+1⩽n∑[H′]k1,1[H′]k2,2…[H′]kr+1,r+1det[ak1,ak2,…,akr+1].
若在 k1, k2, …, kr+1, 有二个数相同, 则 [ak1,ak2,…,akr+1] 有相同的二列. 由行列式的交错性, det[ak1,ak2,…,akr+1]=0.
若 k1, k2, …, kr+1 互不相同 (注意, 此时, n⩾r+1), 我们适当地交换 [ak1,ak2,…,akr+1] 的列的次序, 以变它为 A′ 的一个 r+1 级子阵, 其当然是 A 的一个 r+1 级子阵. 由行列式的反称性, det[ak1,ak2,…,akr+1]===±det(A′(k1,k2,…,kr+11,2,…,r+1))±det(A(k1,k2,…,kr+1i1,i2,…,ir+1))0.于是, det(G′) 是一些 0 的和. 则 det(G′)=0.
(2) 设 G 没有行列式非零的 r+1 级子阵.
设 B 的列 1, 2, …, t 分别是 b1, b2, …, bt. 作 t 个 m×(n+1) 阵 Gv (v=1, 2, …, t): [Gv]i,j={[A]i,j,[bv]i,1=[B]i,v,j⩽n;j=n+1.不难看出, Gv 是 G 的子阵, 故 Gv 也没有行列式非零的 r+1 级子阵. 则由上个定理, 存在 n×1 阵 cv, 使 Acv=bv.
作 n×t 阵 C=[c1,c2,…,ct]. 则 AC 是 m×t 阵, 且[AC]i,j=====1⩽ℓ⩽n∑[A]i,ℓ[C]ℓ,j1⩽ℓ⩽n∑[A]i,ℓ[cj]ℓ,1[Acj]i,1[bj]i,1[B]i,j.则 AC=B.
注意, 若 r<n, 则, 由上个定理, 存在 n×1 阵 c1′, 使 c1′=c1, 且 Ac1′=b1. 再作 C′=[c1′,c2,…,ct]. 则我们可类似地证明, AC′=B. 不过, C′ 当然不等于 C, 因为 C′ 与 C 的列 1 不相等. 于是, 若 r<n, 则适合 AC=B 的 C 不唯一.
最后, 注意, 若
r=n, 则
m×n 阵
A 有行列式非零的
n 级子阵. 设
n×t 阵
P,
Q 适合,
AP=B, 且
AQ=B. 则
AP=AQ. 由消去律,
P=Q (见 “消去律”). 于是, 若
r=n, 则适合
AC=B 的
C 唯一.
由此可见, 对一个阵, “有一个行列式非零的 r 级子阵, 但没有行列式非零的 r+1 级子阵” 的 r 或许是重要的属性. 我们定义
设 A 是 m×n 阵. 则存在唯一的非负整数 r, 使 (见第一章, 节 25):
(1) A 有一个行列式非零的 r 级子阵;
(2) A 没有行列式非零的 r+1 级子阵.
我们定义 A 的秩, rank(A), 为 r.
注意, 若 A=0, 则 r=0 (因为我们约定, “0 级阵” 的行列式为 1).
回想, 若 A 是 m×n 阵, 且 B 是 m×t 阵, 则 [A,B] 是 m×(n+t) 阵 G, 其中,[G]i,j={[A]i,j,[B]i,j−n,j⩽n;j>n.则我们可如此改写上个定理的 (1):
设 A 是 m×n 阵. 设 C 是 n×t 阵. 则rank([A,AC])=rank(A).
证. 设
r=rank(A). 则
A 有行列式非零的
r 级子阵, 且
A 没有行列式非零的
r+1 级子阵.
A 是
[A,AC] 的子阵, 故
[A,AC] 也有行列式非零的
r 级子阵. 由上个定理的 (1),
[A,AC] 没有行列式非零的
r+1 级子阵. 则
rank([A,AC])=r.
设 A 是 m×n 阵. 则 rank(A)=rank(AT).
证. 注意,
AT 的子阵是
A 的某子阵的转置, 且
(AT)T=A 的子阵也是
AT 的某子阵的转置. 于是, 若
A 有行列式非零的
r 级子阵, 则
AT 也有行列式非零的
r 级子阵, 且若
A 没有行列式非零的
r+1 级子阵, 则
AT 也没有行列式非零的
r+1 级子阵.
设 A 是 m×n 阵. 设 C 是 n×t 阵. 则rank(AC)⩽rank(A).
证 1. 设
r=rank(A). 记
B=AC. 我们证明,
B 没有行列式非零的
r+1 级子阵. 若
B 没有
r+1 级子阵, 则
B 没有行列式非零的
r+1 级子阵. 若
B 有
r+1 级子阵, 我们任取一个
r+1 级子阵
B′=B(j1,j2,…,jr+1i1,i2,…,ir+1),其中,
1⩽i1<i2<…ir+1⩽m, 且
1⩽j1<j2<⋯<jr+1⩽t, 并证明,
det(B′)=0. 就像前面的讨论那样, 我们考虑
A′=A(1,2,…,ni1,i2,…,ir+1),C′=C(j1,j2,…,jr+11,2,…,n).就像前面的讨论那样, 我们可验证,
A′C′=B′. 于是, 就像前面的讨论那样, 我们可证明,
det(B′)=0. 请允许我留它们为您的习题.
证 2. 我们用已有的结论. 注意, AC 是 [A,AC] 的子阵, 故 rank(AC)⩽rank([A,AC]). 则由前面的讨论, rank(AC)⩽rank([A,AC])=rank(A).证完.
设 A 是 m×n 阵. 设 C 是 n×t 阵. 则rank(AC)rank(AC)⩽rank(A),⩽rank(C).
证. 不等式
1 已被证明. 我们现在证明不等式
2. 注意,
rank(AC)==⩽=rank((AC)T)rank(CTAT)rank(CT)rank(C). 设 A 是 m×n 阵. 设 P 是 n 级阵, 且 det(P)=0. 设 Q 是 m 级阵, 且 det(Q)=0. 则rank(QAP)=rank(A).
证. 设
P1=(det(P))−1adj(P), 且
Q1=(det(Q))−1adj(Q). 则
PP1=In, 且
Q1Q=Im. 则
rank(A)⩾⩾⩾⩾===rank(AP)rank(QAP)rank(QAPP1)rank(Q1QAPP1)rank((Q1Q)A(PP1))rank(ImAIn)rank(A).则
rank(A)⩾rank(QAP)⩾rank(A).
由此可见, 倍加不改变秩: 对 m×n 阵 A,rank(AE(n;p,q;s))rank(E(m;p′,q′;s′))=rank(A),=rank(A).(回想, E(n;p,q;s)E(n;p,q;−s)=In, 且 E(m;p′,q′;−s′)E(m;p′,q′;s′)=Im, 若 p=q, 且 p′=q′.)
设 m×n 阵 D 适合, 若 i=j, 则 [D]i,j=0. 设存在 r 个正整数 i1, i2, …, ir (1⩽i1<i2<⋯<ir, 且 ir⩽m, 且 ir⩽n), 使 [D]ik,ik=0 (k=1, …, r), 且 u 不等于 i1, …, ir 的任何一个时, [D]u,u=0. 则 rank(D)=r.
首先, D 有一个行列式非零的 r 级子阵, 因为det(D(i1,i2,…,iri1,i2,…,ir))===det⎣⎡[D]i1,i10⋮00[D]i2,i2⋮0⋯⋯⋱⋯00⋮[D]ir,ir⎦⎤[D]i1,i1…[D]ir,ir0.然后, D 没有行列式非零的 r+1 级子阵. 若 D 没有 r+1 级子阵, 则 D 当然没有行列式非零的 r+1 级子阵. 设 D 有 r+1 级子阵. 那么, 在 D 的任何 (不同的) r+1 列, 必存在一列, 其是零. (因为当 v 不等于 i1, …, ir 的任何一个时, [D]v,v=0, 且若 u=v, 则 [D]u,v=0. 则当 v 不等于 i1, …, ir 的任何一个时, D 的列 v 的元全为 0.) 则 D 的任何 r+1 级子阵必有一列, 其是零. 则它的行列式为 0. 则 rank(D)=r.
最后, 我们讨论 n 级阵 (n⩾2) A 的古伴 adj(A) 的秩.
若 rank(A)=n, 则 det(A)=0. 则 det(adj(A))=(det(A))n−1=0. 则 rank(adj(A))=n.
若 rank(A)<n−1, 则 A 的 n−1 级子阵 A(j∣i) 的行列式为 0. 则 adj(A)=0. rank(adj(A))=0.
有挑战的情形或许是当 rank(A)=n−1 时. 我们证明, rank(adj(A))=1.
证 1. 我们说, 若
det(A)=0, 且
r>1, 则
adj(A) 没有行列式非零的
r 级子阵 (见 “古伴的性质 (2)”). 则
rank(adj(A))⩽1. 另一方面, 既然
rank(A)=n−1, 则
A 的某
n−1 级子阵的行列式
det(A(v∣u))=0. 则
[adj(A)]u,v=(−1)v+udet(A(v∣u))=0. 则
rank(adj(A))⩾1.
注意, 倍加不改变秩. 于是, 我们也可考虑用倍加.
证 2. 我们知道, 存在若干个形如 E(n;p,q;s) 的阵 E1, F1, E2, F2, …, Eu, Fu, 与若干个形如 M(n;q′;s′) 的阵 M1, M2, …, Mn, 使A==F1F2…FuM1M2…MnEu…E2E1F1F2…Fu(M1M2…Mn)Eu…E2E1.则adj(A)===adj(E1)…adj(Eu)adj(Mn)…adj(M1)adj(Fu)…adj(F1)adj(E1)…adj(Eu)(adj(Mn)…adj(M1))adj(Fu)…adj(F1)adj(E1)…adj(Eu)adj(M1…Mn)adj(Fu)…adj(F1).记 D=M1M2…Mn. 则当 i=j 时, [D]i,j=0. 则当 i=j 时, [adj(D)]i,j=0. 注意, rank(A)=rank(D). 注意, adj(E(n;p,q;s))=E(n;p,q;−s), 故 rank(adj(A))=rank(adj(D)).
设
rank(A)=n−1. 则
rank(D)=n−1. 设在
[D]1,1,
[D]2,2,
…,
[D]n,n, 恰有
r 个数不是
0. 则
rank(D)=r. 则在
[D]1,1,
[D]2,2,
…,
[D]n,n, 恰有
n−1 个数不是
0. 设
[D]k,k=0. 则当
i=k 时,
[D]i,i=0. 则在
[adj(D)]1,1,
[adj(D)]2,2,
…,
[adj(D)]n,n, 有一个数不是
0, 因为
[adj(D)]k,k=(−1)k+kdet(D(k∣k))=1⩽ℓ⩽nℓ=k∏[D]ℓ,ℓ=0.并且, 当
i=k 时,
[adj(D)]i,i=(−1)i+idet(D(i∣i))=1⩽ℓ⩽nℓ=i∏[D]ℓ,ℓ=[D]k,k1⩽ℓ⩽nℓ=i,k∏[D]ℓ,ℓ=0.则
rank(adj(D))=1. 则
rank(adj(A))=1.