极分解 我们知道一个复数 z ∈ C 可以写成z = r e i θ 这里 r ≥ 0 表示 z 的长度, e i θ 的模长为 1. ( r , θ ) 称为复平面的极坐标.
n 阶复方阵也可以作类似的分解.
设 A 是 n 阶复方阵. 则存在 n 阶半正定厄米方阵 R (或 R ~ ) 和 n 阶酉矩阵 Θ (或 Θ ~ ) 使得A = R Θ ( = Θ ~ R ~ ) 其中 R (或 R ~ ) 由 A 唯一确定. 这个称为矩阵的极分解.
证明 : 设 A = U Σ V ˉ T 是 A 的奇异值分解. 则A = U Σ U ˉ T U V ˉ T 取 R = U Σ U ˉ T , Θ = U V ˉ T 即满足要求.
另一方面
A A ˉ T = R R ˉ T = R 2 由命题
5.7.15 知
R = A A ˉ T 是唯一确定的.
Moore–Penrose 逆 在复数域的情形, 一个 m × n 矩阵 A 的广义逆 A − 也是定义为满足A A − A = A 的 n × m 矩阵 A − . 广义逆总是存在而且并不唯一. 我们可以通过引入额外条件在所有广义逆中找一个唯一的代表元, 称为 Moore–Penrose 逆.
设 A 是 m × n 复矩阵. 则存在唯一的 n × m 复矩阵 X 满足如下条件{ A X A = A ( A X ) T = A X X A X = X ( X A ) T = X A 这个 X 称为 A 的 Moore–Penrose 逆, 记为 A + .
证明 : 设 A 的奇异值分解为A = U Σ V ˉ T = U [ Σ r 0 0 0 ] V ˉ T 考虑X = V [ Σ r − 1 0 0 0 ] U ˉ T
直接计算易知A X A X A X = U [ Σ r 0 0 0 ] V ˉ T V [ Σ r − 1 0 0 0 ] U ˉ T U [ Σ r 0 0 0 ] V ˉ T = A = V [ Σ r − 1 0 0 0 ] U ˉ T U [ Σ r 0 0 0 ] V ˉ T V [ Σ r − 1 0 0 0 ] U ˉ T = X 并且A X = U [ I r 0 0 0 ] U ˉ T 和 X A = V [ I r 0 0 0 ] V ˉ T 都是厄米方阵. 因此 X 满足所述方程. 下证唯一性.
记 X = VY U ˉ T , 则 Y 满足{ Σ Y Σ = Σ ( Σ Y ) T = Σ Y Y Σ Y = Y ( Y Σ ) T = Y Σ 写成分块矩阵的样子Σ = [ Σ r 0 0 0 ] Y = [ B D C E ]
由方程
Σ Y Σ = Σ 和
Y Σ Y = Y 得到
Y = [ Σ r − 1 D C D Σ r C ] 再由
Σ Y = [ I r 0 Σ r C 0 ] 和 Y Σ = [ I r D Σ r 0 0 ] 的厄米性, 得到
C = D = 0 . 唯一性得证.
通过 Moore–Penrose 逆可以直接给出最小二乘问题的一个解. 在复向量的情形, 最小二乘问题为z ∈ C n min ∥ A z − w ∥
由 Moore–Penrose 逆 A + 的性质可以得到A ˉ T = ( A A + A ) T = A ˉ T ( A A + ) T = A ˉ T A A + 即
A ˉ T ( I m − A A + ) = 0
因此对任意 y ∈ C n y ˉ T A ˉ T ( I m − A A + ) w = 0 即⟨ A y , w − A A + w ⟩ = 0 这说明 A A + w 是 w 向 A 的像的投影, 即 z 0 = A + w 给出了最小二乘问题的一个解
∥ A z 0 − w ∥ = z ∈ C n min ∥ A z − w ∥
Pauli 矩阵与自旋 SU ( 2 ) 群特殊酉群 SU ( 2 ) 在物理中扮演着重要的角色, 例如在量子力学中被用来描述粒子自旋的对称性. 在几何上, SU ( 2 ) 给出了 3 维空间转动 SO ( 3 ) 的双重覆盖, 也称为 3 维自旋群 SU ( 2 ) = Spin ( 3 ) . 由定义, SU ( 2 ) 群由满足 det ( A ) = 1 的 2 阶酉矩阵 A 组成.
设 A = [ a c b d ] , 则A A ˉ T = [ a c b d ] [ a ˉ b ˉ c ˉ d ˉ ] = [ a a ˉ + b b ˉ c a ˉ + d b ˉ a c ˉ + b d ˉ c c ˉ + d d ˉ ] 由酉方阵 A A ˉ T = I 2 得∣ a ∣ 2 + ∣ b ∣ 2 = ∣ c ∣ 2 + ∣ d ∣ 2 = 1 a c ˉ = − b d ˉ
由 det A = a d − b c = 1 , 我们得到联立方程组⎩ ⎨ ⎧ ∣ a ∣ 2 + ∣ b ∣ 2 = ∣ c ∣ 2 + ∣ d ∣ 2 = 1 a c ˉ = − b d ˉ a d − b c = 1 由此解出d = a ˉ c = − b ˉ ∣ a ∣ 2 + ∣ b ∣ 2 = 1
因此SU ( 2 ) = { [ a − b ˉ b a ˉ ] ∣ ∣ a , b ∈ C 满足 ∣ a ∣ 2 + ∣ b ∣ 2 = 1 } 如果用实数来表示 a = x 1 + i x 2 , b = x 3 + i x 4 , 则 S U ( 2 ) 中的元素一一对应于 3 维单位球面S 3 = {( x 1 , x 2 , x 3 , x 4 ) ∈ R 4 ∣ x 1 2 + x 2 2 + x 3 2 + x 4 2 = 1 }
Pauli 矩阵 Pauli 矩阵包括三个矩阵, 定义如下: σ 1 = [ 0 1 1 0 ] σ 2 = [ 0 i − i 0 ] σ 3 = [ 1 0 0 − 1 ] 这些矩阵都是厄米方阵并且满足代数关系⎩ ⎨ ⎧ σ 1 2 = σ 2 2 = σ 3 2 = I 2 σ 1 σ 2 = − σ 2 σ 1 = i σ 3 σ 2 σ 3 = − σ 3 σ 2 = i σ 1 σ 3 σ 1 = − σ 1 σ 3 = i σ 2
设 V 为所有迹为零的 2 阶厄米方阵构成的集合V = { 2 阶复方阵 A ∣ A ˉ T = A , Tr A = 0 } 容易验证, 任一矩阵 Q ∈ V 可以写成Q = [ x 3 x 1 + i x 2 x 1 − i x 2 − x 3 ] = x 1 σ 1 + x 2 σ 2 + x 3 σ 3 这里 x 1 , x 2 , x 3 是实数. 因此我们可以把 R 3 和 V 一一对应起来σ : R 3 x → V ↦ σ ( x ) := x 1 σ 1 + x 2 σ 2 + x 3 σ 3 即 V 是 3 维实线性空间, Pauli 矩阵给出一组基.
R 3 中的向量长度可以通过 Pauli 矩阵实现为∥ x ∥ 2 = − det σ ( x )
证明 :
det σ ( x ) = ∣ ∣ x 3 x 1 + i x 2 x 1 − i x 2 − x 3 ∣ ∣ = − ( x 1 2 + x 2 2 + x 3 2 ) 设 x , y ∈ R 3 , 则σ ( x ) σ ( y ) = ⟨ x , y ⟩ I 2 + iσ ( x × y ) 即 Pauli 矩阵同时表达了 3 维向量的内积和叉乘.
证明 : 设
ϵ ijk ( i , j , k ∈ { 1 , 2 , 3 }) 是
3 维 Levi-Civita 符号.
ϵ ijk 关于指标
i , j , k 是全反对称的:
ϵ ijk = − ϵ jik = − ϵ kji = − ϵ ikj ϵ ijk 只有当
i , j , k 互不相同时才非零, 它的值为置换
{ 1 , 2 , 3 } → { i , j , k } 的符号. 例如
ϵ 123 = 1 .
Pauli 矩阵相乘可以通过 Levi-Civita 符号表示为σ j σ k = δ jk I 2 + i l ∑ ϵ jk l σ l 例如σ 2 2 = I 2 σ 1 σ 3 = i ϵ 132 σ 2 = − i σ 2
于是
σ ( x ) σ ( y ) = = = j ∑ x j σ j k ∑ y k σ k j , k ∑ x j y k δ jk I 2 + i j , k , l ∑ ϵ jk l x j y k σ l ⟨ x , y ⟩ I 2 + iσ ( x × y ) 这里我们用到叉乘
x × y 的第
l 分量可以表达为
j , k ∑ ϵ jk l x j y k .
设 A ∈ SU ( 2 ) , Q ∈ V , 则矩阵 A Q A ˉ T 满足{ A Q A ˉ T T = A Q ˉ T A ˉ T = A Q A ˉ T Tr ( A Q A ˉ T ) = Tr ( Q A ˉ T A ) = Tr Q = 0 即 A Q A ˉ T 也是 V 中的矩阵. 因此给定 A ∈ SU ( 2 ) , 我们可以定义映射f A : V Q → V ↦ f A ( Q ) := A Q A ˉ T
容易验证 f A 是一个线性映射. 记 f A 在 V 的基 { σ 1 , σ 2 , σ 3 } 下的表示矩阵为 ρ ( A ) , 即f A ( σ j ) = i = 1 ∑ 3 σ i ρ ( A ) ij 这里 ρ ( A ) ij 表示矩阵 ρ ( A ) 的 ( i , j ) 分量. 则对于 σ ( x ) = x 1 σ 1 + x 2 σ 2 + x 3 σ 3 ∈ V , 我们有f A ( σ ( x )) = j ∑ x j f A ( σ j ) = i , j ∑ σ i ρ ( A ) ij x j = i ∑ σ i y i 这里 y i = j ∑ ρ ( A ) ij x j , 或写成向量形式 y = ρ ( A ) x .
因此我们发现如下关系f A ( σ ( x )) = σ ( ρ ( A ) x )
证明 : 设
A ∈ SU ( 2 ) , 需证明
ρ ( A ) ∈ SO ( 3 ) . 由
f A ( σ ( x )) = σ ( ρ ( A ) x ) 两边取行列式并利用
det σ ( x ) = − ∥ x ∥ 2 , 我们得到
∥ ρ ( A ) x ∥ 2 = − det σ ( ρ ( A ) x ) = − det f A ( σ ( x )) = − det ( A σ ( x ) A ˉ T ) = − det σ ( x ) = ∥ x ∥ 2 因此
ρ ( A ) 保持
R 3 的范数, 故
ρ ( A ) ∈ O ( 3 ) .
由
ρ ( A ) ∈ O ( 3 ) 知
det ρ ( A ) = ± 1 . 由于
SU ( 2 ) 拓扑上和 3 维球面
S 3 一样, 而
S 3 是连通的, 所以
A 可以在
SU ( 2 ) 中连续变化到恒等矩阵
I 2 . 因此
det ρ ( A ) = det ρ ( I 2 ) = 1 这说明
ρ ( A ) ∈ SO ( 3 ) .
设 u ∈ R 3 是一个单位向量, 即 ∥ u ∥ = 1 . 考虑A u := [ i u 3 i u 1 − u 2 i u 1 + u 2 − i u 3 ] ∈ SU ( 2 ) 我们可以用 Pauli 矩阵把它写为A u = i ( u 1 σ 1 + u 2 σ 2 + u 3 σ 3 ) = iσ ( u )
因此f A u ( σ ( x )) = A u σ ( x ) A u T = σ ( u ) σ ( x ) σ ( u ) 利用 ∥ u ∥ = 1 和 Pauli 矩阵的乘法性质σ ( u ) σ ( x ) σ ( u ) = = = (⟨ u , x ⟩ I 2 + iσ ( u × x )) σ ( u ) σ (⟨ u , x ⟩ u ) − σ (( u × x )) × u ) σ ( 2 ⟨ x , u ⟩ u − x )
写成矩阵表达式2 ⟨ x , u ⟩ u − x = ⎣ ⎡ 2 u 1 u 1 − 1 2 u 2 u 1 2 u 3 u 1 2 u 1 u 2 2 u 2 u 2 − 1 2 u 3 u 2 2 u 1 u 3 2 u 2 u 3 2 u 3 u 3 − 1 ⎦ ⎤ ⎣ ⎡ x 1 x 2 x 3 ⎦ ⎤ 我们得到ρ ( A u ) = ⎣ ⎡ 2 u 1 u 1 − 1 2 u 2 u 1 2 u 3 u 1 2 u 1 u 2 2 u 2 u 2 − 1 2 u 3 u 2 2 u 1 u 3 2 u 2 u 3 2 u 3 u 3 − 1 ⎦ ⎤
观察到{ ρ ( A u ) ( u ) = u ρ ( A u ) ( x ) = − x 若 x ⊥ u 因此 ρ ( A u ) 表示在 u 的正交补平面上作对径映射.
ρ : SU ( 2 ) → SO ( 3 ) 满足如下性质:
1.
保单位: ρ ( I 2 ) = I 3
2.
保乘法结构: ρ ( A B ) = ρ ( A ) ρ ( B )
3.
保逆结构: ρ ( A − 1 ) = ρ ( A ) − 1
证明 : 保单位显然. 我们只需证明
ρ 保乘法. 则
ρ ( A ) ρ ( A − 1 ) = ρ ( I 2 ) = I 3 ⟹ ρ ( A − 1 ) = ( ρ ( A ) ) − 1 由
σ ( ρ ( A ) ρ ( B ) x ) = = = f A ( σ ( ρ ( B ) x )) = f A ( f B ( σ ( x ))) A ( B σ ( x ) B ˉ T ) A ˉ t = ( A B ) σ ( x ) A B T f A B ( σ ( x )) = σ ( ρ ( A B ) x ) 即得
ρ ( A ) ρ ( B ) = ρ ( A B ) 我们称 ρ : SU ( 2 ) → SO ( 3 ) 是一个群同态, 即保持群结构 (乘法和逆) 的映射. 进一步分析容易验证 ρ 是一个 2 : 1 的覆盖映射. 例如ρ ( ± I 2 ) = I 3 实际上对任意 A ∈ SU ( 2 ) 有ρ ( A ) = ρ ( − A ) 这个 2 : 1 的覆盖解释了一个非常有趣的现象: 即自旋 1/2 粒子绕某一轴旋转 360 度后, 状态不完全恢复, 而是变为原状态的负号.
例如考虑 SU ( 2 ) 矩阵R θ = cos ( θ /2 ) I 2 + i sin ( θ /2 ) σ 1 = [ cos ( θ /2 ) i sin ( θ /2 ) i sin ( θ /2 ) cos ( θ /2 ) ] 直接计算易知ρ ( R θ ) = ⎣ ⎡ 1 0 0 0 cos θ − sin θ 0 sin θ cos θ ⎦ ⎤ 因此 ρ ( R θ ) 对应于在 3 维空间中以 x 1 -方向为轴在 x 2 x 3 -平面旋转 θ 角度. 在旋量空间或者在 SU ( 2 ) 矩阵中, ρ ( R θ ) 相当于旋转 θ /2 . 可以看出R 2 π = − R 0 = − I 2 ρ ( R 2 π ) = I 3
Pauli 矩阵还可以实现 4 维时空的 Lorentz 变换. 设 M 为所有 2 阶厄米方阵构成的集合M = { 2 阶复方阵 A ∣ A ˉ T = A } M 中任一矩阵 T 可以写成T = [ x 0 + x 3 x 1 + i x 2 x 1 − i x 2 x 0 − x 3 ] = x 0 I 2 + x 1 σ 1 + x 2 σ 2 + x 3 σ 3 这 x 0 , x 1 , x 2 , x 3 ∈ R . 因此 M 是 4 维实线性空间, 矩阵 { I 2 , σ 1 , σ 2 , σ 3 } 构成 M 的一组基.
我们可以把 M 中的矩阵和 4 维时空对应起来, 其中 x 0 表示时间, x 1 , x 2 , x 3 表示空间. 用x = ⎣ ⎡ x 0 x 1 x 2 x 3 ⎦ ⎤ 来表示 4 维时空向量. 记T ( x ) = [ x 0 + x 3 x 1 + i x 2 x 1 − i x 2 x 0 − x 3 ] 则det T ( x ) = x 0 2 − x 1 2 − x 2 2 − x 3 2 给出 4 维时空的 Minkowski 长度. 因此保持 M 中矩阵行列式不变的线性变换都将给出 Minkowski 空间的 Lorentz 变换.
例如设 A 是一个 2 阶复方阵, 满足 det A = ± 1 . 对 2 阶厄米方阵 T ∈ M , 矩阵 A T A ˉ T 也是厄米方阵, 并且det ( A T A ˉ T ) = ∣ det A ∣ 2 det T = det T
因此我们得到保行列式的线性映射g A : M T → M ↦ A T A ˉ T 这个线性映射在基 { I 2 , σ 1 , σ 2 , σ 3 } 下的表示矩阵是一个 Lorentz 变换. 这个实际上给出了 4 维时空 Lorentz 群的旋量构造. 记S L ∗ ( 2 , C ) := { 2 阶可逆复方阵 ∣ det A = ± 1 } 则上述构造给出了 4 维 Minkowski 时空的旋量群 Spin ( 3 , 1 ) = S L ∗ ( 2 , C ) .