本节我们来介绍信息几何中最为重要的一个数学概念: 对偶联络. 它在一定程度上可以看作是 Levi-Civita 联络的一种拓展, 可以用于刻画统计流形上的一些难以用传统微分几何概念来描述的数学结构. “对偶联络” 及下一小节中即将介绍的 “对偶平坦流形” 的概念最初由日本数学家甘利俊一 (Shun-ichi Amari) 于 20 世纪 80 年代提出, 它标志着 “信息几何” 这个学科正式成型.
设 (M,g) 是 Riemann 流形, ∇ 是 M 上定义的一个联络, 若 M 上定义有另一联络 ∇∗, 使得对于 M 上的任意光滑向量场 X,Y,Z, 有Xg(Y,Z)=g(∇XY,Z)+g(Y,∇X∗Z)(9.1)则称 ∇∗ 是 ∇ 关于 g 的对偶联络.
首先我们来说明对偶联络的存在唯一性.
一个 Riemann 流形 (M,g) 上的任意一个联络 ∇ 有唯一一个关于 g 对偶的联络.
证明. 我们把 (
9.1) 改写成
g(Y,∇X∗Z)=Xg(Y,Z)−g(∇XY,Z)(9.2)这样一来, 如我们能够证明对于任意
X,Z∈X(M), 映射
ωX,Z∇∗:Y↦Xg(Y,Z)−g(∇XY,Z) 作为
X(M)→C∞(M) 的映射定义了
M 上的一个余切向量场, 那么 (
9.2) 便说明
∇X∗Z 是
M 上一个唯一确定的切向量场
∇X∗Z=g♯ωX,Z∇∗ (
g♯ 的定义见定义
4.0.4). 显然
ωX,Z∇∗(Y1+Y2)=ωX,Z∇∗Y1+ωX,Z∇∗Y2 对
∀Y1,Y2∈X(M) 成立, 往证
ωX,Z∇∗(fY)=fωX,Z∇∗Y 对
∀Y∈X(M),f∈C∞ 成立. 事实上,
ωX,Z∇∗(fY)=Xg(fY,Z)−g(∇X∗(fY),Z)=(Xf)g(Y,Z)+fXg(Y,Z)−g(f∇XY,Z)−g((Xf)Y,Z)=f(Xg(Y,Z)−g(∇XY,Z))=fωX,Z∇∗Y这就说明对于任意
X,Z∈X(M),
ωX,Z∇∗ 总是构成余切向量场, 从而
∇X∗Z 是
M 上一个良定义的切向量场, 也就是说
∇∗:X,Z↦∇X∗Z 是一个良定义的
X(M)×X(M)→X(M) 的映射. 除此之外, 我们还需要证明
∇∗ 确系联络, 即验证它满足定义
4.0.5 中的两条性质. 此处我们仅验证 Leibniz 公式, 其余的相对比较容易验证. 事实上, 对任意
X,Y,Z∈X(M),
f∈C∞(M), 我们有
g(Y,∇X∗(fZ))=Xg(Y,fZ)−g(∇XY,fZ)=(Xf)g(Y,Z)+fXg(Y,Z)−fg(∇XY,Z)=(Xf)g(Y,Z)+fg(Y,∇X∗Z)=g(Y,(Xf)Z+f∇X∗Z),由
Y 的任意性知
∇X∗(fZ)=(Xf)Z+f∇X∗Z对任意
X,Z∈X(M),
f∈C∞(M), 这便验证了 Leibniz 公式. 而
∇X∗Z 对
X 的函数线性性质则可以用类似的方法验证.
记 ∇ 为 Riemann 流形 (M,g) 的 Levi-Civita 联络, 则由于 ∇ 满足对 g 的相容性 Z(g(X,Y))=g(∇ZX,Y)+g(X,∇ZY) (见定理 4.0.8), 故 ∇ 的对偶联络仍为其本身. 此外, 注意到定理 4.0.8 中 “对 g 的相容性” 本身便等价于 ∇=∇∗, 从而∇是 Levi-Civita 联络⟺∇=∇∗且∇无挠.
接下来我们考虑 “对偶联络的对偶联络”, 即 ∇ 的对偶联络 ∇∗ 的对偶联络 ∇∗∗, 它满足Xg(Z,Y)=g(∇X∗Z,Y)+g(Z,∇X∗∗Y),∀X,Y,Z∈X(M),(9.3)将 (9.1) 与 (9.3) 相减, 有g(∇XY−∇X∗∗Y,Z)=0,∀X,Y,Z∈X(M),由 g 的非退化性和 X,Y,Z 的任意性, 有 ∇=∇∗∗, 故有如下结论:
设 (M,g) 是 Riemann 流形, ∇ 是 M 上定义的一个联络, ∇∗ 是 ∇ 关于 g 的对偶联络, 则 ∇∗ 关于 g 的对偶联络是 ∇.
上述命题说明对偶联络总是成对出现, 两联络要么 “互为对偶”, 要么 “互不对偶”, 对偶的对偶必为本身. 这自然也是 “对偶” 一词的含义.
传统 Riemann 几何中的一个经典结论是说 Levi-Civita 联络下的平行移动具有 “保内积” 性质, 也就是说gγ(t1)(Πγv,Πγw)=gγ(t0)(v,w).(9.4)对于任何曲线 γ:[t0,t1]→M 和任意切向量 v,w∈Tγ(t0)M 成立, 其中 Π 是 Levi-Civita 联络意义下的平行移动 (读者对此不了解也不必担心, 因为我们马上就要证明一个更一般的情形). 这一性质可以自然地拓展到对偶联络上.
设 (M,g) 是 Riemann 流形, ∇,∇∗ 是一对关于 g 的对偶联络, γ:[t0,t1]→M 是 M 上的光滑曲线. 我们分别将关于 ∇ 和 ∇∗ 沿 γ 从 γ(t0) 到 γ(t1) 的平行移动记作 Πγ, Πγ∗. 则对于任意 v,w∈Tγ(t0)M, 有gγ(t1)(Πγv,Πγ∗w)=gγ(t0)(v,w).(9.5)
证明. 我们记
X 为在
∇ 下沿
γ 平行且满足
X(γ(t0))=v 的切向量场,
Y 为在
∇∗ 下沿
γ 平行且满足
X(γ(t0))=w 的切向量场, 则
dtdg(Xγ(t),Xγ(t))=γ˙(g(Xγ(t),Xγ(t)))=g(∇γ˙(t)X,Yγ(t))+g(Xγ(t)∇γ˙(t)∗Y)=0,其中第 2 个等号利用了对偶联络的定义式 (
9.1), 而第 3 个等号则利用了
X,Y 关于相应联络的平行性 (即
∇γ˙(t)X=∇γ˙(t)∗Y=0). 上式说明
g(Xγ(t)Yγ(t)) 是不随
t 的变化而变化的. 特别地, 取
t=t0,t1, 知
g(Xγ(0),Yγ(0))=g(Xγ(1),Yγ(1)). 这便是 (
9.5).
在上述定理中, 我们考虑 ∇ 的曲率张量为 0 且 γ 是闭曲线的情形. 记 p=γ(t0)=γ(t1). 则 Πγ 与 Πγ∗ 都是 TpM 到自身的线性同构. 并且由于 ∇ 的曲率张量为 0, Πγ 是 TpM 的恒同映射 (见推论 8.0.8). 这样一来, (9.5) 就变成了gp(v,Πγ∗w)=gp(v,w),∀v,w∈TpM,由于 g 的非退化性, 上式说明 Πγ∗w=w 任意 w∈TpM 成立, 即 Πγ∗ 也是恒同映射; 而 γ 是局部上任意闭合曲线, 故 ∇∗ 的曲率也应为 0 (见推论 8.0.8). 接下来我我们来严格证明这一点.
设 (M,g) 是 Riemann 流形, ∇,∇∗ 是关于 g 对偶的一对联络, 如果 ∇ 的曲率张量为 0, 则 ∇∗ 的曲率张量也为 0.
证明. 我们记
∇,∇∗ 对应的曲率张量分别为
R,R∗. 对于任意
X,Y,Z,W∈X(M), 考虑恒等式
[X,Y]g(Z,W)=XYg(Z,W)−YXg(Z,W),利用对偶联络的定义式 (
9.1), 我们可以把上式两侧分别变形为
左侧=右侧===g(∇[X,Y]Z,W)+g(Z,∇[X,Y]∗W)X(g(∇YZ,W)+g(Z,∇Y∗W))−Y(g(∇XZ,W)+g(Z,∇X∗W)){g(∇X∇YZ,W)+g(∇YZ,∇X∗W)+g(∇XZ,∇Y∗W)+g(Z,∇X∗∇Y∗W)}−{g(∇Y∇XZ,W)+g(∇XZ,∇Y∗W)+g(∇YZ,∇X∗W)+g(Z,∇Y∗∇X∗W)}g(∇X∇YZ,−∇Y∇XZ,W)−g(Z,∇X∗∇Y∗W−∇Y∗∇X∗W),于是按照曲率张量的定义 (
4.5), 我们有
g(R(X,Y)Z,W)=−g(Z,R∗(X,Y)W),由
X,Y,Z,W 的任意性,
R≡0 当且仅当
R∗≡0.
有些可惜的是, 对于对偶联络的挠率张量而言, 我们没有如上这样简单的结论. 一个挠率张量为零的联络的对偶联络的挠率张量不一定为零. 不过我们还是有一些简单的结论可以用于判断一对对偶联络的挠率是否同时为零. 首先我们定义(∇g)(X,Y,Z):=Xg(Y,Z)−g(∇XY,Z)−g(Y,∇XZ),(9.6)容易验证 ∇g 定义了一个 3 阶协变张量, 在此记法下, ∇ 与 g 的相容性等价于 ∇g=0, 此外, 不难验证 (∇g)(X,Y,Z) 还可以表述为(∇g)(X,Y,Z)=g(∇X∗Y,Z)−g(∇XY,Z).(9.7)
设 (M,g) 是 Riemann 流形, ∇,∇∗ 是关于 g 对偶的一对联络, 则如下 4 个命题中任意两个可以推出其余两个:
1. | ∇ 的挠率为零, |
2. | ∇∗ 的挠率为零, |
3. | ∇g(X,Y,Z) 关于 X,Y,Z 是对称的, |
4. | ∇:=2∇+∇∗ 是 g 的 Levi-Civita 联络. |
证明. 我们记
∇,∇∗ 的挠率张量分别为
T,T∗, 则 (i), (ii) 分别等价于
T=0 和
T∗=0. 由 (
9.6) 可知
∇g(X,Y,Z) 本身关于
Y,Z 就是对称的, 因此 (iii) 本质上等价于
∇g(X,Y,Z) 关于
X,Y 的对称性, 而利用 (
9.7), 我们有
==(∇g)(X,Y,Z)−(∇g)(Y,X,Z)g(∇X∗Y−∇Y∗X,Z)−g(∇XY−∇YX,Z)g(T∗(X,Y),Z)−g(T(X,Y),Z),由
X,Y,Z 的任意性, 知 (iii) 等价于
T=T∗.最后, 我们在 (
9.7) 中将
∇ 换成
∇∗, 并利用
∇∗∗=∇, 可得
(∇∗g)(X,Y,Z)=g(∇XY,Z)−g(∇X∗Y,Z).将上式与 (
9.7) 相加并除以
2, 可得
(∇g)(X,Y,Z)≡0,从而
∇ 一定是与
g 相容的 (注意这一点与
∇ 或
∇∗ 的挠率如何没有任何关联!), 于是 (iv) 其实等价于
∇ 的挠率为 0, 很容易验证
∇=2∇+∇∗ 的挠率为
2T+T∗, 因此 (iv) 等价于
2T+T∗=0于是我们要证的命题本质上是
(i).T=0,(ii).T∗=0,(iii).T=T∗,(iv).2T+T∗=0,中的任意两个可以推出其余两个, 而这就是显然的了.