微分同胚与坐标变换
给定映射 f:Ω1→Rn2, 其中开区域 Ω1⊂Rn1, 用坐标分量表示, 我们有f=(f1,f2,⋯,fn2).如果对任意的 k∈{1,⋯,n2} 对任意的 N⩾1, 对任意的 N 个正整数 k1,k2,⋯,kN∈{1,2,⋯,n1}, 偏导数∂xkN∂(∂xkN−1∂(⋯(∂xk1∂fk)⋯))都存在并且是连续的, 那么我们就称 f 是光滑的. 如果 n2=1, 我就称之为光滑函数, 并记为 C∞(Ω1).
证明以下三个关于光滑函数的基本性质:
1) | C∞(Ω1) 是一个 R-代数, 即对任意的 f,g∈C∞(Ω1), 它们的任意实线性组合以及乘积都是光滑函数. |
2) | 假设 f∈C∞(Ω1). 如果对任意的 x∈Ω, f(x)=0, 那么 f1 也是光滑函数. |
3) | 证明, 对任意的 i∈{1,2,⋯,n1}, 对任意的 f∈C∞(Ω1), 有 ∂xi∂f∈C∞(Ω1). |
对于两个开区域 Ω1⊂Rn1 和 Ω2⊂Rn2, 如果存在双射映射 f:Ω1→Ω2, 使得f:Ω1→Ω2, f−1:Ω2→Ω1都是光滑的, 我们就称 Ω1 和 Ω2 是微分同胚的 (光滑同胚) .
我们把 Ω1 到 Ω2 之间的光滑映射的全体记作是 C∞(Ω1,Ω2). 当然, 光滑的映射不见得是光滑的同胚.
考虑如下映射f:R→R, x↦x3.很明显, f 是光滑的并且是双射. 但是 f−1(y)=3y 不是光滑的.
根据上次课逆映射微分的命题, 我们一定有
n1=n2 (维数相同) .
1) | 微分同胚是两个区域的一种等价性, 这个等价性是用光滑的双射定义的. 一个好的类比是研究线性空间: 两个线性空间之间等价指的是用线性的双射定义的线性同构. |
2) | 两个区域微分同胚, 但是上述的映射 f 不一定唯一. 比如说, 令 Ω1=Ω2=Rn, 任意一个可逆的线性映射都可以被选作 f. |
有了微分同胚这个概念, 我们可以讨论坐标变换. 考虑两个开区域 Ω1⊂Rn1 和 Ω2⊂Rn2, 其中 n1=n2=n (为了区别起见) . 我们在第一个 Rn1 上面用 (x1,⋯,xn) 作为坐标系, 在第二个 Rn2 上面用 (y1,⋯,yn) 作为坐标系, 假设存在光滑的同胚: Φ:Ω1→Ω2.我们认为通过 Φ 这个映射可以用 Ω1 上的点来参数化 Ω2 上的点: 用 (x1,⋯,xn) 这个坐标系统也可以描述 Ω2 上的点. 比如说, 给定坐标 (x1,⋯,xn), 它对应的 Ω2 中的点是 Φ(x1,⋯,x2); 根据双射的性质, 对任意的 p∈Ω2, 我们总能找到 (x1,⋯,xn)∈Ω1, 使得 Φ(x1,⋯,xn)=p. 所以, 我们有两种不同的方式描述 Ω2 上的同一个点 p∈Ω2:
• | 第一种方式是 p 的 yi-坐标 (y1(p),⋯,yn(p)); |
• | 第二种是 f−1(p) 的 xi-坐标 (x1(Φ−1(p)),⋯,xn(Φ−1(p))). |
我们强调之前所谈论的坐标函数的含义: xi 和 yi 分别视作是 Ω1 和 Ω2 上的函数.
所以, 给定了 (x1,⋯,xn) 来描述 p∈Ω2, 它所对应的 (y1,⋯,yn) 的坐标应该是(Φ1(x1,⋯,xn),⋯,Φn(x1,⋯,xn)).很多文献习惯上将这个写成 (y1(x1,⋯,xn),⋯,yn(x1,⋯,xn)).
同学们也许会发现, 上面这段讨论实际上根本没有用到 Φ 和 Φ−1 是光滑的, 只需要 Φ 是双射就好: 实际上, 光滑性保证了光滑函数的拉回还是光滑的. 当给定了 Ω2 上的一个函数 f:Ω2→R, 通过复合映射, 我们可以将它看作是 Ω1 的函数, 我们通常将它记作 Φ∗f=f∘Φ (称作是 f 被 Φ 的拉回) , 下面的交换图表给出了拉回的定义:
假设 f∈C∞(Ω2) (即 f 是 Ω2 上的光滑函数) , 那么 Φ∗f∈C∞(Ω1).
证明. 我们只需证明对任意的
Ω2 上的光滑函数, 对任意的
N,
Φ∗f 的各阶偏导数
∂xkN∂(∂xkN−1∂(⋯(∂xk1∂(f∘Φ))⋯))都存在且连续即可. 对所求的偏导数的次数
N 进行归纳. 如果
N=0, 由于
Φ 是连续映射, 根据连续映射的复合仍然连续, 我们知道此时
Φ∗f 是连续的. 假设对任意的
f,
Φ∗f 的连续
N 次的偏导数存在且连续, 那么根据链式法则, 我们知道
∂xi∂(f∘Φ)∣∣x=x0=k=1∑n∂xi∂Φk(x0)∂yk∂f(Φ(x0))=k=1∑n∂xi∂Φk⋅(Φ∗∂yk∂f)∣∣x=x0.此时, 每一个
∂xi∂Φk 都是光滑函数, 对
∂yk∂f 利用归纳假设 (这是那个被拉回的函数) , 对上述函数再求
N 次偏导数也连续, 所以命题成立.
上面的证明仅仅用到了 Φ 的光滑性, 换句话说, 我们证明了如下的命题, 如果 f 是光滑函数, Φ 是光滑映射, 那么它们的复合 f∘Φ 是光滑函数, 其中, 我们假设 f:Ω2→R, Φ:Ω1→Ω2.
最终, 我们考虑常见的但是容易产生混淆的一种情形: 我们假设有两个坐标系统 (xi) 和 (yi) 来描述 Ω 中的点. 此时, 我们把每一个坐标函数都理解为 Ω 上的函数, 那么, 如果用第一个坐标系统来描述第二个坐标系统的坐标函数, 我们就可以写成y1=y1(x1,⋯,xn),⋯,yn=yn(x1,⋯,xn).反过来, 我们可以用第二个坐标系统来描述第一个坐标系统的坐标函数: x1=x1(y1,⋯,yn),⋯,xn=xn(y1,⋯,yn).假设 f:Ω→R 是 Ω 上的函数. 通过利用不同的坐标, 我们可以将 f 写成 f(x1,⋯,xn) 或者 f(y1,⋯,yn). 如此用变量来写函数很容易产生混乱. 当然, 如果 f 是用第二个坐标系统写的, 即 f(y1,⋯,yn), 我们所说的 f(x1,⋯,xn) 应该是f(x1,⋯,xn)=f(y1(x1,⋯,xn),⋯,yn(x1,⋯,xn)).事实上, 我们应该将 Ω1=Ω 和 Ω2=Ω 区分开, 在 Ω1⊂Rn1 中我们用 (xi) 作为坐标, 在 Ω2⊂Rn2 中我们用 (yi) 作为坐标, 其中 n1=n2=n. 我们考虑映射Φ:Ω1→Ω2, (x1,⋯,xn)↦(y1(x1,⋯,xn),⋯,yn(x1,⋯,xn)).它的逆映射就是Φ−1:Ω2→Ω1, (y1,⋯,yn)↦(x1(y1,⋯,yn),⋯,xn(y1,⋯,yn)).此时, 上面谈到的函数 f 是 Ω2 上的函数.
另外 f 的偏导数 (或者微分) 也可以用 (xi) 来表达, 这就是说要计算 f∘Φ 的偏导数 (用 (yi) 坐标来算, 就是 ∂yi∂f) .
利用链式法则证明: ∂xi∂f=j=1∑n∂xi∂yj(x1,⋯,xn)∂yj∂f(y1(x1,⋯,xn),⋯,yn(x1,⋯,xn)).
据此可知, 由偏导数的定义是依赖于坐标系的选取的. 特别地, 在不同的坐标系之间它们的差别由坐标变换 (即上述的
Φ) 的 Jacobi 矩阵决定.
偏导数的定义不是内蕴的, 它依赖于具体坐标系的选取. 然而, 微分 df (按定义) 不依赖于坐标系统的选取, 是内蕴的.
我们现在回到学习的主线上来. 我们现在证明偏导数运算具有可交换性 (这个定理的几何表述是函数的 Hasse 算子是对称的) :
给定 Rn 上的开集 Ω (n⩾2) 和函数 f:Ω→R 是函数, i,j∈{1,2,⋯,n} 是两个不同的指标. 假设在 Ω 上, 函数 ∂xi∂f(x), ∂xj∂f(x) 和 ∂xi∂(∂xj∂f)(x) 存在并且连续. 那么, ∂xj∂(∂xi∂f)(x) 也存在并且对任意的 x∈Ω, 我们有∂xi∂(∂xj∂f)(x)=∂xj∂(∂xi∂f)(x).
为了证明这个命题, 我们从一个引理开始:
假设函数 f:R2−{(0,0)}→R 在 (0,0)∈R2 处的极限 (x,y)→(0,0)limf(x,y) 存在. 如果存在 ε0>0, 使得对于任意给定的 y0∈(−ε0,ε0), 极限 x→0limf(x,y0) 都存在. 那么, 极限 y→0lim(x→0limf(x,y)) 存在并且y→0lim(x→0limf(x,y))=(x,y)→(0,0)limf(x,y).
引理的证明. 按照距离空间中函数极限存在的定义, (x,y)→(0,0)limf(x,y) 存在指的是存在 L, 使得对任意的 ε>0, 存在 δ>0, 当 x2+y2<δ 时, 有 ∣f(x,y)−L∣<ε.
任意固定 ε>0. 在上述极限的定义中, 我们现在选取 δ 使得 δ⩽ε0. 考虑任意一个 y, 其中 ∣y∣<δ. 下面认为 y 是固定的.
那么, 自然有
x, 使得
y2+x2<δ. 此时, 我们令
x→0, 我们就有 (因为
∣y∣<ε0) :
∣∣x→0limf(x,y)−L∣∣⩽ε.即对任意的
ε>0, 我们找到了
δ>0, 使得对任意的
∣y∣<δ, 上面的不等式成立. 按照极限的定义, 这就是说
y→0lim(x→0limf(x,y)) 存在并且等于
L.
Clairaut-Schwarz 定理的证明. 不妨假设 i=1, j=2. 为了简单起见, 我们将函数 f 记为f(x1,x2,⋯,xn)=f(x,y,Z),其中 (x,y)=(x1,x2), Z=(x3,⋯,xn)∈Rn−2. 对任意的 h,ℓ∈R, 定义Δ(h,ℓ)=f(x+h,y+ℓ,Z)−f(x+h,y,Z)−f(x,y+ℓ,Z)+f(x,y,Z).根据 Lagrange 中值定理, 我们有hℓΔ(h,ℓ)=h1(ℓf(x+h,y+ℓ,Z)−f(x+h,y,Z)−ℓf(x,y+ℓ,Z)−f(x,y,Z))=h1(∂y∂f(x+h,y+θ1ℓ,Z)−∂y∂f(x,y+θ2ℓ,Z))其中 θ1,θ2∈[0,1]. 当然, 简单地运用中值定理不能保证 θ1=θ2. 为说明基本的想法, 我们先假设 θ1=θ2=θ. 此时, 根据二阶导数存在, 我们可以继续运用中值定理: hℓΔ(h,ℓ)=∂x∂(∂y∂f)(x+θ′h,y+θℓ,Z),其中, θ′∈[0,1]. 再根据 ∂x∂(∂y∂f) 的连续性, 我们知道 (k,ℓ)→0limhℓΔ(h,ℓ) 存在.
我们要对函数R2−(0,0)→R, (h,ℓ)→hℓΔ(h,ℓ),来运用前面的引理. 我们可以先令 ℓ→0, 根据定义, 我们有h→0lim(ℓ→0limhℓΔ(h,ℓ))=h→0lim(h1(ℓf(x+h,y+ℓ,Z)−f(x+h,y,Z)−ℓf(x,y+ℓ,Z)−f(x,y)))=h→0limh1(∂y∂f(x+h,y,Z)−∂y∂f(x,y,Z))=∂x∂(∂y∂f)(x,y,Z).反过来, 我们也可以先令 h→0. 类似的, 我们得到ℓ→0lim(h→0limhℓΔ(h,ℓ))=∂y∂(∂x∂f)(x,y,Z).根据引理, 上面两式子左端的极限是相同的, 这就证明了命题.
最终, 我们解决上述
θ1=θ2 的技术性问题. 我们把函数写成:
hℓΔ(h,ℓ)=h1(ℓ[f(x+h,y+ℓ,Z)−f(x,y+ℓ,Z)]−[f(x+h,y,Z)−f(x,y,Z)]).我们只需要将
f(x+h,y,Z)−f(x,y,Z) 作为整体视作是
y 的函数 (此时,
x,h,Z 都是固定的) 来运用 Lagrange 中值定理即可.
基于这个命题, 我们可以引入一个方便的记号来记多重的偏导数: 令 α=(α1,⋯,αn) 为一个多重指标, 也就是说对于每个 i⩽n, 有 αi∈Z⩾0, 我们用 ∂αf 表示 α1 个 ∂x1∂, α2 个 ∂x2∂, ⋯, αn 个 ∂xn∂ 作用在 f 上, 即∂αf=(∂xn∂)αn∘(∂xn−1∂)αn−1∘⋯∘(∂x1∂)α1(f).当 f 足够多次连续可微时, 上述命题保证了这些算子的复合不依赖于它们作用的顺序. 我们还令∣α∣=α1+⋯+αn⩽k,传统上我们还把上面的多重偏导数 ∂α 记作∂x1α1⋯xnαn∂∣α∣.比如说, 我们经常看到∂x2∂2f, ∂x∂y∂2f.
如果 Clairaut-Schwarz 定理中的连续性不成立, 那么命题可能并不成立. 考察函数
f(x,y)={x2+y2xy(x2−y2), 0, (x,y)=(0,0);(x,y)=(0,0).那么, 我们有∂x∂f(x,y)=(x2+y2)2x4y+4x2y3−y5.从而, 我们有∂y∂(∂x∂f)(0,0)=y→0limy∂x∂f(0,y)−∂x∂f(0,0)=−1.类似地 (利用对称性) , 我们有∂x∂(∂y∂f)(0,0)=1.这表明 Clairaut-Schwarz 定理并不成立. 请思考定理中的哪个条件没有被满足.
多元函数的 Taylor 展开
我们现在来证明高维空间 Lagrange 余项 Taylor 公式, 也就是在一个点附近用高次的多项式函数来逼近函数. 证明的想法很直接: 将问题沿不同的方向化为 1 维的情形. 其余余项的 Taylor 公式证明是类似的.
假设 Ω⊂Rn 是凸的开集, f 在 Ω 上 k+1 次可微分 (我们通常要求更多的条件: f 不超过 k+1 阶的偏导数存在并且连续, 这对于应用来说是足够的) . 那么, 对于任意的 x,y∈Ω, 其中 x=(x1,⋯,xn), y=(y1,⋯,yn), 存在 ϑ∈[0,1] (可能依赖于 x 和 y) , 使得f(y1,⋯,yn)=∣α∣⩽k∑α!∂αf(x)(x−y)α+∣α∣=k+1∑α!∂αf(x+ϑ(y−x))(x−y)α,其中, (x−y)α=(x1−y1)α1⋯(xn−yn)αn, α!=α1!⋯αn!.
证明. 我们考虑
x 与
y 之间的连线并把函数
f 限制到这条线上. 用分析的语言写, 我们考虑函数
g:(−ε,1+ε)→R, g(t)=f(x+t(y−x)).这里用到了
Ω 的凸性. 我们首先来计算
g 的
k-次导数 (
k⩾0) :
g(k)(t)=∣α∣=k∑α!k!(∂αf)(x+t(y−x))(y−x)α.这个式子可以用归纳法来证明:
k=0 是显然的. 假设
g(k−1)(t)=∣α∣=k−1∑α!(k−1)!(∂αf)(x+t(y−x))(y−x)α.根据方向导数的性质, 对任意的函数
f, 我们有
dtdf(x+tv)∣∣t=0=vi∂xi∂f(x).所以,
g(k)(t)=∣α∣=k−1∑α!(k−1)![(∂αf)(x+t(y−x))]′(y−x)α=∣α∣=k−1∑α!(k−1)![m=1∑n(ym−xm)(∂xm∂(∂αf))(x+t(y−x))](y−x)α=∣β∣=k∑β!k!(∂βf)(x+t(y−x))(y−x)β.最后一个等号需要搞清楚如下的组合性质: 为了从前一步的某个
∣α∣=k−1 得到固定的
β, 其中
∣β∣=k, 有如下
n 中可能性:
α1=(β1−1,⋯,βn)⟶β, α2=(β1,β2−1,⋯,βn)⟶β,⋯,αn=(β1,⋯,βn−1)⟶β.所以, 所求的系数应该是 (这个等价于
β1+⋯+βn=k) :
m=1∑nαm!(k−1)!=β!k!.现在对
g 用 Taylor 公式 (在
0 和
1) 之间, 我们有
ϑ∈[0,1], 使得
g(1)=ℓ⩽k∑ℓ!g(ℓ)(0)+(k+1)!g(k+1)(ϑ).将
g(t) 的值代入即可.
Rn 中的光滑子流形: 曲线和曲面的定义
在 Rn 中, 我们考虑 Rk⊂Rn, 此时的 Rk 是按照下面精确的方式定义的Rk={(x1,⋯,xn)∣∣xn=xn−1=⋯=xk+1=0}.这是由 n−k 个线性函数的零点定义出来的线性子空间. 这就是最基本的 k-维子流形的例子. 所谓的 k 子流形, Rn 中的一个子集, 在每个局部上来看, 它长得样子就像是线性的 Rk 落在 Rn 中一样. 我们可以设想 R3 中的一个曲面, 在一个点的附近, 这个曲面和切平面很近, 从而变化不大. 它的样子大概是
曲面的两面用灰色和绿色表示, 其中绿色的一面上画有一条线. 这个曲面落在 R3 中和右边的 R3 中的 R2 上的圆盘很相似.
为了理解子流形的概念, 我们先看两个 (不平凡的) 例子, 它们维数或者余维数为 1 (在 R3 种这已经给出了所有的维数) . 维数为 0 的基本例子是 Rn 中的点, 余维数为 0 基本例子是 Rn 本身, 这些都没有太多的意思. 另外, 子流形是一个局部的概念, 所以我们现在只关心局部的情况.
我们首先研究曲线.
假设 γ:(−ε,ε)→Rn 是光滑的映射 (C1 就可以) , 我们要求对任意的 t∈(−ε,ε), γ′(t)=0. 这个条件称作是曲线的非退化条件, 一定程度上可以认为是要排除 γ(t)≡p 这种极端的例子 (此时, 我们得到的是一个点而不是曲线) . 由于 γ′(0)=0, 我们不妨假设 γn′(0)>0 (<0 的情况可以类似地讨论) , 即 γ(t) 的 x1 分量在 0 附近 (我们总可以假设 ε 很小) 是严格递增的. 我们要说明 γ 在 γ(0) 附近与 x1 轴 R1={(x1,0,⋯,0)} 非常相似. 事实上, 我们构造映射Φ:Rn→Rn, (x1,x2,⋯,xn)↦(γ1−1(x1),x2−γ2(γ1−1(x1)),,⋯,xn−γn(γ1−1(x1))).在 0 附近, 这是一个良好定义并且是可逆的映射: 它的逆可以用下面的公式表达Φ−1:Rn→Rn, (y1,y2,⋯,yn)↦(γ1(y1),y2+γ2(y1),,⋯,yn+γn(y1)).
不难看出, 这是一个微分同胚. 所在, 在用一个微分同胚把曲线 (的像) 拉直了之后或者说换到了 (y1,⋯,yn) 这个坐标系下看, 我们的曲线就是标准的 x1-轴:
其次, 我们研究由方程的图像定义的曲面. 给定函数 f:Rn−1→R. 我们考虑它的图像Γf={(x,f(x))∈Rn−1×R⊂Rn∣x∈Ω}.这是 Rn 中的超曲面 (余维数为 1) . 我们定义映射Φ:Rn→Rn, (x1,x2,⋯,xn)↦(y1,⋯,yn)=(x1,x2,⋯,xn−f(x1,⋯,xn−1)).很明显, Φ 是双射, 其逆映射为Φ−1:Rn→Rn, (y1,y2,⋯,yn)↦(x1,⋯,xn)=(y1,y2,⋯,yn+f(y1,⋯,yn−1)).这两个映射显然是光滑的, 所以 Φ 是微分同胚. 从而, 通过用一个微分同胚把这个曲面拉直了之后或者说换到了 (y1,⋯,yn) 这个坐标系下看, 我们的曲线就是标准的 Rn−1 (由一个线性方程的零点给出) :
最终, 我们再研究一个经典的例子, 考虑 3 维空间中的单位球面 S2⊂R3, 也即是S2={(x,y,z)∣∣x2+y2+z2=1.}很明显, S2 可以被写成 6 个半球面的并: S2=Sx>02∪Sx<02∪Sy>02∪Sy<02∪Sz>02∪Sz<02.每一个部分都是一个函数的图像, 比如说, Sy<02={(x,z,f(x,z)∣∣f(x,z)=−1−x2−z2,x2+z2<1)},其中, 函数 f 定义在 (x,z) 平面的一个单位圆盘的内部. 所以说, S2 在局部上来看是一个微分子流形.
证明, S2⊂R3 在如下的意义下永远都不是一个函数的图像: 不存在微分同胚Φ:R3→Ry1,y22×Ry31,和 Ry1,y22 中的区域 (任意区域不一定是开集) Ω⊂ 以及 Ω 上的光滑函数 f, 使得 Φ(S2) 是 f 的图像Γf={(y1,y2,f(y1,y2)∈Ry1,y22×Ry31∣∣(y1,y2)∈Ω}.
将这些例子作为基本的图像, 我们就可想办法定义 Rn 中的子流形了, 这是所有的那些在局部上复合一个微分同胚 (换一下坐标系) 之后就变成了线性子空间的一部分的那样的子集合. : 1
假设 M⊂Rn 是非空子集, 这个 Rn 中的坐标用 (xi) 表示. 如果存在整数 d⩾0, 使得对任意的 x∈M, 存在开集 U⊂Rn, x∈U 以及 (可能是另外一个) Rn 中的开集 (这个 Rn 中的坐标用 (yi) 表示) V 以及微分同胚Φ:U→V使得Φ:U∩M→V∩(Rd×{0}),其中我们把 Rn=Rd+(n−d) 写成 Rd×Rn−d, 上述的表达式要求后面的 n−d 个坐标都取 0, 我们就称 M 是 Rn 的一个 d-维的 (微分) 子流形. 其中, d 称作是 M 的维数, 记作 dimM.
我们还把 codimM=n−dimM 称作是 M 的余维数, 它有着如下具体的含义: 存在 codimM 个函数, 使得 M 恰好是这些函数的公共零点集合. 实际上, 我们可以取 fj=Φ∗yj, 其中 j=d+1,d+2,⋯,n.
我们需要说明维数
d 是良好的定义. 换句话说, 把
M 局部上看成是某个
d 维的线性子空间中的集合的方式又可能不唯一. 按照定义, 对于给定的
x, 我们有可能有 (很明显有很多) 另外的
d′⩾0 和开集
U′,
x∈U′ 以及 (可能是另外一个)
Rn 中的开集 (这个
Rn 中的坐标用
(zi) 表示)
V′ 以及微分同胚
Φ′:U′→V′使得
Φ′:U′∩M=V′∩(Rd′×{0}),通过考虑
U∩U′, 我们可以要求
U=U′.
我们考虑映射Ψ=Φ′∘Φ−1:V→V′.这是两个微分同胚的复合, 所以还是微分同胚. 特别地, 如果我们把映射 Ψ 限制到 V∩(Rd×{0}) 上面, 我们就得到了微分同胚Ψ:V∩(Rd′×{0})→V′∩(Rd′×{0}).这是 Rd 和 Rd′ 中的两个开集之间的微分同胚, 我们上周已经利用复合映射的链式法则证明了 d=d′.