隐函数定理
我们假设 Ω⊂Rn+p 是开集. 为了定理的叙述方便, 我们将 Rn+p 写成乘积结构 Rn×Rp. 在 Rn 上面我们用坐标 x=(x1,⋯,xn), 在 Rp 上面我们用坐标 y=(y1,⋯,yp). 对于 Ω 上的映射/函数 f, 我们用 f(x,y) 这样的二元函数来表示, 其中 x∈Rn, y∈Rp. 为了行文方便, 我们引入下面 (不标准的) 符号: 将 y 固定, 我们就可以将 f(x,y) 看作是 x 的函数, 即f(⋅,y):Rn→Rm,从而我们可以对 x 的微分, 我们将这个微分记作 dxf(x,y); 类似地, 我们可以定义 dyf(x,y).
我们首先给出隐函数定理的经典叙述 (和证明) , 然后用子流形的语言就可以有更清晰的几何表述.
给定正整数 n 和 p 和非空开集 Ω⊂Rn×Rp, 映射 f:Ω→Rp 是连续可微的 (C1 的) .
假设 (x∗,y∗)∈Ω, 使得 f(x∗,y∗)=0, 其中 x∗∈Rn, y∗∈Rp, 0∈Rp. 如果 (dyf)(x∗,y∗) 是可逆的, 即 Jacobi 矩阵 (∂yj∂fi)1⩽i,j⩽p 在 (x∗,y∗) 点是可逆的. 那么, 存在开集 U⊂Rn, x∗∈U, 存在开集 V⊂Rp, y∗∈V, 存在连续可微的映射 ϕ:U→V, 使得对任意的点 (x,y)∈Ω, 如下两条是等价的:
• | (x,y)∈U×V 并且 f(x,y)=0; |
• | x∈U 并且 y=ϕ(x). |
我们进一步还有 dϕ(x)=−(dyf(x,y))−1∘dxf(x,y).
" 隐 " 函数说的是方程 f(x,y)=0 实际上隐含地将 y 定义成 x 的函数, 定理具体地将这个函数构造了出来: y=ϕ(x). 当 p=1 时, f(x,y)=0 在空间中所定义的曲面局部上就可以表达成 y=ϕ(x) 的形式, 也就是说它局部上可以看成是函数的图像, 从而是 Rn+1 中余 1 维的子流形, 下面的图很好的总结了这个情形:
隐函数定理的叙述乍看起来晦涩难懂. 最简单的就是如下的情形: Ω=Rn×Rp, f 是投影映射: f:Rn×Rp→Rp, (x1,⋯,xn,y1,⋯,yp)↦(y1,⋯,yp).此时, U=Rn, V=Rp 而ϕ:Rn→Rp, x↦0.这显然满足定理的要求, 因为 f(x,y)=0⇔y=0. 隐函数定理本质上说只要选取适当的坐标系这是唯一的例子.
证明. 我们利用反函数定理来证明隐函数定理. 为此, 我们通过把 f 的值域空间加一些维数来定义一个新的映射. 注意到, 对于 x∈Rn, f(x,y)∈Rp (如果 (x,y) 落在 f 的定义域里的话) . 所以, 以下的映射是良好定义的: F:Ω→Rn×Rp, (x,y)↦F(x,y)=(x,f(x,y)).很明显, F 是连续可微的 (因为它的每个分量都是连续可微的) . 我们可以计算 F 在 (x,y) 处微分, 用 Jacobi 矩阵来显然可以表达成: dF=(iddxf0dyf),(34.1)这是一个 (n+p)×(n+p) 的方阵. 由于 (dyf)(x∗,y∗) 可逆, 所以分块矩阵 (dF)(x∗,y∗) 也是可逆的. 所以, 我们可以对映射 F 在 (x∗,y∗) 处用反函数定理: 存在开集 U⊂Ω, (x∗,y∗)∈U, 存在开集 V⊂Rn+p 并且通过将它缩小我们可以假设它具有乘积结构 V=V1×V2 以及连续可微的映射 G:V→U (这是 F 的逆) , 使得G∘F=idU, F∘G=idV.我们可以参考下面的示意图:
我们将 F 的值域 (即 G 的定义域) 上的坐标用 (x′,y′) 来表示. 按照分量的记法, 可以将 G 写成G(x′,y′)=(G1(x′,y′)∈Rn,G2(x′,y′)∈Rp).我们把反函数定理给出的两个等式用分量写出来, 就有G∘F=idU F∘G=idV ⇒ G1(x,f(x,y))=x, G2(x,f(x,y))=y;⇒ G1(x′,y′)=x′, f(x′,G2(x′,y′))=y′.总结一下, 我们得到了⎩⎨⎧G(x′,y′)=(x′,G2(x′,y′)),G2(x,f(x,y))=y,f(x′,G2(x′,y′))=y′.按照 F 和 G 的定义, 对于给定的 (x,y)∈U, 我们有如下的等价关系f(x,y)=0 ⇔ F(x,y)=(x,0) ⇔ (x,y)=F−1(x,0)=G(x,0)=(x,G2(x,0)).所以, 如果我们令 ϕ(x)=G2(x,0):V→Rp, 那么, 给定的 (x,y)∈U, 我们有如下的等价关系f(x,y)=0 ⇔ y=ϕ(x).所以, 我们可以取 U=U, V=V1, 这就证明了隐函数定理的主要论述.
最终, 为了计算微分, 我们对
f(x,ϕ(x))=0 求微分, 即对映射
U→Rp, x↦f(x,ϕ(x))求微分. 我们得到
dfx(x,y)+dfy(x,y)⋅dϕ(x)=0, 其中 y=ϕ(x).在
(x∗,y∗) 的附近,
dfy(x,y) 是可逆的, 所以
dϕ(x)=−(dyf(x,y))−1∘dxf(x,y).
如果我们把反函数定理条件中映射改为 C∞ 的, 那么结论中的函数和映射也是 C∞, 这从反函数定理的叙述就可以看出来.
隐函数定理的子流形叙述
利用子流形这个概念, 我们可以更形象地理解隐函数定理. 反过来, 隐函数定理给出了一种非常实用的判断子流形的方法.
假设 M⊂RN 是一个 d-维的子流形, 所以对任意的 x∈M, 存在开集 U⊂RN 包含 x, Rn 中的开集 V 以及微分同胚 φ:U→V 使得φ:U∩M=V∩(Rd×{0}),
我们现在沿用隐函数定理中的符号. 我们令M={(x,y)∈Rn×Rp∣∣f(x,y)=0}.由于 f(x,y)=0 实际上是 p 个方程 (以为 f:Rn+p→Rp) , 所以, 我们将上述集合是 Rn+p 中由 p 个方程的零点集合. 如果 f 的某些导数为非退化的 (参考隐函数定理的叙述) , 那么局部上这个 M 可以表达成映射的图像的形式, 即对任意的 (x,y)∈M, 局部上都等价于 y=ϕ(x). 从另外一种观点来看, M 可以被 x 参数化, 即给定 x, 就唯一地确定了 M 上的一个点.
为了说明 M 实际上是微分子流形, 我们需要构造一个映射 Φ:Rn+p→Rn+p, 使得 φ 是微分同胚 (局部上) 并且将 M 映射成右边 Rn+p 上的由 y1=⋯=yp=0 所给出来的线性子空间. 这个映射就是定理证明中的 F: F(x,y)=(x,f(x,y))=(x,0), 其中 (x,y)∈M.这样, 我们就证明了 M 实际上 (局部上) 是一个微分子流形.
我们把上面的讨论总结为如下的定理:
给定正整数 n′ 和 p (n=n′+p) 和非空开集 Ω⊂Rn′+p=Rn, 映射 f:Ω→Rp 是光滑的. 令M={(x,y)∈Rn×Rp∣∣f(x,y)=0}.假设 (x∗,y∗)∈M 使得 Jacobi 矩阵 (∂yj∂fi)1⩽i,j⩽p 在 (x∗,y∗) 点是可逆的. 那么, 存在开集 U⊂Rn 使得 U∩M 是 Rn 中的 n′ 维子流形.
这个版本有如下重要的推论:
假设 f:Ω→Rp 是光滑映射, 其中 Ω⊂Rn 是开集, n⩾p. 对于 c∈Rp, 我们把 c 上纤维定义为的 c 在 f 下的逆像: f−1(c)={x∈Rn+p∣f(x)=c}.如果对任意的 x∈f−1(c), Rankdf(x)=p. 那么, 纤维 f−1(c) 是余维数为 p 的子流形.
证明. 我们要在
Rn 上的选取坐标系
x1,⋯,xn. 根据
Rank df(x)=p, 通过调整
x1,⋯,xn 的标号, 我们可以使得后面
p 个坐标
xn−p+1,⋯,xn 满足
(∂xn+1−j∂fi)1⩽i,j⩽p(x)=0,其中
x 是任意选定的
x∈f−c 上的点. 我们选取函数
f−c 并且将后
p 个坐标用
y1,⋯,yp 来表示, 这就化成了隐函数定理的情况. 特别地, 纤维
f−c 在任意一点附近都是
p 维子流形, 所以
f−1(c) 是
p-维子流形.
我们注意到定理本身的叙述不需要任何的坐标系, 而证明本身很好地解释了不依赖于坐标和选取坐标系之间的关系.
我们应该和线性代数的情况做类比: 给定 n 维线性空间上的 p 个齐次线性方程, 它们的公共零点是 n−p 的线性子空间当且仅当这 p 个线性方程的秩是 p.
我们可以用下图形象地记忆并表示这个命题, 这是关于隐函数定理最干净最形象的表述:
左图代表是余维数为 2 的情形. 我们假设 f:Ω→f(Ω), 其中 f(Ω) 是下面灰色的区域. 对于每个 c∈Ω, 我们可以把它的原像想象成插在这个点上面的一个纤维. 特别地, Ω 可以被写成这些纤维的无交并: Ω=c∈f(Ω)∐f−1(c).然而, 我们需要在每个 x∈f−1(c) 点处要求一个非退化的条件才能保证 f−1(c) 是光滑的子流形. 上面的图形表示, 在 c 的纤维如果满足这个非退化的条件, 那么它附近的 c′ 处的纤维 f−1(c) 也是光滑的子流形: 实际上, 我们需要对 f−1(c) 限制才可以 (比如纤维是紧的) , 但是很多情况下这一点都成立, 大概的原因是 Rank df(x)=p 如果成立, 就在附近的一个开集上面成立. 然而, 离着 c 比较远的点, 这个条件就可能退化, 比如说上面的蓝色 c× 点, 它的纤维就 “打折” 了.
左图代表是余维数为 1 的情形, 对于每个 c, 我们形象的认为纤维是 Ω 的一个 “切片”. 事实上, 为了研究高维子流形的结构, 我们经常通过这种切片化成低维数子流形的情况来研究. 在后面的课程和作业中, 我们会用这个方法研究几个重要的例子.
下面的命题是隐函数定理几何版本的逆命题: 子流形总是可以 (在局部上) 由 codimM=n−dimM 个方程的零点来定义. 我们已经在第四次课的开始证明了这个结论, 为了完备起见 (也为了再次复习子流形的定义) , 我们概述一下证明.
假设 Md⊂Rn 是 d 维的子流形. 那么, 对任意的 p∈M, 存在开集 U⊂Rn, p∈U 和 n−d 个光滑函数 f1,⋯,fn−d∈C∞(U), 使得Md={x∈U∣∣f1(x)=⋯=fn−d(x)=0}.特别地, 映射的微分f:U→Rn−d, x↦(f1(x),⋯,fn−d(d))在每个点 x∈M 处的秩都是 n−d.
证明. 按子流形的定义, 存在开集
U⊂Rn 包含
p,
Rn 中的开集
V 以及微分同胚
φ:U→V, 使得
φ:U∩M=V∩(Rd×{0}).我们用
y1,⋯,yn 表示
V 上的坐标函数, 那么我们选取
fi=φ∗yi=yi∘φ 即可, 其中
i=d+1,⋯,n.
我们沿用命题中的记号, 如果令Md+k={x∈U∣∣f1(x)=⋯=fn−d−k(x)=0},那么, Md+k 是 d+k 维的子流形 (作业中会证明) . 换句话说, 每次加上一个 fj(x)=0 的限制, 子流形的维数恰好降低 1 维.
我们现在给出隐函数定理的几个应用, 首先是用来判定子流形, 现在我们只需要做一些简单的代数计算即可:
1) | Rn 中的球面 Sn−1={x∈Rn∣x12+⋯+xn2=1} 是一个 n−1 维的子流形. 球面可以被视作是函数f(x1,⋯,xn)=(x1)2+(x2)2+⋯+(xn)2−1的零点集. 所以, 只要验证它的微分 df(x) 的秩为 1 即可. 然而, 用矩阵来写df(x)=(∂x1∂f(x),⋯,∂xn∂f(x))=2(x1,⋯,xn).由于在 Sn−1 上, ∣x∣=1, 上面的向量显然非零, 所以这是光滑子流形. 这比之前我们把球面 S2 拆成六块 (参见第三课讲义) 并且将每块写成函数的图像要方便很多. |
2) | 我们考虑 R4=C2 中的曲面T2={(z1,z2)∣∣∣z1∣=1,∣z2∣=1}.如果我们用 (x,y,z,w) 作为坐标, 那么这个曲面实际上是f(x,y,z,w)=x2+y2−1, g(x,y,z,w)=z2+w2−1这两个方程的公共零点集. 我们需要计算R4→R2, (x,y,z,w)↦(f(x,y,z,w),g(x,y,z,w)),的 Jacobi 矩阵并判断它的秩. 这个矩阵显然是(2x02y002z02w).由于在 T2 上面, x2+y2=1, z2+w2=1, 所以上面这个矩阵的秩是 2, 从而 T2 是 2 维的子流形. 它实际上是一个环面 (甜甜圈) : |
R3 中由方程定义的曲线和曲面
在经典的微积分课程中, R3 中由一个方程或者两个方程定义的曲线和曲面是最基本的几何对象. 我们首先引入如下的定义:
假设 M⊂Rn 是子流形. 如果 dimM=1, 我们就称之为 Rn 中的一条光滑曲线; 如果 dimM=2, 我们就称之为 Rn 中的一个光滑曲面; 如果 dimM=n−1, 我们就称之为 Rn 中的一个光滑超曲面.
这里曲线的概念和上个学期所讲的曲线略有不同: 之前是所谓的参数化曲线, 即曲线是一个映射 γ:I→Rn, 其中 I⊂R 是一个区间. 这里的曲线只是 Rn 中的一个子集, 然而根据隐函数定理的结论, 我们在局部上可以给它一个参数化.
我们关心的是如下的对象, 他们有着更特殊的要求:
假设 f:Rn→R 是光滑函数, 如果对于任意的 x0∈f−1(0), df(x0)=0, 那么 f−1(0) 是超曲面. 我们把这种超曲面称为由一个方程整体定义的光滑超曲面.
我们把 (显然的) 证明留作作业. 特别地, 在
R3 中, 我们有
假设 f(x,y,z) 是 R3 上的光滑函数, 如果对于任意满足 f(x0,y0,z0)=0 的点 (x0,y0,z0), 我们有(∂x∂f,∂y∂f,∂z∂f)(x0,y0,z0)=0,那么{(x,y,z)∈R3∣∣f(x,y,z)=0}是光滑曲面. 我们把这种超曲面称为由一个方程整体定义的光滑曲面.
R3 中的柱面由如下方程x2+y2=1定义, 这是一个光滑曲面: 我们取 f(x,y,z)=x2+y2−1, 此时, (∂x∂f,∂y∂f,∂z∂f)=(2x,2y,0)=0,
我们还有用两个方程定义的曲线:
假设 f(x,y,z) 和 g(x,y,z) 是 R3 上的光滑函数, 如果对于任意同时满足 f(x0,y0,z0)=0 和 g(x0,y0,z0)=0 的点 (x0,y0,z0), 如果如下两个向量线性不相关: (∂x∂f,∂y∂f,∂z∂f)(x0,y0,z0), (∂x∂g,∂y∂g,∂z∂g)(x0,y0,z0),那么{(x,y,z)∈R3∣∣f(x,y,z)=0,g(x,y,z)=0}是光滑曲线. 我们把这种曲线称为由两个方程整体定义的光滑曲线.
我们把 (显然的) 证明留作作业.
在结束关于隐函数定理的几何讨论之前, 我们给出隐函数定理的一个对偶版本. 这个版本本身和隐函数是无关的, 之所以是对偶的, 是因为隐函数定理研究从 Rn 到 Rp 的映射, 其中 n⩾p, 其结论说映射的逆项或者纤维是子流形. 而这个定理 (证明非常简单, 只要验证定义) 研究从 Rn 到 Rp′ 的映射, 其中 n⩽p, 其结论说映射的像是子流形.
Ω⊂Rn 是开集, f:Ω→Rn+p 是光滑映射. 假设对于点 x∗∈Ω, 有 rank df(x∗)=n, 那么, 存在开集 U⊂Rn, x∗∈U, 使得 f(U)⊂Rn+p 是 n 维的子流形.
证明. 在
Ω 上选取坐标系统
x1,⋯,xn, 在
Rn+p 上选取坐标坐标系统
y1,⋯,yn,z1,⋯,zp. 我们把
f 用坐标分量写成
f(x)=(f1(x),⋯,fn+p(x)),其中每个
fi(x) 都是
Ω 上的光滑函数. 由于有
rank df(x∗)=n, 通过调换
{xi} 坐标的指标, 我们不妨假设
det(∂xj∂fi)i,j⩽n(x∗)=0.我们现在考虑
F=πy∘f, 其中
π:Rn+p→Rn 是取前
n 个坐标, 即
换句话说, 我们定义了
F(x)=(f1(x),f2(x),⋯,fn(x)). 根据上述行列式非零的条件,
F 为局部微分同胚 (反函数定理) . 令
U 为
x 在
Ω 中的开集,
F:V→F(U) 为这个微分同胚并令
V=F(U). 此时, 我们考察
f(U)⊂Rn+p. 对于
x∈U, 令
y=F(x),
f(x)∈Rn+1 可以写成
(f1(x),⋯,fn(x);fn+1(x),⋯,fn+p(x))=(y;fn+1(x),⋯,fn+p(x))=(y,fn+1(F−1(y),fn+2(F−1(y)),⋯,fn+p(F−1(y)).所以, 它可以被视作是
V 上定义的向量值函数
y↦fn+1(F−1(y),fn+2(F−1(y)),⋯,fn+p(F−1(y)) 的图像, 这是一个用
y 做为坐标来参数化的子流形 (在本次作业中证明) .
在 R3 还有一个经典曲面: Möbius 带. 我们用参数的方式可以把它写作M=⎩⎨⎧(x,y,z)∈R3∣∣⎩⎨⎧x=(1+rcos2θ)cosθ,y=(1+rcos2θ)sinθ,z=rsin2θ θ∈[0,2π],r∈(−1,1)⎭⎬⎫.适当改变一下书写方式更有启发: (x,y,z)=(cosθ,sinθ,0)+(rcos2θcosθ,rcos2θsinθ,rsin2θ).当 r=0 时, 我们得到一个用 θ 来参数化的基本圆周 (cosθ,sinθ,0). 给定 θ, 就给定了这个圆周上的一个点 (cosθ,sinθ,0). 固定这个 θ, 当 r 在 (−1,1) 之间变化的时候, 我们就在这个点插上了一个小线段并且这个线段的方向的变化是 θ 的一半. 所以, 当 θ 从 0 变化到 2π, 基本圆周上的点旅行了一周又回到了原来的点, 但是它上面所插的小线段只转动了 180∘.
我们下面证明一个不明显的命题, 为此, 我们先选择好的记号: 把 r=0 光滑圆周写成参数形式: γ:[0,2π]→R3, θ↦(cosθ,sinθ,0).给定 θ 处, 我们用 e0 表示 γ 在 γ(θ) 处的切方向 γ′(θ), 即令 e0=(−sinθ,cosθ,0). 和 e0 垂直的方向有两个, 我们分别记作e1(θ)=(cosθ,sinθ,0), e2(θ)=(0,0,1).据此, 我们把 M 的参数化写成: M={(x,y,z)=(cosθ,sinθ,0)+rcos2θe1(θ)+rsin2θe2(θ),θ∈[0,2π],r∈(−1,1)}.根据刚刚证明的定理, 这是 R3 中的一个光滑曲面 (参见本次作业) .
不存在光滑函数 f∈C∞(R3), 使得M={(x,y,z)∣∣f(x,y,z)=0}且 df(x,y,z) 在 M 上的每点处不为零, 即 M 不能只用一个方程零点来整体定义.
我们需要运用关于由一个方程定义的光滑曲面的特殊性质 (基于连续函数的介值定理) : 给定 f∈C∞(R3), 假设对任意的 x∈Ω, df(x)=0, f−1(0)⊂Ω 是光滑子流形并且由一个方程定义. 任意选定 x∈Ω, 考虑 x 处的邻域 U (足够小) . 由于 df(x)=0, 我们不妨选 v∈Rn, 使得∇vf(x)=df(x)(v)>0.从而, 在当 ε>0 足够小时, p±=x±εv∈U 并且 f(p+)>0, f(p−)<0. 我们声明, 任何一条连接 p+ 和 p− 的曲线都要经过 f−1(0), 即对任意的连续映射 γ:[0,1]→X, 其中起点 γ(0)=p− 和终点 γ(1)=p+) , 一定存在 t0∈(0,1), 使得 γ(t0)∈f−1(0) (等价于说 f(γ(t0))=0) . 实际上, f(γ(t)) 为连续函数, 按照 p± 的选取方式, 我们有f(γ(0))=f(p−)<0, f(γ(1))=f(p+)>0,所以连续函数的介值定理就给出了 t0.
我们现在证明关于 Möbius 带的命题:
证明. 我们给出证明的梗概, 证明的细节留给同学们在作业中完成. 如若不然, 假设
f 是
M 的定义方程. 任选
p=(cosθ,sinθ,0)∈M, 直观上 (实际上也是) 这个附近的小邻域
U 被
f 的图像分成了两个部分: 在一部分中,
f>0; 在另一部分中,
f<0. 我们选取在
p 点处和整个曲面垂直的法向量
ν(θ)=cos2θe2(θ)−sin2θe1(θ)我们考虑曲线
β:[0,2π]→R3, (cosθ,sinθ,0)+εν(θ).我们可以适当的选取比较小的
ε (可正可负) , 使得
f(β(0))>0. 然而,
γ(2π)=γ(0), 曲线所对应的
ε 却变换了符号, 从而,
f(β(2π))<0. 很明显, 这条曲线与曲面
M 不相交, 矛盾.