30. 高维的微分学: 高维函数的微分

在人们谈论高维的 的时候, 经常会有如下感觉:

上的每个点就是一个数组 ;

两个不同场合的 是同一个 .

我们对此加以说明 (上学期我们讲过, 所谓的空间是一个集合加上一个结构) : 令 是实数的集合 (上学期我们证明了它的存在性 (唯一, 在同构的意义下) , 我们在这学期课程中假设取定这样的一个实数域) , 我们定义按照这个定义, 是按照确定的方式定义的 (所以是唯一的) . 特别地, 按照集合乘积的定义, 就是一个数组 , 其中 . 特别地, 我们在 上指定了一个特定的坐标系统 .

从函数的观点来看, 给定 上的一个点, 它的第 个坐标定义出 的一个 (坐标) 映射 (函数) :

注记. 微分学的一个核心话题是如何利用其它的坐标系统 来描述 上的光滑/可微函数. 其中, 所谓一个新的坐标系统 目前可以简单地想象为 个函数其中 . 我们要求把它们放在一起得到的映射是一个双射.

在这个学期的课程中, 如果不另加说明, 我们总假设 中的一个开集, 有时候我们把它称作是一个 (开) 区域.

上学期的课程中, 我们对定义在 上的函数定义了导数的概念 (如果存在) . 我们做简单的回忆: 假设 是定义在区间 上的实值函数, 是一个给定的点, 如果极限存在, 我们就用 表示这个极限并称它为 的导数. 我们还定义了 在点 处的微分 , 这是一个线性映射 (我们暂且不管它定义) . 这两个概念都可以对 上的函数来定义. 在给出推广之前, 我们必须要指出: 是比 更好的概念, 因为它不依赖于坐标系统的选取.

导数在高维正确的推广是方向导数:

定义 30.1 (方向导数). 给定函数 , , . 如果下面的极限存在, 我们就称函数 处沿 (方向) 导数存在, 并将它记作习惯上, 我们还把 写成 .

注记. 在这个定义中, 我们并没有使用 上的坐标系. 特别地, 如果 是一个赋范线性空间上的函数, 我们可以同样的对 定义方向导数.

如果使用坐标系, 我们就有几个特殊的向量, 比如说 (第 个位置为 ) , 我们约定用如下的符号代表这个向量此时, 我们用下面的符号表示方向导数: 习惯上, 我们称它为偏导数.

注记. 我们假设对任意的 , 处的方向导数都存在. 此时, 我们有映射 (这个 “几乎” 就是微分的定义) : 这个映射是与 上的线性结构相容的, 即这是一个线性映射:

对任意的 , 我们有特别地, .

只要按照定义验证即可.

对任意的 , 我们希望这个命题需要多一点的条件才可以证明, 仅仅用每个方向导数存在是不够的. 这个性质对我们将要证明的可微函数总是成立的.

例子. 我们有两个基本的例子

1)

假设函数 只依赖于 -坐标, 我们习惯上将它写成 , 那么, 为此, 只需要按定义计算即可:

2)

考虑 上定义的函数那么, 的两个偏导数 均为 . 另外, 如果 其中 , 那么是不存在的. 由此可见, 偏导数存在不能保证其它的方向导数存在.

注记 (方向导数的几何解释). 方向导数本质上是一维的导数, 这个从定义的写法本身就不难看出. 假设 () 是一个区间, 假设-的映射 (上学期证明过这等价于 的每个分量都是 的) . 我们将这样的映射 称作是 中的一条曲线. 对于这样的曲线, 我们称 处的切向量. 我们要强调的是每个切向量都与基准点 相关并且我们认为不同点上的切向量是不相关的.

1)

最基本的曲线是直线: 假设 , , 考虑曲线这是 中过 点以 切向量的一段直线. 我们记 , 这是直线这个几何对象. 我们应该注意区分下面的数学对象: 的像是 “直线” 这个几何对象, 但是我们用 (区间 的定义域) 来参数化这个对象.

现在给定函数 , 我们用 表示 上的限制. 那么, 就是函数 处的导数, 即

当然, 我们可以采取别的方式对 进行参数化, 比如说它的像 也是 , 但是 的在 处的切向量是 . 所以参数化的改变可能使得曲线的切向量发生改变.

2)

更一般的, 给定 -曲线我们令 , 那么这个结论的证明我们留作作业.

3)

有一类曲线的例子尤为重要, 它们可以用来刻画高维空间中的曲面. 假设函数 的所有偏导数 上都有定义. 我们考虑它的图像

MathAnalysis-N0101.svg

这是 中的一张超曲面. 给定 , 我们就给定了 上的一个点; 反之亦然, 因为我们只要取 上的点的前 个坐标就给出了 上的点. 我们可以形象地认为 坐标网通过 给出了 上的一个坐标网. 固定点 , 我们考虑 上的曲线 (直线) : 这是过 点的 这个坐标轴的参数表示. 我们可以把这条曲线提升到 上, 从而得到它们在图中对应的是两条蓝色的曲线.

按照定义, 第一条曲线在 处的切向量为 , 我们在图中用红色表示; 第二条曲线在 处的切向量为如果我们用 表示该曲面在点 处的切空间 (暂且不管如何定义) , 那么, 这些 应该恰好张成这个切空间.

这里, 我们通过曲线提升的方式, 计算了一个曲面的切空间 (利用了偏导数) . 这类作为函数的图像出现的超曲面是多元微积分中最基本的几何对象, 我们在后面的课程中会无限次见到它们.

我们现在来定义函数的微分:

定义 30.2 (函数的微分). 给定函数 . 如果存在 -线性映射 , 使得对于 时, 其中 , 我们有也就是说其中向量的长度 可以选取任意的范数 (比如勾股定理所定义的 ) , 我们就称 处可微并且称线性映射 微分. 我们通常将 写成下面的样子: 如果 的每个点处都可微, 我们就称 上的可微函数.

时, 我们上个学期已经证明了, 如果 处的导数存在, 那么 也存在并且它可以写成其中 是一个数乘以一个 维的向量.

另外, 根据定义, 如果 处可微, 那么 处连续. 这几乎是显然的:

注记. 在微分的定义中, 我们根本就没有用到 上的坐标系: 我们只用到了 的长度的概念. 所以, 可以自然地对在一个赋范线性空间 上定义的函数来定义其微分: 给定函数 , 其中 是一个 ( 或者 上的) 赋范线性空间. 如果存在 (或者 ) -线性映射 , 使得我们就称 处可微并且称 的微分, 我们还把 记作 .

命题 30.3 (微分的计算: 微分与方向导数之间的关系). 假设 处可微, 那么 的任意方向导数都存在. 特别地, 对于 (请回忆: 我们约定 代表向量 ) , 那么这也表明映射是线性映射.

证明. 任意给定 , 令 , 根据微分的定义, 我们有所以, 我们可以利用定义来计算方向导数这也表明 是线性的. 为了用偏导数具体地计算 , 根据上面的结果, 我们有命题得证.

注记. 在微积分学习中, 最有歧义的一个数学符号是所谓的 . 现在我们用微分的语言定义 . 假定在 上我们事先选好了坐标系 . 此时, 是一个函数, 传统上我们就把 写成 , 所以当给定了一个点 之后, 指代的就是线性映射 . 很明显, 通过定义线性映射这就是 在某个点 处的微分.

用传统的 Kronecker 符号来记, 我们有

我们之前证明了如果函数的微分存在, 那么方向导数也存在. 反过来并不成立, 实际上, 下面的例子表明 甚至可以不连续, 尽管其方向导数都存在:

例子. 考虑函数在 定义函数: 那么, 处的任意一个方向导数都存在: 假设 . 那么, 我们有

1)

如果 , 那么

2)

如果 , 那么

然而, 处不可微, 这因为 不连续: 可以选取点列 , 函数在这些点上取值不收敛到 .

这个例子也说明, 只考虑方向导数并不能对函数在一个点附近的行为有效地进行控制.

然而, 如果方向导数具有连续性, 情况就大不相同. 直观上, 连续性允许我们从一点的信息出发理解这点附近的情况.

命题 30.4. 给定开区域 , 是在 上定义的函数. 假设 的所有偏导数 的附近 (不妨设在 上) 存在并且 均为连续函数, 其中 , 那么 处可微.

这个命题可以非常方便地用来判断一个函数的可微性, 比如说, 考虑 上的函数它的偏导数很容易计算并且很明显是连续的. 所以, 是可微的.

证明. 假设函数 处的微分存在, 那么它可以用偏导数来表示, 即据此, 我们定义线性映射我们只要证明 是一个 项即可, 其中 . 我们将 用坐标写成按定义, 我们有

在上面我们运用 Lagrange 中值定理的时候, 假设出了第 个位置的其它变量都是固定的, 我们知道, 此时求偏导数的运算就是 1 维情形时的导数运算, 所以可以用中值定理. 换句话说, 我们在以 为端点的线段上用 Lagrange 中值定理, 其中 是在这个线段上的一个点. 当 时, 很明显 . 上面的计算表明根据连续性, .

注记. 上面证明的关键想法是把问题转化成在某条直线或者曲线上讨论 (维数 , 当然, 我们还没有定义什么是维数) , 从而可以利用一元微分学的结论, 这是处理多变量函数最基本的想法之一. 上个学期我们证明两点之间线段最短的时候就是用的这个想法, 那个场合研究的空间是所有曲线的空间, 维数甚至是无穷!

我们再看上面想法的一个应用: 这个例子对于实际应用非常的重要, 因为我们可以用来计算多元函数的最大最小值:

命题 30.5. 假设 处可微并且 上的最大值, 那么 .

证明. 任意给定方向 , 我们考虑通过 的直线段其中 足够小使得线段本身落在 中, 我们考虑 . 简单而言, 研究 上的函数 . 之前的计算表明: 很明显, 的最大值, 所以 , 这表明对任意的 , . 所以, 作为线性映射, .

另一个有趣的应用如下:

命题 30.6. 假设 是一个开的凸集 1(可以替换为连通性) , 是可微函数. 如果对任意的 , 我们都有 , 那么 是常数.

证明. 证明我们留作作业. 基本想法如下: 固定 , 对任意的 , 我们考虑 的线段并将 限制在这条线段上. 这就可以帮助我们走到 维的情况.

我们引入一些符号来结束本次的课程:

注记. 给定可微 , 对于任意的 , 都是 上的一个线性函数, 即为了强调对 的依赖性, 我们把 的定义域这个 来表示. 换句话说, 是一族线性函数, 他们的定义域随着空间点位置的改变而改变, 这不是我们通常意义上的函数. 在课程的后面, 我们会考虑 是曲面 (子流形) 的情形, 那时这些讨论会变得异常清晰.

脚注

1.

^ 是凸集指的是对任意的 , 连接它们的线段整个都落在 中.