31. 映射的微分

给定函数 , 我们上次课定义它的微分 . 当 给定的时候, 这是一个 上的线性函数. 仿照一维的理论, 对一阶导数求导就应该得到二阶导数. 然而, 此时为了定义 的二阶导数, 我们就需要对 求微分. 此时, (不严格地讲) 映射 是一个从 的映射, 这是向量值的函数. 所以, 我们自然地想到对向量值的函数 定义微分. 当然, 我们还可以考虑 的每个分量 (依赖于坐标系的选取) 然后要求每个分量都可微, 至少从形式上看, 后一种做法失于简洁和美观.

定义 31.1 (微分). 假设 中的区域, 中的区域, 给定映射 . 如果存在线性映射使得对于 中的 时, 我们有我们就称 处可微并且称线性映射 微分. 如果 的每个点处都可微, 我们就称 上面的可微映射.

注记.

1.

在上述微分的定义中, 我们完全没有用到 上的坐标系. 实际上, 在下面的极限中我们只用到了 上的线性结构和它们上面的范数 (我们分别用了蓝色和红色表示, 其中红色的是定义域 上的范数, 蓝色的是值域 上的范数) .

据此, 我们可以将上述定义进行推广: 给定赋范线性空间 , 是非空的开集, 是映射. 如果存在线性映射使得对于 中的 时, 我们有我们就称 处可微并且称线性映射 微分.

2.

假设 上可微. 那么, 给定 , (可以视作是 的矩阵, 这里我们用坐标比较方便) 也在一个向量空间中取值的. (然而, 如果在一般的 (无限维的) 的赋范线性空间上定义微分, 我们会要求 是所谓的连续线性映射, 这里不展开讨论, 有兴趣的同学可以在泛函分析的课程上学习) . 所以, 当 变化的时候, 我们就得到一个映射我们可以对它求导数来定义它的微分. 高阶的微分不是这门课程的重点.

3.

假设 处可微分, 我们就有映射由于这些映射依赖于点, 特别地, 依赖于 (和 ) , 我们用 代表它的定义域的线性空间 , 用 代表它的值域的线性空间 , 这样子, 我们形式上就有符号 代表的是 处的切空间 (=切平面) , 代表的是 处的切空间, 我们会有专门的例子来理解这个对象, 目前大家可以暂时将它们理解为好的记号.

我们上次课定义了方向导数和偏导数, 这都是一维的对象. 下面的命题表明, 我们可以用偏导数这些一维的对象来描述 这个高维的对象:

命题 31.2 (微分的计算). 假设 , 我们在 上用坐标系 , 在 上用坐标系 (把空间写成 是强调这些空间可以不用具体的坐标来描述) . 考虑 (我们也可以考虑 定义在 中某个区域上) , 用坐标来写, 我们有: 有时候还写成那么, 我们有

1.

假设 处可微, 那么每个分量函数 处都可微, 其中 .

2.

如果每个分量函数 处都可微 (其中 ) , 那么 处可微.

特别地, 如果 处可微, 那么映射 可以用 的矩阵来表示 (我们将这个矩阵称作是 处的 Jacobi 矩阵, 并记作 或者 , 它只是微分在一个特殊的坐标系下的表达) .

证明. 我们首先证明, 可微等价于每个分量 () 都可微. 假设 处可微, 此时 有定义并且是线性映射. 由于我们在 上选定了基 , 在 上选定了基 , 我们可以把这个线性映射用矩阵 来表示.

首先, 用分量表达, 我们有

由于当 时, 上述左边为 , 所以, 限制到每个分量, 我们就有按定义, 这表明 是可微分的 (因为我们用线性映射在 附近逼近了 ) . 反过来, 假设对每个 , 我们都有那么,

所以 存在.

我们令 , 即 而其它分量 . 此时, 根据微分的定义, 上面的式子的左边是 项 () . 计算右边, 我们得到对于一个特定的指标 , 我们自然有所以, 按照定义, 这表明 的沿着 偏导数存在并且等于 , 这表明命题得证.

注记. 上述命题表明, 映射可求微分等价于其分量可求微分, 所以, 我们可以通过继续对分量求微分来引入 -次可导的概念 (就是每次求完微分之后这个微分的每个分量都能再求微分) . 所以, 我们可以定义 , 这是 次微分仍然连续的映射的空间. 根据上次课程用偏导数判定微分存在性的定理, 我们知道只要 的连续 次偏导数 (可能是沿着不同方向的) 存在并且连续, 那么映射就是 的. 这是一个非常方便有效的判断方式.

我们现在研究符合映射的微分, 也就是所谓的链式法则.

命题 31.3 (链式法则). 假设 是开集, 其中 , , 是映射. 假设 在点 处可微, 在点 处可微, 那么复合映射 处可微, 并且

注记. 上述映射的复合可以用下面的交换图来表示: 那么, 它们所对应的微分 (在线性的层次上) 也可以用类似的交换图来表示: 我们之前引入的符号更好的描述了这个场景: 对于映射 , 我们将 所对应的 记作 , 将 记作是 , 那么, 我们有映射从而, 上面的交换图表可以写成

证明. 链式法则的推导与一维的情形如出一辙: 令 , 按照定义有其中 , , . 据此, 我们有所以, 由此可见, 这是一个 项, 按照微分的定义, 这就完成了证明.

作为推论, 我们可以计算反函数 (逆映射) 的微分:

推论 31.4. 给定区域 和可微映射 . 假设 是双射并且其逆映射 是可微的, 那么

;

是可逆的 (等价于 的行列式是非零的) .

此时, 对于任意的 , 我们有

证明. 我们令 , , , , , 其中是单位映射, 它的微分在每个点处都是单位映射 (线性) . 根据链式法则, 我们就有根据矩阵的秩的理论, 我们知道 . 用 替换 , 我们就得到 . 这就证明了维数的部分. 上面的等式已经蕴含了逆映射的微分的计算.

例子 (指数映射的微分). 上个学期我们对于 的矩阵定义了指数映射我们现在计算它的微分 . 固定 , 我们要找到其中, 我们把 视作是 . 对于任意较小的 , 我们有现在强行展开 (注意矩阵 的乘法未必交换) . 通过将 的二次项 (以及更高次数的项) 放到一起, 我们得到二项式展开的一共不超过 项, 所以 中至多有 项. 我们上学期证明过 (无论你选取什么样的范数) , 存在常数 (依赖于范数) , 使得对任意的 的矩阵 , 我们都有上述 的一个通项形如 , 这是一个由 排出来的长度为 的字符串, 其中至少有 . 我们可以要求 , 因为最终我们会令 (除非 , 此时 , 下面的结论仍然成立) , 所以那么, 我们得到从而, 我们有那么, 我们注意到右端的项是 并且 是收敛的. 所以, 特别地, 如果 可交换, 那么 . 我们还有

有了链式法则, 我们可以讨论更换坐标系的问题. 这是个核心的话题, 我们在中学的时候就已经在使用这个概念, 比如说我们经常在极坐标和 Descartes 坐标系之间转换. 我们首先用映射的语言来描述极坐标: 令

MathAnalysis-N0201.svg

我们通常用的 可以用如下的映射来写: 由于在 上我们给定了 作为坐标, 在 上我们给定了 作为坐标, 所以我们可以用 Jacobi 矩阵来表示上述映射的微分: 这个线性映射自然是可逆的, 它的行列式是 .