函数和映射的微分学
假设 f 是定义在区间 I⊂R 上的实值函数, x0∈I 是一个给定的点. 如果极限h→0limhf(x0+h)−f(x0)存在, 我们就称 f 在 x0 处可导或者可微 (可微分) 并用用 f′(x0) 记这个极限. 如果 f 在任意 x∈I 处都可微, 我们就说 f 是 I 上的可微函数. 进一步, 如果 f′(x)∈C(I), 我们就说 f 是连续可微的并且将所有 I 上连续可微的函数记作 C1(I).
当导数存在时, 我们也用下面的极限来写导数:
f′(x0)=x→x0limx−x0f(x)−f(x0). 我们注意到, 如果 f 在 x0 处可微, 那么 f 在 x0 处连续: 因为x→x0lim(f(x)−f(x0))=x→x0limx−x0f(x)−f(x0)x→x0lim(x−x0)=0.但是, 并不是连续的函数都可微分, 比如说函数 f(x)=∣x∣: 在 x0=0 处, 当 x>0 时, x→0limx−0x−0=1.当 x<0 时, 我们有x→0limx−0−x−0=−1.这说明 f′(0)=x→0limx−0f(x)−f(0) 不存在. 直观上, 连续但是不可微的东西有 “尖儿”.
根据定义, 我们可以计算如下两个函数的导数:
1) | f(x)=c, 其中 c 为常数. 那么, (c)′=0. |
2) | f(x)=x. 那么, (x)′=1. |
标准的微积分教材都有左导数和右导数的概念, 请 “望文生义” 地定义它们. 进一步证明, f 在 x0 处的导数存在当且仅当 f 在 x0 处的左右导数都存在并且相等.
假设 f 是可微函数并且其 f′ 也可微, 我们就可以继续计算 f′ 的导数 (f′)′. (如果可能的话) 我们可以重复这个过程来求 k-次导数 ((⋯((f′)′)′⋯)′)′k-个 ′. 习惯上, 人们用符号 f(k) 表示 f 的 k-次导数而两次或三次导数经常记作 f′′(x) 和 f′′′(x).
另外, 如果 f 在 I 上可微分, 也用 dxdf 来表示 f′. 这种写法的好处是我们可以用算子/映射的观点来写微分, 一如之前对函数所强调的. 比方说, 我们有如下的映射 (算子: 把函数映射为函数/数的映射) : dxd:C1(I)→C(I).
我们还用 dxkdkf 来表示 f(k), 即用算子 dxkdk 表示求了 k-次导数. 如果要强调 f(k) 在一个点 x0 处的值, 更标准的记号是 dxkdkf∣∣x=x0. 比方说, dxdf∣∣x=x0=f′(x0). 如果 f 可以在区间 I 上求 k 次导数并且得到的 f(k) 也是连续的, 我们就称 f 是 k-次连续可微的并将这样函数的全体记作 Ck(I). 记号 C∞(I) 的意思很明显: 它代表 I 上无限次连续可微函数的全体.
我们注意到 C∞(I)=∅, 比如说常数函数 1∈C∞(I).
假设 f 在 x0 处可微, 我们令 r(h)=hf(x0+h)−f(x0)−f′(x0), 其中 h 定义在某个区间 (−ε,ε) 上面. 按照导数的定义, 当 h→0 时, 有 r(h)→0. 在分析学中, 我们通常说 r(h) 是 (h→0 时的) 无穷小量, 记作 r(h)=o(1). 从而, 我们经常说 (记) hf(x0+h)−f(x0)−f′(x0)=o(1). 在形式上, 人们还用如下的写法: f(x0+h)=f(x0)+f′(x0)h+o(h),其中我们暂且认为 o(h)=o(1)h. 这都是数学分析中的黑话, 只是为了说话方便或者为了形式上便于记忆. 严格地讲, 我们有g(h)=f(x0+h)−f(x0)−f′(x0)h,其中 h→0limhg(h)=0.
导数的计算法则
我们首先要解决的问题是导数的计算法则. 由于导数是用极限来定义的, 极限的运算法则可以很容易地翻译成导数的运算法则:
假设函数 f 和 g 在 (a,b) 上有定义并且在 x0∈(a,b) 处可微, 那么
1) | f±g 在 x0 处可微并且 (f±g)′(x0)=f′(x0)±g′(x0). |
2) | f⋅g 在 x0 处可微并且 (f⋅g)′(x0)=f′(x0)g(x0)+f(x0)g′(x0). |
3) | 如果 g(x0)=0, 那么 gf 在 x0 处可微并且 (gf)′(x0)=g(x0)2f′(x0)g(x0)−f(x0)g′(x0). 特别地, 我们有 g1 在 x0 处可微并且 (g1)′(x0)=−g(x0)2g′(x0). |
证明. 我们证明相对困难的第三条, 其余的留作作业来验证. 我们有如下的等式:
h1(g(x0+h)f(x0+h)−g(x0)f(x0))=hg(x0+h)g(x0)f(x0+h)g(x0)−f(x0)g(x0+h)=g(x0+h)g(x0)hf(x0+h)−f(x0)g(x0)−f(x0)hg(x0+h)−g(x0).我们按照连续函数求极限的四则运算法则对
h→0 求极限即可.
现在再处理复合函数的导数:
I 和 J 是 R 上的区间, f:I→J 和 g:J→R 是实值函数. 如果 f 在 x0 处可微, g 在 f(x0) 处可微, 那么复合函数 g∘f 在 x0 处可微, 并且(g∘f)′(x0)=g′(f(x0))f′(x0).
证明. 按照导数的定义, 我们有f(x0+h)g(f(x0)+ℓ)=f(x0)+f′(x0)h+δ(h),=g(f(x0))+g′(f(x0))ℓ+Δ(ℓ),其中 h→0limhδ(h)=ℓ→0limℓΔ(ℓ)=0. 我们按照导数的定义计算 f∘g 的导数: hg(f(x0+h))−g(f(x0))=hg(f(x0)+f′(x0)h+δ(h)ℓ)−g(f(x0))=当 h→0 时,极限=g′(f(x0))f′(x0)hg′(f(x0))[f′(x0)h+δ(h)]+hΔ(f′(x0)h+δ(h)).我们只要证明最后一项当 h→0 时, 极限为 0 即可:
根据
ℓ→0limℓΔ(ℓ)=0, 我们定义
μ(ℓ)=ℓΔ(ℓ) (提醒一下同学们, 尽管函数
μ 在
0 点处没有定义, 这并不影响我们研究它在
0 处的极限) , 那么
μ(ℓ)=o(1), 即
ℓ→0limμ(ℓ)=0 (我们也把
Δ 写成
Δ(ℓ)=o(1)ℓ) . 应用这些记号, 我们有
hΔ(f′(x0)h+δ(h))=μ(f′(x0)h+δ(h))(f′(x0)+hδ(h))=μ(ℓ)(f′(x0)+hδ(h)).然而, 当
h→0 时,
ℓ=f′(x0)h+δ(h)→0, 所以上式的极限是
0.
例子: 一些初等函数的导数
根据上面的运算法则, 我们可以计算更多的函数的导 (函) 数. 我们需要熟练记忆如下几个例子的结论和计算技巧. 这些例子 (实质上) 是我们仅有的可以用解析表达式写下来的函数:
1) | f(x)=xn, 那么, (xn)′=nxn−1, 其中 n 为整数. 当 n⩾0 时, 根据乘积的导数的计算方法, 我们有(xn)′=(xn−1⋅x)′=(xn−1)′x+xn−1.据此, 利用归纳法立即得到结论. 当然, 我们也可以直接计算: f′(x0)=h→0limh1(k⩾0∑(kn)hkx0n−k−x0n))=h→0limk⩾1∑(kn)hk−1x0n−k=nx0n−1.当 n<0 时, 我们利用倒数的导数计算即可. |
2) | f(x)=ex (实数值的函数) , 那么 (ex)′=ex (这表明指数函数是微分算子 dxd 的一个不动点) . 这个问题明显要复杂, 因为 ex 本身就是通过极限/级数来定义的. 我们可以想象一个 “理想” 的计算: (k=0∑∞k!xk)′=k=0∑∞(k!xk)′=k=1∑∞kk!xk−1=k=1∑∞(k−1)!xk−1=ex.这个计算 (目前) 是不对的, 因为我们不能够随便交换求导数运算和 (无限) 求和运算的顺序. 在导数的研究中, 我们将要想办法让上面的计算成立从而使得大部分直观上应该成立的运算都成立, 这样子我们就可以很舒服地做很多运算. 这是后话. 我们先计算 ex 在 x=0 处的导数: x→0limxex−1=x→0limk=1∑∞k!xk−1=1+x→0limk=2∑∞k!xk−1然而, ∣∣k=2∑∞k!xk−1∣∣⩽∣x∣∣∣k=2∑∞k!xk−2∣∣⩽∣x∣∣∣k=2∑∞(k−2)!xk−2∣∣=∣x∣e∣x∣.所以, x→0limk=2∑∞k!xk−1=0. 这表明dxd∣∣x=0exp=1. 函数 ex 在 x0 处的导数现在就完全由 ex 的代数性质决定了: h→0limhex0+h−ex0=ex0h→0limheh−1=ex0.这是非常有意义的计算, 因为我们可以借此看到代数结构是如何在计算中起作用的. |
3) | f(x)=logx 的导数, log(x)′=x1. 为了计算 logx, 我们自然要研究反函数的可微性质, 因为 logx 就是被定义成反函数, 除此之外, 我们没有关于 log 的其它信息 (事实上, 关于 logx 的进一步性质也都是通过反函数得来的) . 关于复合函数求导的命题有下面的推论: I 和 J 是 R 上的区间, f:I→J 是实值函数并且它的逆 f−1:J→I 存在. 假设 f 是可微函数. 如果 f′(x0)=0, 那么 f−1 在 x0 处可微分并且(f−1)′(f(x0))=f′(x0)1. 这个推论事先假设了 f−1 存在. 从局部的观点来看, 这个条件可以去掉, 这是微分学中最重要的定理 (之一) : 反函数定理. 我们很快就会学习反函数定理. 另外, 关于复合函数的记法, 我们不推荐 f(x2) 或者 f(−x) 这样的记号 (尽管我们会经常这么写) . 这些记号都应该被理解为函数的复合. 根据命题, 我们显然有 (logx)′=x1. 我们也可以直接利用定义来计算 (logx)′:hlog(x+h)−log(x)=hlog(1+xh)=xlog((1+xh)hx)根据 y→∞lim(1+y1)y=e, 上面的式子就给出所要的结论. |
4) | f(x)=xα, 其中 x>0, 此时 (xα)′=αxα−1. 按照定义, xα=eαlogx 是如下函数的复合: R>0⟶logR⟶α⋅R⟶expR.所以, 利用链式法则逐步计算: (xα)′=(eαlogx)′=eαlogx(αlogx)′=xαα(logx)′=αxα−1. |
5) | (sinx)′=cosx, (cosx)′=−sinx. 根据之前的例子, 我们有三种方式来计算三角函数的导数: ∘ | 由于 sinx 是用级数来定义的, 仿照 ex 的导数计算的讨论, 我们希望能够逐项求导数, 这种做法现在并不严格; | ∘ | 注意到 sinx 和 cosx 是通过复数值的函数来定义的 (cosx=21(eix+e−x)) , 所以我们必须离开实数转而研究在复数 (或者向量空间) 中取值的函数的导数. 然而, 在证明函数的四则运算和复合函数时, 我们并没有用到 R 的具体性质, 所有的证明对于复数域仍然成立 (我们将会在作业中见到类似的证明) , 所以这些技术都是成立的, 从而: (cosx)′=21(eix+e−ix)′=21(ieix−ie−ix)=−2i1(eix−e−ix)=−sinx. | ∘ | 用定义直接计算. 我们仿照 ex 的情形 (利用三角函数的代数性质) 首先证明 sin′(0)=1 和 cos′(0)=0, 然后对 sin(x+h)−sinx 利用和差化积公式来证明一般 x 的情形. 我们会在作业中按照这种方式来完成证明. |
|