17. 凸函数与 Jensen 不等式

凸函数的性质和 Jensen 不等式

我们给出凸函数的五种刻画:

定理 17.1. 上的区间, 给定 上定义的实值函数 . 那么, 五个性质是等价的:

1)

对任意的 , 任意的 , 我们有从图形上来看, 任给 的图像上两个点, 这两个点之间的函数图像落在这两个点所连线段的下方.

MathAnalysis N18P1.svg

2)

对任意的 , 如果 , 那么我们可以通过函数图像形象的记忆这一串不等式:

MathAnalysis N18P2.svg

3)

对任意 , 如下定义的函数是变量 的增函数.

4)

对任意的 , 如果 , 那么

5)

集合 (即函数图像上方的部分) 是凸集

如果函数 满足上述条件之一, 我们就称 凸函数. 如果 是凸函数, 我们就称 凹函数.

注记. -线性空间, 是子集. 如果对任意的 , 任意的 , , 即 所连线段落在 中, 我们就称 凸集.

注记. 上述对凸性的刻画本质上是几何的, 叙述中并没有涉及到函数的连续性等. 有意思的是, 凸性的几何定义可以推出函数的若干分析性质, 比如连续性、可微性之类的.

证明. 我们转一圈来证明前面四个命题之间的等价性:

由于 , 所以存在 , 使得 , 其中 . 所以, 这个不等式等价于 2) 中的不等式 (直接计算) .

中左侧的不等式讲的就是这个函数是递增的.

我们注意到利用 3) 中的单调性, 这个值明显是非负的.

我们不妨设 , 我们对下面的式子展开: 这等价于整理立得.

最终, 我们来证明  : 假设 是凸集, 那么对任意的 , 我们有 , 所以, 对任意的 , 我们有按照 的定义, 我们有 .

反之, 假设 1) 成立, 任选 , 按照定义 , . 考虑这两个点所连线段上的任意一个点 , 其中 . 根据 1), 我们知道所以 .

根据等价定义中的第一条, 我们可以证明:

命题 17.2 (Jensen 不等式). 假设 是凸函数, 那么对任意的 和任意的 , 其中 , 我们有

证明. 我们对 进行归纳. 时, 这是定义; 假设对 成立, 考虑 的情形. 对任意给定的 , , 其中 , 我们有不难看出, , 此时我们用等价定义中的第一条, 就得到这就完成了证明.

注记. 我们会利用这个命题来证明很多经典的不等式.

一个凸函数可以不连续, 比如说下图所示的函数
MathAnalysis N18P3.svg
它在左端点处不连续. 然而, 这是一个凸函数可能不连续的唯一方式:

定理 17.3. 是区间, 是凸函数, 我们令 的内部 (对于 , 那么 ) , 那么

1)

.

2)

对任意的 , 处的左导数 和右导数 存在. 进一步, 它们满足

3)

对任意的 , 如果 , 那么我们有

4)

左右导数 是递增的函数.

证明. 任意选定 . 存在 , , 对三个点 用凸性的第二个等价定义, 我们得到根据凸性的第三个等价定义, 由于上述不等式的右边是 的增函数, 令 , 我们立即得到右导数的存在性; 类似地, 如果令 , 我们就得到左右导数存在性. 既然左右导数都存在, 那么, 自然在 上连续.

为了证明 3), 我们先令 , 从而, , , 我们就得到了 3) 中不等式的右边; 左边类似可得.

为了证明 4), 我们考虑 3) 中的不等式其中 , 后一个不等式是运用凸性的第三个等价定义. 再令 () 就证明了结论.

上述分析性质基本上刻画了凸函数:

定理 17.4. 假设 区间, 是函数. 如下两个性质等价:

1)

是凸函数;

2)

是连续函数, 的右导数处处存在并且是增函数.

证明. 只要说明 2)1) 即可: 我们固定 中的三个点 , 对任意的 , 我们有 . 我们定义函数那么, 对于 , 处的右导数 . 把这个和导数的性质做类比, 我们想说明 的增函数:

引理 17.5. 假设 是连续函数并且右导数在每个点处都定义. 如果对任意的 , 我们都有 , 那么 .

先假设引理是成立的, 那么我们有 , 经过整理, 我们得到类似地, 我们可以证明从而, 所以, 我们有这表明 是凸函数.

引理的证明. (证明的重要想法: 退 -步海阔天空) 任意选定 , 令此时, , 我们实质上想证明这是一个递减的函数, 如果成立的话, 那么 就得到了要证明的结论.

我们现在直接证明上述过渡的结论. 为此, 定义 1由于 是闭集, 所以它的上确界 . 我们想证明 (从而, , 令 , 过渡性结论就成立了) , 即要证明 .

因为 , 所以 . 特别地, 根据 的连续性, 存在 , 使得 . 所以 并且 .

我们用反证法证明 : 如若不然, 我们假设 . 先说明 , 这因为按照定义 , 如果等号不成立, 那么 , 根据 的连续性, 存在比 略大的数使得其值仍然不超过 , 这就与 矛盾.

其次根据右导数的信息, , 利用右导数的定义, 存在 , 使得当 时, 我们有从而, 这表明 , 这和 是上确界矛盾.

推论 17.6. 假设 是开区间, 上二次可微的实值函数. 如下两个陈述是等价的:

1)

是凸函数;

2)

.

证明. 这是上面定理的直接推论.

注记. 这个推论是最常用的来判断凸性的工具, 因为函数二阶导数通常容易计算.

推论 17.7 (函数图像的支撑直线). 是区间 上的凸函数, . 考虑 上的过 直线其中斜率 . 那么, 的图像之下当且仅当 .

MathAnalysis N18P4.svg

证明. 定理的证明过程表明, 当 时, 我们有反过来, 当 时, 我们有据此, 当 时, 在 的右边, 该直线在 的图像之下; 当 时, 在 的做边, 该直线在 的图像之下.

反之, 假设 的图像之下, 在 处的右边的时候, 我们有 , 从而类似地, 我们可以证明另一边的不等式.

用凸函数证明常见的不等式

我们给出两个例子: Minkowski 不等式和算术-几何平均值不等式.

1)

假设 , 对于 , 函数 是凸函数, 这因为是递增的函数 (求两次导数的表达式不是很简单) . 假设 并且假设 , 其中 . 我们令Jensen 不等式给出了如下所谓的 Minkowski 不等式: 作为推论, 对于线性空间 , 我们定义其中, . 此时, Minkowski 不等式讲的是这表明 是范数 ( 或者 我们更熟悉) . 另外, 我们还可以采取如下的范数:

2)

函数 上的凸函数, 这因为假设 是正数, 根据 Jensen 不等式, 我们有这个等价于算术-几何平均值不等式: