本节中, 我们将定义形如x∈X∑f(x)(A.1.1)的求和式应如何取值. 这里 X 为一可数集, f:X→R 为实值函数 1. 该求和式取值的严格定义如下:
• | 当 X 为空集时, 定义 ∑x∈Xf(x)=0; 当 X 为有限集时, ∑x∈Xf(x) 定义为所有 f(x),x∈X 的和. 这两种情况下, 我们总是称 ∑x∈Xf(x) 是收敛的. |
• | 当 X 为可数无限集时, 则任取一序列 x1,x2,x3,… 使其不重复地枚举 X 的所有元素, 当级数 ∑j=1∞∣f(xj)∣ 收敛时, 我们称 ∑x∈Xf(x) 收敛, 并定义x∈X∑f(x)=j=1∑∞f(xj),否则称 ∑x∈Xf(x) 发散. 由于求和式 ∑x∈Xf(x) 收敛要求 ∑j=1∞f(xj) 绝对收敛, 因此 ∑x∈Xf(x) 的值与序列 (xj)j=1∞ 的具体取法无关, 也就是说以上定义是无歧义的. |
根据以上定义可知, ∑x∈Xf(x) 收敛当且仅当 ∑x∈X∣f(x)∣ 收敛.
由上述定义及级数收敛的相关知识, 不难得到求和式的如下性质:
设 X 为一至多可数集, f,g 为两个定义在 X 上的实值函数.
1. | 若 ∑x∈Xf(x) 与 ∑x∈Xg(x) 均收敛, 则对任意 α,β∈R, ∑x∈X(αf(x)+βg(x)) 也收敛, 且x∈X∑(αf(x)+βg(x))=αx∈X∑f(x)+βx∈X∑g(x). |
2. | 若 0≤f(x)≤g(x),∀x∈X, 且 ∑x∈Xg(x) 收敛, 则 ∑x∈Xf(x) 也收敛, 且x∈X∑f(x)≤x∈X∑g(x). |
在涉及到离散随机变量的理论推导当中, 我们经常需要对多重求和式交换求和次序. 利用以下定理, 我们可以验证求和次序是否可交换.
设 X 为至多可数集, 函数 f:X→[0,+∞[ 取值非负, I 为一至多可数集, 每个 i∈I 对应于一个集合 Xi⊆X, 且满足i∈I⋃Xi=X以及Xi∩Xj=∅,∀i=j,则 ∑x∈Xf(x) 收敛当且仅当
1. | 对于每个 i∈I, ∑x∈Xif(x) 均收敛, 且 |
2. | ∑i∈Is(i) 收敛, 其中s(i)=x∈Xi∑f(x). |
此外, 当 ∑x∈Xf(x) 收敛时有x∈X∑f(x)=i∈I∑s(i)=i∈I∑(x∈Xi∑f(x)).
定理
A.1.2 的证明较长且涉及到不少数学分析的知识点, 我们将它放在本节最后一小节中作为选读内容. 下面我们给出该定理的一个直接推论:
设 X,Y 为两个可数无限集, f:X×Y→R 为一实值函数. 若如下求和式中的任意一个收敛: x∈X∑(y∈Y∑∣f(x,y)∣),y∈Y∑(x∈X∑∣f(x,y)∣),则x∈X∑(y∈Y∑f(x,y))与y∈Y∑(x∈X∑f(x,y))均收敛, 且二者的取值相同.
证明. (
⋆) 令
Ux={x}×Y,∀x∈X以及Vy=X×{y},∀y∈Y,则不难看出
x∈X⋃Ux=y∈Y⋃Vy=X×Y以及
Ux1∩Ux2Vy1∩Vy2=∅,∀x1=x2,=∅,∀y1=y2.令
f+(x,y)=max{f(x,y),0},f−(x,y)=max{−f(x,y),0},则有
0≤f+(x,y)≤∣f(x,y)∣ 以及
0≤f−(x,y)≤∣f(x,y)∣. 故由待证推论中所设的条件、命题
A.1.1 第 2 部分以及定理
A.1.2 可得, 以下三个求和式均收敛且具有相同的取值:
(x,y)∈X×Y∑f+(x,y),x∈X∑(y∈Y∑f+(x,y)),y∈Y∑(x∈X∑f+(x,y)).同理, 以下三个求和式均收敛且具有相同的取值:
(x,y)∈X×Y∑f−(x,y),x∈X∑(y∈Y∑f−(x,y)),y∈Y∑(x∈X∑f−(x,y)).最后, 由
f(x,y)=f+(x,y)−f−(x,y), 以及命题
A.1.1 第 1 部分可得
x∈X∑(y∈Y∑f(x,y))与y∈Y∑(x∈X∑f(x,y))均收敛, 且二者的取值相同.
推论 A.1.3 又被称为无限和的 Fubini 定理.
(⋆) 需要注意的是, ∑x∈X(∑y∈Y∣f(x,y)∣) 收敛仅仅是 ∑x∈X(∑y∈Yf(x,y)) 收敛的一个充分条件而非必要条件. 由定义, ∑x∈X(∑y∈Yf(x,y)) 收敛的充要条件是
1. | 每个 ∑y∈Y∣f(x,y)∣ 均收敛, 且 |
2. | ∑x∈X∣∣∑y∈Yf(x,y)∣∣ 收敛. |
作为一个例子, 我们考虑 X=Y=N, f(x,y)=⎩⎨⎧1,−1,0,若 y=x,若 y=x+1,其它情况.则 ∑x∈X(∑y∈Y∣f(x,y)∣) 发散, 但对每个 x∈X, 均有y∈Y∑∣f(x,y)∣=∣1∣+∣−1∣=2,以及x∈X∑∣∣y∈Y∑f(x,y)∣∣=x∈X∑∣1+(−1)∣=0.因此 ∑x∈X(∑y∈Yf(x,y)) 收敛. 注意到该例中的多重求和式不能交换求和次序.
关于求和式 ∑x∈Xf(x) 更详细的内容, 读者可参考 [31] 第 8.2 节.
(⋆) 定理 A.1.2 的证明
我们先证明如下引理:
设 X 非空, f(x)≥0,∀x∈X, 则 ∑x∈Xf(x) 收敛时x∈X∑f(x)=sup{j=1∑nf(xj)∣∣x1,…,xn∈X 且互不相同,n∈N+},且 ∑x∈Xf(x) 发散当且仅当上式右端为 +∞.
证明. 待证结论在 X 为有限集时显然成立, 故接下来我们假设 X 为可数无限集. 令序列 xˉ1,xˉ2,… 为任一不重复地枚举 X 的所有元素的序列, 并记s=sup{j=1∑nf(xj)∣∣x1,…,xn∈X 且互不相同,n∈N+}∈[0,+∞].
先考虑 s=+∞ 的情形. 由 s 的定义可知, 对任意正整数 k, 均存在正整数 ℓk 以及互不相同的正整数 j(k,1),…,j(k,ℓk) 使得f(xˉj(k,1))+⋯+f(xˉj(k,ℓk))>k.现令 m(k)=max{j(k,1),…,j(k,ℓk)}, k∈N+, 则给定任一正整数 k 时, 只要取 n≥m(k) 就有j=1∑nf(xˉj)≥j=1∑m(k)f(xˉj)≥f(xˉj(k,1))+⋯+f(xˉj(k,ℓk))>k.故 ∑j=1∞f(xˉj) 发散, 从而 ∑x∈Xf(x) 发散.
再考虑
s 为有限实数的情形. 由
s 的定义可知, 对任意正整数
n, 有
j=1∑nf(xˉj)=f(xˉ1)+⋯+f(xˉn)≤s,故
∑j=1∞f(xˉj) 收敛且
∑j=1∞f(xˉj)≤s. 现取任一
ϵ>0, 则由
s 的定义, 存在自然数
nϵ 以及互不相同的正整数
j(1),…,j(nϵ) 使得
f(xˉj(1))+⋯+f(xˉj(nϵ))>s−ϵ.从而
j=1∑∞f(xˉj)≥f(xˉj(1))+⋯+f(xˉj(nϵ))>s−ϵ.由
ϵ>0 的任意性可得
∑j=1∞f(xˉj)≥s. 综上, 可得
∑x∈Xf(x) 收敛且等于
s.
现在我们开始证明定理 A.1.2. 为方便起见, 我们将指标集 X 与每个 Xi 均扩充为可数无限集, 并在扩充出来的指标 x 上定义 f(x)=0. 不难看出这样的扩充不影响求和式的敛散性以及取值.
首先假设存在某个 ι∈I 使得 ∑x∈Xιf(x) 发散. 由引理 A.1.5 可得≥=sup{j=1∑nf(xj)∣∣x1,…,xn∈X 且互不相同,n∈N+}sup{j=1∑nf(xj)∣∣x1,…,xn∈Xι 且互不相同,n∈N+}+∞,从而 ∑x∈Xf(x) 发散.
接下来设每个 ∑x∈Xif(x) 均收敛但 ∑i∈Is(i) 发散. 取 M 为任意正实数, 则存在正整数 m1 以及 ι1,…ιm1∈I 使得k=1∑m1s(ιk)>M.再取 ϵ=M/(2m1), 由于每个 ∑x∈Xif(x) 均收敛, 根据引理 A.1.5, 存在正整数 m2 及如下各元素互不相同的矩阵: ⎣⎡x~(ι1,1)x~(ι2,1)⋮x~(ιm1,1)x~(ι1,2)x~(ι2,2)⋮x~(ιm1,2)⋯⋯⋱⋯x~(ι1,m2)x~(ι2,m2)⋮x~(ιm1,m2)⎦⎤∈Xm1×m2,使得ℓ=1∑m2f(x~(ιk,ℓ))>s(ιk)−ϵ,∀k=1,…,m1,从而有≥>sup{j=1∑nf(xj)∣∣x1,…,xn∈X 且互不相同,n∈N+}k=1∑m1ℓ=1∑m2f(x~(ιk,ℓ))>k=1∑m1(s(ιk)−ϵ)=k=1∑m1s(ιk)−2M2M.由 M>0 的任意性可得上式左端为 +∞, 再由引理 A.1.5 可知 ∑x∈Xf(x) 发散.
最后考虑每个 ∑x∈Xif(x) 以及 ∑i∈Is(i) 均收敛的情况. 一方面, 对任意互不相同的 x1,…,xn∈X, 存在互不相同的 ι1,…,ικ∈I, 使得对任意 k=1,…,κ, 集合 Zk=Xιk∩{x1,…,xn} 为非空有限集, 且 ⋃k=1κZk={x1,…,xn}, 从而j=1∑nf(xj)=k=1∑κx∈Zk∑f(x)≤k=1∑κs(ιk)≤sup{k=1∑ns(ik)∣∣i1,…,ik∈I 且互不相同, k∈N+}=i∈I∑s(i).由于 x1,…,xn∈X 任意, 可得sup{j=1∑nf(xj)∣∣x1,…,xn∈X 且互不相同,n∈N+}≤i∈I∑s(i),故 ∑x∈Xf(x) 收敛且小于等于 ∑i∈Is(i). 另一方面, 记 s=∑i∈Is(i), 并任取 ϵ>0, 则存在正整数 m1 以及互不相同的 ι1,…,ιm1 使得k=1∑m1s(ιk)>s−2ϵ而由于每个 ∑x∈Xif(x) 均收敛, 可知存在正整数 m2 及各个元素互不相同的矩阵⎣⎡x~(ι1,1)x~(ι2,1)⋮x~(ιm1,1)x~(ι1,2)x~(ι2,2)⋮x~(ιm1,2)⋯⋯⋱⋯x~(ι1,m2)x~(ι2,m2)⋮x~(ιm1,m2)⎦⎤∈Xm1×m2,使得ℓ=1∑m2f(x~(ιk,ℓ))>s(ιk)−2m1ϵ,∀k=1,…,m1.从而≥>sup{j=1∑nf(xj)∣∣x1,…,xn∈X 且互不相同,n∈N+}k=1∑m1ℓ=1∑m2f(x~(ιk,ℓ))>k=1∑m1(s(ιk)−2m1ϵ)=k=1∑m1s(ιk)−2ϵs−ϵ.由 ϵ>0 的任意性可得上式左端等于 s. 综合以上结果, 最终可得x∈X∑f(x)=s=i∈I∑s(i).
脚注