在某些场合下, 我们可能会面临对两个总体进行比较的问题. 例如, 为了验证一种新的食品添加剂在某个剂量下是否具有毒性, 我们可能需要进行如下形式的试验: 首先将足够多的小白鼠分成实验组和对照组, 让实验组的小白鼠按照一定剂量服用该食品添加剂, 而让对照组的小白鼠服用一定剂量的安慰剂, 随后统计并比较两组小白鼠的某项生化指标. 在这个例子中, 我们就可以用两个总体 X1 与 X2 分别代表服用食品添加剂小鼠与服用安慰剂小鼠的某项生化指标, 而实验组的检测结果即可看作是总体 X1 的一组样本 X1,1,…,X1,n1, 对照组的检测结果则可看作是总体 Y 的一组样本 X2,1,…,X2,n2.
本节中, 我们将对一些两个总体下的区间估计问题进行介绍. 如无特别说明, 我们用 X1, X2 表示两个总体, 用 Xk,1,…,Xk,nk 表示总体 Xk 的一组样本 (其中 k=1,2), 且假定 X1,1,…,X1,n1,X2,1,…,X2,n2 相互独立. 此外, 用如下符号Xk=nk1i=1∑nXk,i,Sk2=nk−11i=1∑n(Xk,i−Xk),k=1,2来表示两组样本 X1,1,…,X1,n1 与 X2,1,…,X2,n2 各自的样本均值和样本方差.
两个正态总体下期望之差的估计
设总体 X1 服从正态分布 N(μ1,σ12), 而总体 X2 服从正态分布 N(μ2,σ22), 我们希望对两个总体的期望的差 μ1−μ2 进行区间估计. 我们根据两个总体方差信息的知晓程度, 讨论两种容易求解的情况.
两总体方差均已知的情况. 设两个总体的方差 σ12,σ22 均已知. 我们构造枢轴量σ12/n1+σ22/n2X1−X2−(μ1−μ2).利用例 4.3.9 所给出的两个独立的正态随机变量线性组合后概率分布的结论, 不难验证上述枢轴量服从标准正态分布 N(0,1). 由此可得Pμ1,μ2(−zα/2≤σ12/n1+σ22/n2X1−X2−(μ1−μ2)≤zα/2)=1−α.对上式进行等价变换可得Pμ1,μ2⎝⎛⎣⎡X1−X2−zα/2n1σ12+n2σ22, X1−X2+zα/2n1σ12+n2σ22⎦⎤∋μ1−μ2⎠⎞=1−α.故 μ1−μ2 的一个置信水平为 1−α 的置信区间为⎣⎡X1−X2−zα/2n1σ12+n2σ22, X1−X2+zα/2n1σ12+n2σ22⎦⎤.
两总体方差未知, 但已知它们相等的情况. 设 σ12,σ22 均未知, 但已知 σ12=σ22; 习惯上我们用 σ2 来表示这两个方差共同的值. 此时我们考虑构造一个服从 t 分布的枢轴量. 为此, 我们先利用定理 6.2.3 得到如下结论:
1. | X1−X2−(μ1−μ2), S12 以及 S22 这三个随机变量相互独立; |
2. | (nk−1)Sk2/σk2∼χ2(nk−1), 其中 k=1,2. 由于 σ12=σ22=σ2, 这进一步意味着σ2(n1−1)S12+(n2−1)S22服从自由度为 n1+n2−2 的 χ2 分布. |
而由于 X1−X2−(μ1−μ2)∼N(0,σ2(1/n1+1/n2)), 接下来我们利用定理 6.2.4, 即可看出[(n1−1)S12+(n2−1)S22]/(σ2(n1+n2−2))[X1−X2−(μ1−μ2)]/σ2(1/n1+1/n2)=Sp2(1/n1+1/n2)X1−X2−(μ1−μ2)(8.3.1)服从自由度为 n1+n2−2 的 t 分布, 其中我们记Sp2=n1+n2−2(n1−1)S12+(n2−1)S22;统计量 Sp2 通常被称为合并方差 (pooled variance). 故式 (8.3.1) 给出了一个枢轴量. 利用 t 分布的上分位数, 可得P⎝⎛−tα/2(n1+n2−2)≤Sp2(1/n1+1/n2)X1−X2−(μ1−μ2)≤tα/2(n1+n2−2)⎠⎞=1−α.由此可算得 μ1−μ2 的一个置信水平为 1−α 的置信区间为[X1−X2−tα/2(n1+n2−2)Sp2(n11+n21), X1−X2+tα/2(n1+n2−2)Sp2(n11+n21)].
两个正态总体下方差之比的估计
设总体 X1 服从正态分布 N(μ1,σ12), 而总体 X2 服从正态分布 N(μ2,σ22), 其中 μ1,μ2,σ1,σ2 均为未知参数. 我们希望对两个总体的方差之比 σ12/σ22 进行区间估计.
既然是对方差之比进行区间估计, 那么一个自然的想法是利用关于样本方差之比的推论 6.2.6 来设计枢轴量. 由推论 6.2.6 可得, S22/σ22S12/σ12∼F(n1−1,n2−1).利用 F 分布的上分位数, 可得 (见图 1)P(F1−α/2(n1−1,n2−1)≤S22/σ22S12/σ12≤Fα/2(n1−1,n2−1))=1−α.对上式括号中的不等式进行等价变换, 易得 σ12/σ22 的一个置信水平为 1−α 的置信区间为[Fα/2(n1−1,n2−1)S12/S22,F1−α/2(n1−1,n2−1)S12/S22],或者根据 F 分布上分位数的性质 (6.2.1) 式, 也可表示为[S22S12F1−α/2(n2−1,n1−1),S22S12Fα/2(n2−1,n1−1)].
图 1. 两个正态总体下, 利用枢轴量 S22/σ22S12/σ12 求解方差之比的置信区间. 大样本情形下两个伯努利总体比例之差的区间估计
设 X1 服从参数为 p1 的伯努利分布, 而 X2 服从参数为 p2 的伯努利分布, 其中 p1,p2∈[0,1] 均未知. 在两个样本的容量 n1,n2 均足够大的情形下, 我们可以利用中心极限定理, 得到p1(1−p1)/n1X1−p1 与 p2(1−p2)/n2X2−p2均近似服从标准正态分布 N(0,1), 且二者互相独立. 进一步可知p1(1−p1)/n1+p2(1−p2)/n2X1−X2−(p1−p2)近似服从标准正态分布 N(0,1). 但需要注意的是, 上式给出的随机变量并非 X1,…,Xn 与 p1−p2 的函数, 故不能把它作为对 p1−p2 进行区间估计的枢轴变量. 为此, 我们考虑到在大样本情形下, 有如下近似成立: n1p1(1−p1)+n2p2(1−p2)≈n1X1(1−X1)+n2X2(1−X2),因而可以认为X1(1−X1)/n1+X2(1−X2)/n2X1−X2−(p1−p2)也近似服从标准正态分布, 且由于该随机变量是 X1,…,Xn 与 p1−p2 的函数, 故可以把它作为近似的枢轴量用于求解置信区间. 利用标准正态分布的分位数, 可得P⎝⎛−zα/2≤X1(1−X1)/n1+X2(1−X2)/n2X1−X2−(p1−p2)≤zα/2⎠⎞≈1−α.上式括号中的不等式可等价变形为Δ≤p1−p2≤Δ,其中Δ=Δ=X1−X2−zα/2n1X1(1−X1)+n2X2(1−X2),X1−X2+zα/2n1X1(1−X1)+n2X2(1−X2).由此可得, p1−p2 的置信水平为 1−α 的置信区间可近似取为 [Δ,Δ].