8.3. 两个总体下的区间估计

在某些场合下, 我们可能会面临对两个总体进行比较的问题. 例如, 为了验证一种新的食品添加剂在某个剂量下是否具有毒性, 我们可能需要进行如下形式的试验: 首先将足够多的小白鼠分成实验组和对照组, 让实验组的小白鼠按照一定剂量服用该食品添加剂, 而让对照组的小白鼠服用一定剂量的安慰剂, 随后统计并比较两组小白鼠的某项生化指标. 在这个例子中, 我们就可以用两个总体 分别代表服用食品添加剂小鼠与服用安慰剂小鼠的某项生化指标, 而实验组的检测结果即可看作是总体 的一组样本 , 对照组的检测结果则可看作是总体 的一组样本 .

本节中, 我们将对一些两个总体下的区间估计问题进行介绍. 如无特别说明, 我们用 , 表示两个总体, 用 表示总体 的一组样本 (其中 ), 且假定 相互独立. 此外, 用如下符号来表示两组样本 各自的样本均值和样本方差.

两个正态总体下期望之差的估计

设总体 服从正态分布 , 而总体 服从正态分布 , 我们希望对两个总体的期望的差 进行区间估计. 我们根据两个总体方差信息的知晓程度, 讨论两种容易求解的情况.

两总体方差均已知的情况. 设两个总体的方差 均已知. 我们构造枢轴量利用例 4.3.9 所给出的两个独立的正态随机变量线性组合后概率分布的结论, 不难验证上述枢轴量服从标准正态分布 . 由此可得对上式进行等价变换可得 的一个置信水平为 的置信区间为

两总体方差未知, 但已知它们相等的情况. 均未知, 但已知 ; 习惯上我们用 来表示这两个方差共同的值. 此时我们考虑构造一个服从 分布的枢轴量. 为此, 我们先利用定理 6.2.3 得到如下结论:

1.

, 以及 这三个随机变量相互独立;

2.

, 其中 . 由于 , 这进一步意味着服从自由度为 分布.

而由于 , 接下来我们利用定理 6.2.4, 即可看出(8.3.1)服从自由度为 分布, 其中我们记统计量 通常被称为合并方差 (pooled variance). 故式 (8.3.1) 给出了一个枢轴量. 利用 分布的上分位数, 可得由此可算得 的一个置信水平为 的置信区间为

两个正态总体下方差之比的估计

设总体 服从正态分布 , 而总体 服从正态分布 , 其中 均为未知参数. 我们希望对两个总体的方差之比 进行区间估计.

既然是对方差之比进行区间估计, 那么一个自然的想法是利用关于样本方差之比的推论 6.2.6 来设计枢轴量. 由推论 6.2.6 可得, 利用 分布的上分位数, 可得 (见图 1)对上式括号中的不等式进行等价变换, 易得 的一个置信水平为 的置信区间为或者根据 分布上分位数的性质 (6.2.1) 式, 也可表示为

Confidence interval normal var ratio F.png
图 1. 两个正态总体下, 利用枢轴量 求解方差之比的置信区间.

大样本情形下两个伯努利总体比例之差的区间估计

服从参数为 的伯努利分布, 而 服从参数为 的伯努利分布, 其中 均未知. 在两个样本的容量 均足够大的情形下, 我们可以利用中心极限定理, 得到均近似服从标准正态分布 , 且二者互相独立. 进一步可知近似服从标准正态分布 . 但需要注意的是, 上式给出的随机变量并非 的函数, 故不能把它作为对 进行区间估计的枢轴变量. 为此, 我们考虑到在大样本情形下, 有如下近似成立: 因而可以认为也近似服从标准正态分布, 且由于该随机变量是 的函数, 故可以把它作为近似的枢轴量用于求解置信区间. 利用标准正态分布的分位数, 可得上式括号中的不等式可等价变形为其中由此可得, 的置信水平为 的置信区间可近似取为 .