9.4. 两个总体下的假设检验

本节将讨论一些两个总体下的假设检验问题. 我们用 表示第一个总体的样本容量为 的样本, 用 表示第二个总体的样本容量为 的样本, 且 相互独立. 此外, 用如下符号来表示两组样本 各自的样本均值和样本方差. 符号 则代表获取到样本值 以后算得的各自的样本均值与样本方差值.

两个正态总体期望之差的假设检验

设两个总体分别服从正态分布 . 我们根据两个总体方差信息的知晓程度, 讨论几种容易求解的情况.

两总体方差均已知的情况. 设两个总体的方差 均已知. 考虑如下假设检验问题: 其中 为一给定实数. 由于两个总体的方差均已知, 故可以考虑用如下双侧检验统量进行假设检验: (9.4.1)不难看出, 检验统计量 在原假设 下服从标准正态分布 . 故在获得样本观测值 后, 相应的 值为若事先给定了显著性水平 , 则拒绝域由给出.

若备择假设被替换为 , 则可以将 (9.4.1) 作为单侧检验统计量进行假设检验, 相关的推导留给读者自己完成. 表 1 总结了方差已知时, 两个正态总体期望之差的假设检验方法.

原假设 备择假设 检验统计量拒绝域
表 1. 方差 已知时, 两个正态总体期望之差 的假设检验方法

两总体方差未知, 但已知它们相等的情况. 设两个总体的方差 均未知, 但已知二者相等 (即 ). 考虑如下假设检验问题: 其中 为一给定实数. 需注意的是, 上述问题中 均为复合假设.

我们参考相同情形下对 进行区间估计时枢轴量的设计方法 (见第 8.3 节第 1 小节第二部分内容), 取(9.4.2)为检验统计量, 其中为合并方差. 依照第 8.3 节第 1 小节第二部分的推导, 可知在原假设 服从自由度为 分布. 由此可得, 在获得样本观测值 后, 相应的 值为其中 为将样本值代入统计量 后的取值, 为分布 的分布函数. 若事先给定了显著性水平 , 则拒绝域由给出.

若备择假设被替换为 , 则可以将 (9.4.2) 作为单侧检验统计量进行假设检验, 相关的推导留给读者自己完成. 表 2 总结了方差已知时, 两个正态总体期望之差的假设检验方法.

检验统计量拒绝域
表 2. 方差 未知但相等时, 两个正态总体期望之差 的假设检验方法

() 两总体方差未知, 且不能事先认为它们相等的情况. 这种情况下, 如下形式的假设检验问题(以及对 进行区间估计的问题) 被称为 Behrens–Fisher 问题, 它曾是应用统计领域的一个著名问题. 对于 Behrens–Fisher 问题, 理想情况下, 我们希望找到一个检验统计量 , 使其满足如下条件:

1.

在原假设 下的概率分布是确切已知的 (尤其是与方差 无关的);

2.

可以表示为其中 是一个性态良好的函数.

3.

为一组样本值. 对任意实数 , 将样本值做变换后不会改变 值.

4.

为两组样本值, 且有 则前一组样本的 值小于后一组样本的 值;

上述四条性质都是比较自然的. 然而, Linnik 等人的工作 [23] 基本上否定了具备上述性质的检验统计量的存在性, 这也就是为什么 Behrens–Fisher 问题曾长期是应用统计领域的难题. 这里我们提及两种较易实现的针对 Behrens–Fisher 问题的检验法; 为简单起见设 .

Bartlett–Scheffé 检验: 此类检验法可看成是由配对检验法衍生出来的. 具体而言, 对于两个样本容量相等 (也就是 ) 的情形, 考虑将 配成一对 , 则由于 , , 且 相互独立, 可知 服从正态分布 . 接下来取检验统计量为其中则在原假设 服从自由度为 分布, 此后依照通常的 检验步骤计算 值/拒绝域即可. 上述方法还可推广到 的情形; 见 Scheffé 的原始论文 [24] 以及教材 [25] 第 9.9 节. Bartlett–Scheffé 检验法的优点在于检验统计量在原假设下的分布是确切已知而与 无关的, 而缺点则是检验结果会与配对的次序相关, 且与接下来介绍的 检验法相比, 在显著性水平与样本容量保持一致时, 它通常更不容易在备择假设成立时拒绝原假设, 从而第 II 类错误的概率更高.

检验: 该类检验法基于如下统计量: 直观上看, 相当于将 (9.4.1) 中的方差替换为样本方差, 故应当是一个合理的检验统计量, 且不难看出原假设 的分布关于原点对称, 故可以考虑用 做单侧检验. 然而, 在原假设 下并不服从一个确切已知的分布, 其分布与方差之比 有关; 更具体地说, 给定 , 原假设下的概率 的函数, 我们将这个函数暂记为 . 我国概率统计学科的奠基人、著名数学家许宝𫘧先生在他攻读博士期间完成的论文 [26] 中对 的性质进行了详细的研究, 其中的结论指出基于此, 我们可以令 值为而显著性水平 下的拒绝域则由给出, 该拒绝域给出的实际显著性水平可以保证小于等于 . 不过在 相差不大的情况下, 上述 值与拒绝域会稍显保守. Welch [27] 则提出了如下近似: 其中 1相应的拒绝域则由 给出, 但应当指出, 该拒绝域给出的实际显著性水平并不能严格保证小于等于 .

关于 Behrens–Fisher 问题的讨论还可参考 [25] 第 9.9 节、[16] 例 5.6 与第 5.2 (iv) 节, 以及论文 [28].

两个正态总体方差的假设检验

设两个总体各自服从正态分布 , 其中期望 与方差 均未知. 考虑如下假设检验问题: 注意 均为复合假设. 对于该假设检验问题, 可令(9.4.3)为双侧检验统计量. 在原假设 下, 服从自由度为 分布. 故在获得样本观测值 后, 相应的 值为其中 表示分布 的分布函数. 而若事先给定显著性水平 , 则由临界值计算式 (9.2.4) 可得故拒绝域由给出.

若备择假设被替换为 , 则可以将 (9.4.3) 作为单侧检验统计量进行假设检验, 相关的推导留给读者自己完成. 表 3 总结了期望未知时, 对两个正态总体的方差进行假设检验的方法.

检验统计量拒绝域
表 3. 期望未知时, 两个正态总体方差之比 的假设检验方法

大样本情形下比例之差的假设检验

设两个样本分别服从参数为 的伯努利分布, 考虑如下原假设与备择假设给出的假设检验问题: 我们只考虑样本容量 均足够大的情形. 由中心极限定理可得, 随机变量(9.4.4)在原假设 下近似服从标准正态分布 , 然而 依赖于未知的参数 , 不能直接作为检验统计量, 故类似于第 8.3 节最后一小节中针对比例之差设计枢轴量的方法, 我们考虑在大样本情形下将 替换为它们的点估计量. 不过, 注意到原假设 取相同的值, 因而可以用将两个样本合并起来对原假设下的 进行估计; 有时会将 称为合并比例 2. 当 足够大时, 可以作为原假设下 的一个很好的近似. 故我们最终取为双侧检验估计量, 它在原假设 下近似服从标准正态分布 . 由此可得 值为其中而若事先设定了显著性水平 , 则拒绝域由给出.

对于备择假设为 的单侧检验问题, 仍可利用上述方法导出相应的 值与拒绝域, 我们将具体的推导留给读者完成.

脚注

1.

^ 该式给出的 一般不为整数, 但仍可代入 分布概率密度函数的定义式中并算出相应的分布函数值.

2.

^ 若原假设换为 , 其中 为非零值, 则不能再用合并比例来构造检验统计量.