9.3. 单个总体下的假设检验

正态总体期望的假设检验

方差 已知的情形. 设总体服从正态分布 , 其中方差 已知, 我们考虑对未知的期望 的取值进行假设检验. 相关的结果实际上已经由例 9.1.1 与例 9.1.2 算出来了, 表 1 对其进行了汇总; 图 1 给出了显著性水平为 时拒绝域的图示.

原假设 备择假设 检验统计量拒绝域
表 1. 方差 已知时, 正态总体期望 的假设检验方法
Testing normal mean z.png
图 1. 方差 已知时, 正态总体期望 的假设检验拒绝域图示, 其中显著性水平为 .

方差 未知的情形. 设总体服从正态分布 , 其中期望 与方差 均未知. 我们首先考虑如下假设检验问题: 其中 为一给定的实数. 不难看出此时的原假设为复合假设, 而 实际上可以看成一个多余参数 (nuisance parameter). 对于该问题, 我们考虑用(9.3.1)作为单侧检验统计量. 该检验统计量的一个重要特点在于它满足条件 9.2.3: 无论多余参数 的实际取值如何, 在原假设 的分布总是不变的, 而且很容看出这个不变的分布就是 , 这意味着我们在计算 值与临界值时可以直接套用原假设为简单假设时的公式. 由于备择假设中期望相对于原假设的偏离是正向的, 因此 的取值越大则意味着相对于 越显著的偏离. 当显著性水平为 时, 由临界值的计算式 可求得 , 故拒绝域由给出, 其中 为样本观测值 的样本方差. 值则由给出, 其中 表示 的分布函数.

类似地, 若我们希望对期望 进行双侧检验: 则可以将 (9.3.1) 给出的 作为双侧检验统计量. 当显著性水平为 时, 由临界值计算式 可得故拒绝域由给出. 值表达式由给出.

上述利用 分布检验统计量进行假设检验的方法被称为 检验法. 表 2 对相关的假设检验方法进行了汇总.

原假设 备择假设 检验统计量拒绝域
表 2. 方差 未知时, 正态总体期望 的假设检验方法

配对样本的 检验

配对样本的 检验可以看成是单个正态总体期望的 检验的特殊情形: 设总体不再是一个随机变量而是一个二维随机向量 , 而从该总体中抽样得到的样本是一组配对的随机变量 , 且满足如下条件:

1.

服从正态分布 , 其中 均未知.

2.

每个 均与 同分布.

3.

随机向量 之间相互独立. 换句话说, 任取 个二元实值函数 , 随机变量 均相互独立.

注意上述条件中不要求 相互独立. 上述配对形式的总体与样本的一个典型的应用场景如下: 为了比较两种方法之间的差异, 我们采取对比实验, 随机选取 个对象并在这 个对象上分别应用这两种方法, 随后观测两种方法在每个对象上各自给出的效果, 得到成对的样本数据; 此时 的期望 即可看成是对两种方法效果差别的定量描述.

考虑如下假设检验问题: 其中 为某个给定的实数 1. 由于 均服从正态分布 , 其中方差 未知, 故可以直接将针对单个正态总体期望的 检验法套用过来: 令以及则双侧检验统计量应取为 在原假设 下服从自由度为 分布, 此后依照上一节给出的 检验步骤进行假设检验即可. 对于备择假设为 的单侧检验也可按类似方法处理.

正态总体方差的假设检验

设总体服从正态分布 , 其中期望 与方差 均未知. 我们先考虑如下假设检验问题: 其中 为一给定的常数. 注意上式中指明 时, 为了符号上的简单未将未知期望的取值范围 明确写出来, 实际上均为复合假设. 对于该假设检验问题, 可以考虑用(9.3.2)作为双侧检验统计量. 虽然原假设是复合假设, 但该检验统计量在原假设下总是服从卡方分布 而与未知期望 的取值无关, 故条件 9.2.3 成立, 我们可以套用原假设为简单假设时的公式来计算 值与临界值. 当显著性水平为 时, 由临界值计算式可解得相应的拒绝域由给出. 而 值为其中 表示卡方分布 的分布函数.

类似地, 若备择假设为 , 则仍可将 (9.3.2) 作为检验统计量, 只不过此时 相对于 的偏离是单向的, 故应将 作为单侧检验量来计算 值或拒绝域. 相应的结果总结于表 3 中; 图 2 给出了拒绝域的图示.

检验统计量拒绝域
表 3. 期望 未知时, 正态总体方差 的假设检验方法
Testing normal var chi2.png
图 2. 期望 未知时, 正态总体方差 的假设检验拒绝域图示, 其中横坐标为 , 显著性水平取为 .

比例的假设检验

设总体 服从参数为 的伯努利分布, 其中 未知; 我们通常将参数 解释为某种比例 (可参考第 8.2 节最后一小节的说法). 考虑如下假设检验问题:

当样本容量 较小时, 我们可以考虑用 值法: 以 作为双侧检验统计量, 则在原假设 下, 服从参数为 的二项分布, 从而对于样本观测值 , 其 值为其中我们记若需要在 之间二选一, 则可比较 值与事先设定的显著性水平 , 当 值小于 时拒绝原假设, 否则接受原假设.

注 9.3.1. () 利用分部积分, 可证明 时, 时, 可得其中为不完全 Beta 函数 (incomplete beta function). 由此可将 值表达式改写为从而 给出的拒绝域可等价表示为我们可以进一步利用 Beta 分布的上分位数或 分布的上分位数来表示拒绝域, 感兴趣的读者可参阅 [21] 第 3.8.3 节以及 [22] 第 27.2 节.

当样本容量 足够大时, 利用中心极限定理可得其中第一步为连续性修正. 同理, 而当给定显著性水平为 时, 相应的拒绝域可近似由给出.

对于备择假设为 的单侧检验问题, 仍可利用上述方法导出相应的 值与拒绝域, 我们将具体的推导留给读者完成.

脚注

1.

^ 若取 , 则原假设即意味着被测试的两种方法的平均效果没有差别.