正态总体期望的假设检验 方差 σ 2 已知的情形. 设总体服从正态分布 N ( μ , σ 2 ) , 其中方差 σ 2 > 0 已知, 我们考虑对未知的期望 μ 的取值进行假设检验. 相关的结果实际上已经由例 9.1.1 与例 9.1.2 算出来了, 表 1 对其进行了汇总; 图 1 给出了显著性水平为 α 时拒绝域的图示.
原假设 H 0 备择假设 H 1 检验统计量 拒绝域 p 值μ = μ 0 μ > μ 0 Z = σ / n X − μ 0 z > z α 1 − Φ ( z ) μ = μ 0 μ < μ 0 Z = σ / n X − μ 0 z < − z α Φ ( z ) μ = μ 0 μ = μ 0 Z = σ / n X − μ 0 ∣ z ∣ > z α /2 2 ( 1 − Φ ( ∣ z ∣ ))
表 1. 方差 σ 2 已知时, 正态总体期望 μ 的假设检验方法 图 1. 方差 σ 2 已知时, 正态总体期望 μ 的假设检验拒绝域图示, 其中显著性水平为 α . 方差 σ 2 未知的情形. 设总体服从正态分布 N ( μ , σ 2 ) , 其中期望 μ 与方差 σ 2 > 0 均未知. 我们首先考虑如下假设检验问题: H 0 : μ = μ 0 , σ 2 > 0 , H 1 : μ > μ 0 , σ 2 > 0 , 其中 μ 0 为一给定的实数. 不难看出此时的原假设为复合假设, 而 σ 2 实际上可以看成一个多余参数 (nuisance parameter). 对于该问题, 我们考虑用T = S 2 / n X − μ 0 (9.3.1) 作为单侧检验统计量. 该检验统计量的一个重要特点在于它满足条件 9.2.3 : 无论多余参数 σ 2 的实际取值如何, 在原假设 H 0 下 T 的分布总是不变的, 而且很容看出这个不变的分布就是 t ( n − 1 ) , 这意味着我们在计算 p 值与临界值时可以直接套用原假设为简单假设时的公式. 由于备择假设中期望相对于原假设的偏离是正向的, 因此 T 的取值越大则意味着相对于 H 0 越显著的偏离. 当显著性水平为 α 时, 由临界值的计算式 P H 0 ( T > c α ) = α 可求得 c α = t α ( n − 1 ) , 故拒绝域由t = s 2 / n x − μ 0 > t α ( n − 1 ) 给出, 其中 s 2 = n − 1 1 ∑ i = 1 n ( x i − x ) 2 为样本观测值 x 1 , … , x n 的样本方差. p 值则由p ^ = P μ 0 ( T ≥ t ) = 1 − F n − 1 t ( s 2 / n x − μ 0 ) 给出, 其中 F n − 1 t 表示 t ( n − 1 ) 的分布函数.
类似地, 若我们希望对期望 μ 进行双侧检验: H 0 : μ = μ 0 , σ 2 > 0 , H 1 : μ = μ 0 , σ 2 > 0 , 则可以将 (9.3.1 ) 给出的 T 作为双侧检验统计量. 当显著性水平为 α 时, 由临界值计算式 P H 0 ( T > c α u ) = P H 0 ( T < c α l ) = α /2 可得c α u = t α /2 ( n − 1 ) , c α l = − t α /2 ( n − 1 ) , 故拒绝域由∣ t ∣ = s 2 / n ∣ x − μ 0 ∣ > t α /2 ( n − 1 ) 给出. p 值表达式由p ^ = = 2 min { P μ 0 ( T ≥ t ) , P μ 0 ( T ≤ t )} 2 P ( T ≥ ∣ t ∣ ) = 2 ( 1 − F n − 1 t ( s 2 / n ∣ x − μ 0 ∣ ) ) 给出.
上述利用 t 分布检验统计量进行假设检验的方法被称为 t 检验法 . 表 2 对相关的假设检验方法进行了汇总.
原假设 H 0 备择假设 H 1 检验统计量 拒绝域 p 值μ = μ 0 , σ 2 > 0 μ > μ 0 , σ 2 > 0 T = S 2 / n X − μ 0 t > t α ( n − 1 ) 1 − F n − 1 t ( t ) μ = μ 0 , σ 2 > 0 μ < μ 0 , σ 2 > 0 T = S 2 / n X − μ 0 t < − t α ( n − 1 ) F n − 1 t ( t ) μ = μ 0 , σ 2 > 0 μ = μ 0 , σ 2 > 0 T = S 2 / n X − μ 0 ∣ t ∣ > t α /2 ( n − 1 ) 2 ( 1 − F n − 1 t ( ∣ t ∣ ))
表 2. 方差 σ 2 未知时, 正态总体期望 μ 的假设检验方法
配对样本的 t 检验 配对样本的 t 检验可以看成是单个正态总体期望的 t 检验的特殊情形: 设总体不再是一个随机变量而是一个二维随机向量 ( X , Y ) , 而从该总体中抽样得到的样本是一组配对的随机变量 ( X 1 , Y 1 ) , … , ( X n , Y n ) , 且满足如下条件:
1.
X − Y 服从正态分布 N ( μ D , σ D 2 ) , 其中 μ D 与 σ D 2 均未知.
2.
每个 ( X i , Y i ) , i = 1 , … , n 均与 ( X , Y ) 同分布.
3.
随机向量 ( X 1 , Y 1 ) , … , ( X n , Y n ) 之间相互独立. 换句话说, 任取 n 个二元实值函数 f 1 , … , f n : R 2 → R , 随机变量 f 1 ( X 1 , Y 1 ) , … , f n ( X n , Y n ) 均相互独立.
注意上述条件中不要求 X 与 Y 相互独立. 上述配对形式的总体与样本的一个典型的应用场景如下: 为了比较两种方法之间的差异, 我们采取对比实验, 随机选取 n 个对象并在这 n 个对象上分别应用这两种方法, 随后观测两种方法在每个对象上各自给出的效果, 得到成对的样本数据; 此时 X − Y 的期望 μ D 即可看成是对两种方法效果差别的定量描述.
考虑如下假设检验问题: H 0 : μ D = Δ 0 , H 1 : μ D = Δ 0 , 其中 Δ 0 为某个给定的实数 1 . 由于 X i − Y i 均服从正态分布 N ( μ D , σ D 2 ) , 其中方差 σ D 2 未知, 故可以直接将针对单个正态总体期望的 t 检验法套用过来: 令D = n 1 i = 1 ∑ n ( X i − Y i ) 以及S D 2 = n − 1 1 i = 1 ∑ n ( X i − Y i − D ) 2 , 则双侧检验统计量应取为T = S D 2 / n D − Δ 0 . T 在原假设 H 0 下服从自由度为 n − 1 的 t 分布, 此后依照上一节给出的 t 检验步骤进行假设检验即可. 对于备择假设为 H 1 : μ D > Δ 0 或 H 1 : μ D < Δ 0 的单侧检验也可按类似方法处理.
正态总体方差的假设检验 设总体服从正态分布 N ( μ , σ 2 ) , 其中期望 μ 与方差 σ 2 均未知. 我们先考虑如下假设检验问题: H 0 : σ 2 = σ 0 2 , H 1 : σ 2 = σ 0 2 , 其中 σ 0 2 为一给定的常数. 注意上式中指明 H 0 与 H 1 时, 为了符号上的简单未将未知期望的取值范围 μ ∈ R 明确写出来, H 0 与 H 1 实际上均为复合假设. 对于该假设检验问题, 可以考虑用X 2 = σ 0 2 ( n − 1 ) S 2 (9.3.2) 作为双侧检验统计量. 虽然原假设是复合假设, 但该检验统计量在原假设下总是服从卡方分布 χ 2 ( n − 1 ) 而与未知期望 μ 的取值无关, 故条件 9.2.3 成立, 我们可以套用原假设为简单假设时的公式来计算 p 值与临界值. 当显著性水平为 α 时, 由临界值计算式P H 0 ( X 2 > c α l ) = P H 0 ( X 2 < c α u ) = 2 α , 可解得c α l = χ 1 − α /2 2 ( n − 1 ) , c α u = χ α /2 2 ( n − 1 ) , 相应的拒绝域由σ 0 2 ( n − 1 ) s 2 > χ α /2 2 ( n − 1 ) 或 σ 0 2 ( n − 1 ) s 2 < χ 1 − α /2 2 ( n − 1 ) 给出. 而 p 值为p ^ = = = 2 min { P ( X 2 ≥ σ 0 2 ( n − 1 ) s 2 ) , P ( X 2 ≤ σ 0 2 ( n − 1 ) s 2 ) } 2 min { 1 − F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) , F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) } ⎩ ⎨ ⎧ 2 F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) , 2 − 2 F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) , 若 F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) ≤ 2 1 , 若 F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) > 2 1 , 其中 F n − 1 χ 2 表示卡方分布 χ 2 ( n − 1 ) 的分布函数.
类似地, 若备择假设为 H 1 : σ 2 > σ 0 2 或 H 1 : σ 2 < σ 0 2 , 则仍可将 (9.3.2 ) 作为检验统计量, 只不过此时 H 1 相对于 H 0 的偏离是单向的, 故应将 X 2 作为单侧检验量来计算 p 值或拒绝域. 相应的结果总结于表 3 中; 图 2 给出了拒绝域的图示.
H 0 H 1 检验统计量 拒绝域 p 值σ 2 = σ 0 2 σ 2 > σ 0 2 σ 0 2 ( n − 1 ) S 2 σ 0 2 ( n − 1 ) s 2 > χ α 2 ( n − 1 ) 1 − F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) σ 2 = σ 0 2 σ 2 < σ 0 2 σ 0 2 ( n − 1 ) S 2 σ 0 2 ( n − 1 ) s 2 < χ 1 − α 2 ( n − 1 ) F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) σ 2 = σ 0 2 σ 2 = σ 0 2 σ 0 2 ( n − 1 ) S 2 σ 0 2 ( n − 1 ) s 2 > χ α /2 2 ( n − 1 ) 或 σ 0 2 ( n − 1 ) s 2 < χ 1 − α /2 2 ( n − 1 ) 2 min { F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) , 1 − F n − 1 χ 2 ( σ 0 2 ( n − 1 ) s 2 ) }
表 3. 期望 μ 未知时, 正态总体方差 σ 2 的假设检验方法 图 2. 期望 μ 未知时, 正态总体方差 σ 2 的假设检验拒绝域图示, 其中横坐标为 ( n − 1 ) s 2 / σ 0 2 , 显著性水平取为 α .
比例的假设检验 设总体 X 服从参数为 p 的伯努利分布, 其中 p 未知; 我们通常将参数 p 解释为某种比例 (可参考第 8.2 节 最后一小节的说法). 考虑如下假设检验问题: H 0 : p = p 0 , H 1 : p = p 0 .
当样本容量 n 较小时, 我们可以考虑用 p 值法: 以 K = ∑ i = 1 n X i 作为双侧检验统计量, 则在原假设 H 0 下, K 服从参数为 ( n , p 0 ) 的二项分布, 从而对于样本观测值 x 1 , … , x n , 其 p 值为p ^ = = = 2 min { P p 0 ( i = 1 ∑ n X i ≥ i = 1 ∑ n x i ) , P p 0 ( i = 1 ∑ n X i ≤ i = 1 ∑ n x i ) } 2 min { 1 − j = 0 ∑ k − 1 ( j n ) p 0 j ( 1 − p 0 ) n − j , j = 0 ∑ k ( j n ) p 0 j ( 1 − p 0 ) n − j } 2 min ⎩ ⎨ ⎧ j = k ∑ n ( j n ) p 0 j ( 1 − p 0 ) n − j , 1 − j = k + 1 ∑ n ( j n ) p 0 j ( 1 − p 0 ) n − j ⎭ ⎬ ⎫ , 其中我们记k = i = 1 ∑ n x i . 若需要在 H 0 与 H 1 之间二选一, 则可比较 p 值与事先设定的显著性水平 α , 当 p 值小于 α 时拒绝原假设, 否则接受原假设.
(⋆ ) 利用分部积分, 可证明 1 ≤ j ≤ n − 1 时, n ( j − 1 n − 1 ) ∫ 0 p t j − 1 ( 1 − t ) n − j d t − n ( j n − 1 ) ∫ 0 p t j ( 1 − t ) n − j − 1 d t = ( j n ) p j ( 1 − p ) n − j , 而n ∫ 0 p t n − 1 d t = ( n n ) p n ( 1 − p ) 0 , 故 1 ≤ k ≤ n 时, 可得= = = j = k ∑ n ( j n ) p j ( 1 − p ) n − j j = k ∑ n − 1 [ n ( j − 1 n − 1 ) ∫ 0 p t j − 1 ( 1 − t ) n − j d t − n ( j n − 1 ) ∫ 0 p t j ( 1 − t ) n − j − 1 d t ] + n ∫ 0 p t n − 1 d t n ( k − 1 n − 1 ) ∫ 0 p t k − 1 ( 1 − t ) n − k d t I p ( k , n − k + 1 ) , 其中I x ( a , b ) = Γ ( a ) Γ ( b ) Γ ( a + b ) ∫ 0 x t a − 1 ( 1 − t ) b − 1 d t 为不完全 Beta 函数 (incomplete beta function). 由此可将 p 值表达式改写为p ^ = 2 min { I p 0 ( k , n − k + 1 ) , 1 − I p 0 ( k + 1 , n − k )} , 从而 p ^ < α 给出的拒绝域可等价表示为I p 0 ( k , n − k + 1 ) < 2 α 或 1 − I p 0 ( k , n − k + 1 ) < 2 α . 我们可以进一步利用 Beta 分布的上分位数或 F 分布的上分位数来表示拒绝域, 感兴趣的读者可参阅 [21 ] 第 3.8.3 节以及 [22 ] 第 27.2 节.
当样本容量 n 足够大时, 利用中心极限定理可得P p 0 ( i = 1 ∑ n X i ≥ k ) = P p 0 ( i = 1 ∑ n X i ≥ k − 2 1 ) ≈ 1 − Φ ( n p 0 ( 1 − p 0 ) k − 1/2 − n p 0 ) , 其中第一步为连续性修正. 同理, P p 0 ( i = 1 ∑ n X i ≤ k ) ≈ Φ ( n p 0 ( 1 − p 0 ) k + 1/2 − n p 0 ) = 1 − Φ ( n p 0 ( 1 − p 0 ) − k − 1/2 + n p 0 ) , 故p ^ ≈ 2 ( 1 − Φ ( n p 0 ( 1 − p 0 ) ∣ k − n p 0 ∣ − 1/2 ) ) . 而当给定显著性水平为 α 时, 相应的拒绝域可近似由n p 0 ( 1 − p 0 ) ∣ k − n p 0 ∣ − 1/2 > z α /2 给出.
对于备择假设为 H 1 : p < p 0 或 H 1 : p > p 0 的单侧检验问题, 仍可利用上述方法导出相应的 p 值与拒绝域, 我们将具体的推导留给读者完成.
脚注