本节将讨论一些两个总体下的假设检验问题. 我们用 X1,1,…,X1,n1 表示第一个总体的样本容量为 n1 的样本, 用 X2,1,…,X2,n2 表示第二个总体的样本容量为 n2 的样本, 且 X1,1,…,X1,n1,X2,1,…,X2,n2 相互独立. 此外, 用如下符号Xk=nk1i=1∑nXk,i,Sk2=nk−11i=1∑n(Xk,i−Xk),k=1,2来表示两组样本 X1,1,…,X1,n1 与 X2,1,…,X2,n2 各自的样本均值和样本方差. 符号 x1,s12 与 x2,s22 则代表获取到样本值 x1,1,…,x1,n1 与 x2,1,…,x2,n2 以后算得的各自的样本均值与样本方差值.
两个正态总体期望之差的假设检验
设两个总体分别服从正态分布 N(μ1,σ12) 与 N(μ2,σ22). 我们根据两个总体方差信息的知晓程度, 讨论几种容易求解的情况.
两总体方差均已知的情况. 设两个总体的方差 σ12,σ22 均已知. 考虑如下假设检验问题: H0:μ1−μ2=Δ0,H1:μ1−μ2=Δ0,其中 Δ0 为一给定实数. 由于两个总体的方差均已知, 故可以考虑用如下双侧检验统量进行假设检验: Z=σ12/n1+σ22/n2X1−X2−Δ0.(9.4.1)不难看出, 检验统计量 Z 在原假设 H0 下服从标准正态分布 N(0,1). 故在获得样本观测值 x1,1,…,x1,n1 与 x2,1,…,x2,n2 后, 相应的 p 值为p^=2(1−Φ(∣z∣)),z=σ12/n1+σ22/n2x1−x2−Δ0.若事先给定了显著性水平 α, 则拒绝域由∣z∣>zα/2给出.
若备择假设被替换为 H1:μ1−μ2>Δ0 或 H1:μ1−μ2<Δ0, 则可以将 (9.4.1) 作为单侧检验统计量进行假设检验, 相关的推导留给读者自己完成. 表 1 总结了方差已知时, 两个正态总体期望之差的假设检验方法.
原假设 H0 | 备择假设 H1 | 检验统计量 | 拒绝域 | p 值 |
---|
μ1−μ2=Δ0 | μ1−μ2>Δ0 | Z=σ12/n1+σ22/n2X1−X2−Δ0 | z>zα | 1−Φ(z) |
μ1−μ2=Δ0 | μ1−μ2<Δ0 | Z=σ12/n1+σ22/n2X1−X2−Δ0 | z<−zα | Φ(z) |
μ1−μ2=Δ0 | μ1−μ2=Δ0 | Z=σ12/n1+σ22/n2X1−X2−Δ0 | ∣z∣>zα/2 | 2(1−Φ(∣z∣)) |
表 1. 方差 σ12,σ22 已知时, 两个正态总体期望之差 μ1−μ2 的假设检验方法 两总体方差未知, 但已知它们相等的情况. 设两个总体的方差 σ12,σ22 均未知, 但已知二者相等 (即 σ12=σ22). 考虑如下假设检验问题: H0:μ1−μ2=Δ0,H1:μ1−μ2=Δ0,其中 Δ0 为一给定实数. 需注意的是, 上述问题中 H0 与 H1 均为复合假设.
我们参考相同情形下对 μ1−μ2 进行区间估计时枢轴量的设计方法 (见第 8.3 节第 1 小节第二部分内容), 取T=Sp2(1/n1+1/n2)X1−X2−Δ0(9.4.2)为检验统计量, 其中Sp2=n1+n2−2(n1−1)S12+(n2−2)S22为合并方差. 依照第 8.3 节第 1 小节第二部分的推导, 可知在原假设 H0 下 T 服从自由度为 n1+n2−2 的 t 分布. 由此可得, 在获得样本观测值 x1,1,…,x1,n1 与 x2,1,…,x2,n2 后, 相应的 p 值为p^=2(1−Fn1+n2−2t(∣t∣)),t=sp2(1/n1+1/n2)x1−x2−Δ,其中 sp2 为将样本值代入统计量 Sp2 后的取值, Fn1+n2−2t 为分布 t(n1+n2−2) 的分布函数. 若事先给定了显著性水平 α, 则拒绝域由∣t∣>tα/2(n1+n2−2)给出.
若备择假设被替换为 H1:μ1−μ2>Δ0 或 H1:μ1−μ2<Δ0, 则可以将 (9.4.2) 作为单侧检验统计量进行假设检验, 相关的推导留给读者自己完成. 表 2 总结了方差已知时, 两个正态总体期望之差的假设检验方法.
H0 | H1 | 检验统计量 | 拒绝域 | p 值 |
---|
μ1−μ2=Δ0 | μ1−μ2>Δ0 | T=Sp2(1/n1+1/n2)X1−X2−Δ0 | t>tα(n1+n2−2) | 1−Fn1+n2−2t(t) |
μ1−μ2=Δ0 | μ1−μ2<Δ0 | T=Sp2(1/n1+1/n2)X1−X2−Δ0 | t<−tα(n1+n2−2) | Fn1+n2−2t(t) |
μ1−μ2=Δ0 | μ1−μ2=Δ0 | T=Sp2(1/n1+1/n2)X1−X2−Δ0 | ∣t∣>tα/2(n1+n2−2) | 2(1−Fn1+n2−2t(∣t∣)) |
表 2. 方差 σ12,σ22 未知但相等时, 两个正态总体期望之差 μ1−μ2 的假设检验方法 (⋆) 两总体方差未知, 且不能事先认为它们相等的情况. 这种情况下, 如下形式的假设检验问题H0:μ1−μ2=Δ0,H1:μ1−μ2=Δ0(以及对 μ1−μ2 进行区间估计的问题) 被称为 Behrens–Fisher 问题, 它曾是应用统计领域的一个著名问题. 对于 Behrens–Fisher 问题, 理想情况下, 我们希望找到一个检验统计量 T, 使其满足如下条件:
1. | T 在原假设 H0 下的概率分布是确切已知的 (尤其是与方差 σ12,σ22 无关的); |
2. | T 可以表示为T=ϕ(X1,X2,S12,S22),其中 ϕ 是一个性态良好的函数. |
3. | 设 x1,1,…,x1,n1,x2,1,…,x2,n2 为一组样本值. 对任意实数 α=0 及 β, 将样本值做变换xk,i↦αxk,i+β,∀i=1,…,nk,k=1,2后不会改变 p 值. |
4. | 设 x1,1,…,x1,n1,x2,1,…,x2,n2 与 x1,1′,…,x1,n1′,x2,1′,…,x2,n2′ 为两组样本值, 且有 ∣x1−x2−Δ0∣>∣x1′−x2′−Δ0∣, s12=s1′2, s22=s2′2, 则前一组样本的 p 值小于后一组样本的 p 值; |
上述四条性质都是比较自然的. 然而, Linnik 等人的工作 [23] 基本上否定了具备上述性质的检验统计量的存在性, 这也就是为什么 Behrens–Fisher 问题曾长期是应用统计领域的难题. 这里我们提及两种较易实现的针对 Behrens–Fisher 问题的检验法; 为简单起见设 Δ0=0.
• | Bartlett–Scheffé 检验: 此类检验法可看成是由配对检验法衍生出来的. 具体而言, 对于两个样本容量相等 (也就是 n1=n2) 的情形, 考虑将 X1,i 与 X2,i 配成一对 (X1,i,X2,i), 则由于 X1,i∼N(μ1,σ12), X2,i∼N(μ2,σ22), 且 X1,i 与 X2,i 相互独立, 可知 X1,i−X2,i 服从正态分布 N(μ1−μ2,σ12+σ22). 接下来取检验统计量为T=SD2/nX1−X2,其中SD2=n−11i=1∑n(X1,i−X1−X2,i+X2)2,则在原假设 H0 下 T 服从自由度为 n−1 的 t 分布, 此后依照通常的 t 检验步骤计算 p 值/拒绝域即可. 上述方法还可推广到 n1=n2 的情形; 见 Scheffé 的原始论文 [24] 以及教材 [25] 第 9.9 节. Bartlett–Scheffé 检验法的优点在于检验统计量在原假设下的分布是确切已知而与 σ12 和 σ22 无关的, 而缺点则是检验结果会与配对的次序相关, 且与接下来介绍的 t∗ 检验法相比, 在显著性水平与样本容量保持一致时, 它通常更不容易在备择假设成立时拒绝原假设, 从而第 II 类错误的概率更高. |
• | t∗ 检验: 该类检验法基于如下统计量: T∗=S12/n1+S22/n2X1−X2.直观上看, T∗ 相当于将 (9.4.1) 中的方差替换为样本方差, 故应当是一个合理的检验统计量, 且不难看出原假设 H0 下 T∗ 的分布关于原点对称, 故可以考虑用 ∣T∗∣ 做单侧检验. 然而, ∣T∗∣ 在原假设 H0 下并不服从一个确切已知的分布, 其分布与方差之比 σ12/σ22 有关; 更具体地说, 给定 c>0, 原假设下的概率 P(∣T∗∣≥c) 是 σ12/σ22 的函数, 我们将这个函数暂记为 β(σ12/σ22;c). 我国概率统计学科的奠基人、著名数学家许宝𫘧先生在他攻读博士期间完成的论文 [26] 中对 β(σ12/σ22;c) 的性质进行了详细的研究, 其中的结论指出σ12,σ22supβ(σ12/σ22;c)σ12,σ22minβ(σ12/σ22;c)=2(1−Fmin{n1,n2}−1t(c)),=2(1−Fn1+n2−2t(c)).基于此, 我们可以令 p 值为p^=σ12,σ22supβ(σ12/σ22;∣t∗∣)=2(1−Fmin{n1,n2}−1t(∣t∗∣)),而显著性水平 α 下的拒绝域则由∣t∗∣>tα/2(min{n1,n2}−1)给出, 该拒绝域给出的实际显著性水平可以保证小于等于 α. 不过在 σ12 与 σ22 相差不大的情况下, 上述 p 值与拒绝域会稍显保守. Welch [27] 则提出了如下近似: β(σ12/σ22;∣t∗∣)≈2(1−Fνt(∣t∗∣)),其中 1ν=n1−1(s12/n1)2+n1−1(s22/n2)2(s12/n1+s22/n2)2.相应的拒绝域则由 ∣t∗∣>tα/2(ν) 给出, 但应当指出, 该拒绝域给出的实际显著性水平并不能严格保证小于等于 α. |
关于 Behrens–Fisher 问题的讨论还可参考 [25] 第 9.9 节、[16] 例 5.6 与第 5.2 (iv) 节, 以及论文 [28].
两个正态总体方差的假设检验
设两个总体各自服从正态分布 N(μ1,σ12) 与 N(μ2,σ22), 其中期望 μ1,μ2 与方差 σ12,σ22 均未知. 考虑如下假设检验问题: H0:σ12=σ22,H1:σ12=σ22.注意 H0 与 H1 均为复合假设. 对于该假设检验问题, 可令F=S22S12(9.4.3)为双侧检验统计量. 在原假设 H0 下, F 服从自由度为 (n1−1,n2−1) 的 F 分布. 故在获得样本观测值 x1,1,…,x1,n1 与 x2,1,…,x2,n2 后, 相应的 p 值为p^==2min{PH0(S22S12≥s22s12),PH0(S22S12≤s22s12)}2min{1−Fn1−1,n2−1F(s22s12),Fn1−1,n2−1F(s22s12)},其中 Fn1−1,n2−1F 表示分布 F(n1−1,n2−1) 的分布函数. 而若事先给定显著性水平 α, 则由临界值计算式 (9.2.4) 可得cαu=Fα/2(n1−1,n2−1),cαl=F1−α/2(n1−1,n2−1),故拒绝域由s22s12>Fα/2(n1−1,n2−1) 或 s22s12<F1−α/2(n1−1,n2−1)给出.
若备择假设被替换为 H1:σ12>σ22 或 H1:σ12<σ22, 则可以将 (9.4.3) 作为单侧检验统计量进行假设检验, 相关的推导留给读者自己完成. 表 3 总结了期望未知时, 对两个正态总体的方差进行假设检验的方法.
H0 | H1 | 检验统计量 | 拒绝域 | p 值 |
---|
σ22σ12=1 | σ22σ12>1 | F=S22S12 | s22s12>fα(n1−1,n2−1) | 1−Fn1−1,n2−1F(s22s12) |
σ22σ12=1 | σ22σ12<1 | F=S22S12 | s22s12<f1−α(n1−1,n2−1) | Fn1−1,n2−1F(s22s12) |
σ22σ12=1 | σ22σ12=1 | F=S22S12 | s22s12>fα/2(n1−1,n2−1) 或s22s12<f1−α/2(n1−1,n2−1) | 2min{Fn1−1,n2−1F(s22s12),1−Fn1−1,n2−1F(s22s12)} |
表 3. 期望未知时, 两个正态总体方差之比 σ12/σ22 的假设检验方法 大样本情形下比例之差的假设检验
设两个样本分别服从参数为 p1 与 p2 的伯努利分布, 考虑如下原假设与备择假设给出的假设检验问题: H0:p1=p2,H1:p1=p2.我们只考虑样本容量 n1 与 n2 均足够大的情形. 由中心极限定理可得, 随机变量Z~=p1(1−p1)/n1+p2(1−p2)/n2X1−X2(9.4.4)在原假设 H0 下近似服从标准正态分布 N(0,1), 然而 Z~ 依赖于未知的参数 p1,p2, 不能直接作为检验统计量, 故类似于第 8.3 节最后一小节中针对比例之差设计枢轴量的方法, 我们考虑在大样本情形下将 p1 与 p2 替换为它们的点估计量. 不过, 注意到原假设 H0 下 p1 与 p2 取相同的值, 因而可以用Π=n1+n2∑i=1n1X1,i+∑i=1n2X2,i将两个样本合并起来对原假设下的 p1=p2 进行估计; 有时会将 Π 称为合并比例 2. 当 n1+n2 足够大时, Π 可以作为原假设下 p1=p2 的一个很好的近似. 故我们最终取Z=Π(1−Π)(1/n1+1/n2)X1−X2为双侧检验估计量, 它在原假设 H0 下近似服从标准正态分布 N(0,1). 由此可得 p 值为p^=2(1−Φ(∣z∣)),其中z=π(1−π)(1/n1+1/n2)x1−x2,π=n1+n2∑i=1n1x1,i+∑i=1n2x2,i.而若事先设定了显著性水平 α, 则拒绝域由∣z∣>zα/2给出.
对于备择假设为 H1:p1<p2 或 H1:p1>p2 的单侧检验问题, 仍可利用上述方法导出相应的 p 值与拒绝域, 我们将具体的推导留给读者完成.
脚注