x 对 Y 的取值在平均意义上并没有影响. 此时通常需要考虑寻找其它对 Y 的取值具有显著影响的变量.
•
x 对 Y 取值的影响并不能简单地由 E[Y∣x]=β0+β1x 所表述. 此时通常需要考虑用其它统计模型对 x 与 Y 的关系进行建模.
•
样本容量 n 太小. 此时需要收集更多的数据以得到更确切的结论.
总之, 若无法拒绝原假设 H0, 则说明得到的线性回归模型并不理想, 尚不能直接应用而需要进一步更正. 我们将 (10.5.1) 给出的假设检验问题称为回归显著性检验 (test for significance of regression).
对于一元线性回归, 其回归显著性检验可以有三种等价的方法, 我们依次对其进行介绍.
t 检验法. 显著性回归的 t 检验法就是 第 10.3 节第 1 小节中给出的检验法: 取T=σ2/Sxxβ1=SSRes(n−2)Sxx⋅β1,(10.5.2)则在原假设 H0:β1=0 下, T 服从分布 t(n−2), 相应的 p 值与拒绝域分别由p^=2⎝⎛1−Fn−2t⎝⎛σ2/Sxx∣∣β1∣∣⎠⎞⎠⎞与σ2/Sxx∣∣β1∣∣>tα/2给出, 其中 α 为事先取定的显著性水平.
F 检验法. 在习题 9.6.2 中已经让读者证明, 服从分布 t(k) 的随机变量在平方后服从分布 F(1,k), 因此我们也可以取检验统计量为F=T2=σ2/Sxxβ12,(10.5.3)则在原假设 H0 下有 F∼F(1,n−2), 由此可得相应的 p 值与拒绝域的形式. 另一方面, 检验统计量 F 实际上还可表示为F=SSRes/(n−2)SSR,(10.5.4)其中SSR=i=1∑n(Yi−Y)2=i=1∑n(β0+β1xi−Y)2被称为回归平方和 (regression sum of squares). 式 (10.5.4)成立是因为β12===β1⋅Sxx1i=1∑n(xi−x)(Yi−Y)Sxxβ1i=1∑n(xi−x)(Yi−Yi)+Sxx1i=1∑n(β1xi−β1x)(Yi−Y)Sxxβ1i=1∑n(xi−x)(Yi−Yi)+SSR,而由 normal equations (10.2.2)可推得0=i=1∑nxi(Yi−β0−β1xi)=i=1∑nxi(Yi−Yi),以及0=i=1∑n(Yi−β0−β1xi)=i=1∑n(Yi−Yi),故i=1∑n(xi−x)(Yi−Yi)=i=1∑nxi(Yi−Yi)−xi=1∑n(Yi−Yi)=0,从而β12=SxxSSR,再将其带入式 (10.5.3)中并利用 σ2=SSRes/(n−2) 即可得到表达式 (10.5.4). 由此可知, p 值与拒绝域还可表示为p^=1−F1,n−2F(SSRes/(n−2)SSR)与SSRes/(n−2)SSR>Fα(1,n−2),其中 F1,n−2F 表示分布 F(1,n−2) 的分布函数, α 为事先给定的显著性水平.
上述 F 检验法又被称为方差分析法 (analysis-of-variance approach).
相关系数检验法. 我们还可以利用如下样本相关系数R=∑i=1n(xi−x)2∑i=1n(Yi−Y)2∑i=1n(xi−x)(Yi−Y)(10.5.5)对 (10.5.1) 进行检验: 由上述 R 的定义式可得R===SxxSSTSxY=SST/SxxSxY/Sxx(SSRes+β1SxY)/Sxxβ1=SSRes/Sxx+β12β11+Sxxβ12/SSResSxx/SSRes⋅β1=n−2+T2T,其中 T 即为 (10.5.2) 给出的检验统计量. 上式指出, R 与 T 之间存在连续且严格单调递增的对应关系. 反解上式可得T=1−R2n−2R,由此还可得到F=T2=1−R2(n−2)R2以及R2=n−2+FF.故 p 值为p^=2(1−Fn−2t(1−r2n−2∣r∣))=1−F1,n−2F(1−r2(n−2)r2),其中 r 为统计量 R 在代入样本观测值后的取值, 而拒绝域则可表示为∣r∣>n−2+[tα/2(n−2)]2tα/2(n−2)或r2>n−2+Fα(1,n−2)Fα(1,n−2),其中 α 为显著性水平.