10.5. 回归显著性检验

对回归系数 进行假设检验的方法已在第 10.3 节第 1 小节中进行了介绍. 在实际问题中, 最常用的针对 的假设检验问题具有如下形式: (10.5.1)这是因为若我们无法拒绝原假设 , 则很有可能意味着如下几种情况:

的取值在平均意义上并没有影响. 此时通常需要考虑寻找其它对 的取值具有显著影响的变量.

取值的影响并不能简单地由 所表述. 此时通常需要考虑用其它统计模型对 的关系进行建模.

样本容量 太小. 此时需要收集更多的数据以得到更确切的结论.

总之, 若无法拒绝原假设 , 则说明得到的线性回归模型并不理想, 尚不能直接应用而需要进一步更正. 我们将 (10.5.1) 给出的假设检验问题称为回归显著性检验 (test for significance of regression).

对于一元线性回归, 其回归显著性检验可以有三种等价的方法, 我们依次对其进行介绍.

检验法. 显著性回归的 检验法就是 第 10.3 节第 1 小节中给出的检验法: 取(10.5.2)则在原假设 下, 服从分布 , 相应的 值与拒绝域分别由给出, 其中 为事先取定的显著性水平.

检验法. 在习题 9.6.2 中已经让读者证明, 服从分布 的随机变量在平方后服从分布 , 因此我们也可以取检验统计量为(10.5.3)则在原假设 下有 , 由此可得相应的 值与拒绝域的形式. 另一方面, 检验统计量 实际上还可表示为(10.5.4)其中被称为回归平方和 (regression sum of squares). 式 (10.5.4) 成立是因为而由 normal equations (10.2.2) 可推得以及从而再将其带入式 (10.5.3) 中并利用 即可得到表达式 (10.5.4). 由此可知, 值与拒绝域还可表示为其中 表示分布 的分布函数, 为事先给定的显著性水平.

上述 检验法又被称为方差分析法 (analysis-of-variance approach).

相关系数检验法. 我们还可以利用如下样本相关系数(10.5.5)对 (10.5.1) 进行检验: 由上述 的定义式可得其中 即为 (10.5.2) 给出的检验统计量. 上式指出, 之间存在连续且严格单调递增的对应关系. 反解上式可得由此还可得到 值为其中 为统计量 在代入样本观测值后的取值, 而拒绝域则可表示为其中 为显著性水平.