本节中我们考虑这样一个问题: 假设基于样本 (x1,Y1),…,(xn,Yn) 已经构造出了回归系数的点估计量 β0,β1, 而我们对因变量 Y 在 x=x0 处的值 Y0 感兴趣, 其中 x0 为一给定的实数且与 x1,…,xn 相异; 换句话说Y0=β0+β1x0+ε0,其中 ε0 与 ε1,…,εn 独立且同分布, 则在尚未观测到 Y0 的值的情况下, 我们应当如何对 Y0 的值进行预测?
由于随机误差 ε0 与 ε1,…,εn 独立, 若仅基于样本 (x1,Y1),…,(xn,Yn) 对 ε0 预测, 则只能将其预测为 E[ε0]=0, 故我们可以直接用 μ(x0) 的点估计量μ(x0)=β0+β1x0作为 Y0 的点预测量, 且不难看出它满足如下意义的 “无偏性”: E[μ(x0)−Y0]=0. 但许多情况下, 仅给出单个点预测是不够的, 我们还希望对点预测的精度有定量的刻画. 具体而言, 我们希望找到一个仅依赖于 (x1,Y1),…,(xn,Yn) 的随机区间 [Y0l,Y0u], 使得P(Y0∈[Y0l,Y0u])=1−α,其中 α∈]0,1[ 为事先给定的常数. 我们将满足上述条件的 [Y0l,Y0u] 称为 Y0 的置信水平为 1−α 的预测区间 (prediction interval).
现假设 ε0,ε1,…,εn 均服从正态分布 N(0,σ2). 为了求出 Y0 的预测区间, 这次我们从点预测误差ep=Y0−μ(x0)入手. 注意到 ep 为 Y0,Y1,…,Yn 的线性函数, 而 Y0,Y1,…,Yn 相互独立且服从正态分布, 故 ep 也服从正态分布, 其期望为 E[ep]=0, 而方差为Var(ep)===Var(Y0−μ(x0))Var(Y0)+Var(μ(x0))σ2(1+n1+Sxx(x0−x)2),其中第二步是因为 μ(x0)−μ(x0) 与 ε0 相互独立. 在求得 ep 的方差后, 即可考虑构造如下枢轴量: σ2(1+n1+Sxx(x0−x)2)ep=σ2(1+n1+Sxx(x0−x)2)Y0−μ(x0).利用引理 10.3.1 可验证其服从分布 t(n−2), 故P⎝⎛−tα/2(n−2)≤σ2(1+n1+Sxx(x0−x)2)Y0−μ(x0)≤tα/2(n−2)⎠⎞=1−α,经过等价变形并根据前述预测区间的定义可得, 若令Y0l=Y0u=μ(x0)−tα/2(n−2)σ2(1+n1+Sxx(x0−x)2),μ(x0)+tα/2(n−2)σ2(1+n1+Sxx(x0−x)2),则 [Y0l,Y0u] 给出了 Y0 的一个置信水平为 1−α 的预测区间. 不难看出, 预测区间 [Y0l,Y0u] 的宽度 Y0u−Y0l 随着 ∣x0−x∣ 的增大而增大, 这意味着, 在保持置信水平为 1−α 的情况下, x0 越远离 x, 则对 Y0 进行区间预测的精度越低. 此外, Y0 的预测区间总是宽于 μ(x0) 的置信区间, 这是因为对 Y0 进行区间预测时需要把 Y0 上的随机误差 ε0 也考虑进来.