正态总体期望的区间估计
方差 σ2 已知的情形. 我们首先考虑总体服从正态分布 N(μ,σ2), 且方差 σ2 已知的情形. 此时对期望 μ 进行区间估计的步骤与结果已经由例 8.1.1 给出了: μ 的一个置信水平为 1−α 的置信区间为[X−zα/2nσ,X+zα/2nσ].(8.2.1)现在考虑这样一个问题: 我们希望 μ 的置信区间的宽度小于等于 2ε, 其中 ε>0 为事先给定的表征估计精度的常数, 同时保证置信水平为 1−α, 那么样本容量 n 应该至少取为多少? 对于这个问题, 由式 (8.2.1) 不难得到 n 所应当满足的不等式2zα/2nσ≤2ε,解得n≥(εzα/2σ)2.
方差 σ2 未知的情形. 现考虑总体服从正态分布 N(μ,σ2), 且期望 μ 与方差 σ2 均未知的情形. 注意到此时 σ2>0 为多余参数, 而 μ 的置信水平为 1−α 的置信区间 [μ,μ] 则应当满足Pμ,σ2([μ,μ]∋μ)≥1−α,∀μ∈R,σ2>0.
我们仍采用枢轴量法来求 μ 的置信区间. 在方差 σ2 未知的情况下, 我们考虑用样本方差 S2=n−11∑i=1n(Xi−X)2 来代替 σ2 以构造枢轴量, 从而让枢轴量表达式中不出现多余参数 σ2: T=S2/nX−μ.由推论 6.2.5 可知, T 服从参数为 n−1 的 t 分布, 因而 T 的确可以作为一个枢轴量. 那么在置信水平为 1−α 时, 利用 t(n−1) 的上分位数可得 (见图 1)Pμ,σ2(−tα/2(n−1)≤T≤tα/2(n−1))=1−α,从而有Pμ,σ2([X−tα/2(n−1)nS2,X+tα/2(n−1)nS2]∋μ)=1−α,故 μ 的一个置信水平为 1−α 的置信区间为[X−tα/2(n−1)nS2,X+tα/2(n−1)nS2].(8.2.2)
图 1. 正态总体的方差未知时, 利用枢轴量 (X−μ)/S2/n 求解期望的置信区间. 当样本容量 n 足够大 (例如 n≥45) 时, 可以在置信区间 (8.2.2) 中近似取 tα/2(n−1)≈zα/2.
当总体不再服从正态分布时, 即使样本容量 n 很大, 我们通常也不能用上述方法求出方差未知时期望的一个近似置信区间, 这是因为 X 与 S2 一般来说不再相互独立, 从而推论 6.2.5 一般来说不再成立.
正态总体方差的区间估计
现考虑总体服从正态分布 N(μ,σ2) 的情形, 其中期望 μ 与方差 σ2 均未知, 我们想对方差 σ2 进行区间估计, 则此时 μ 成为多余参数.
仍考虑用枢轴量法求解置信区间. 定理 6.2.3 提示我们, 可以尝试将 (n−1)S2/σ2 作为枢轴量, 其中 S2 为样本方差, 则有σ2(n−1)S2∼χ2(n−1).利用 χ2(n−1) 的上分位数, 可得 (见图 2)Pμ,σ2(χ1−α/22(n−1)≤σ2(n−1)S2≤χα/22(n−1))=1−α,从而有Pμ,σ2([χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2]∋σ2)=1−α,故方差 σ2 的一个置信水平为 1−α 的置信区间为[χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2].(8.2.3)
图 2. 正态总体的期望未知时, 利用枢轴量 (n−1)S2/σ2 求解方差的置信区间. 虽然 χ2 分布的概率密度函数不具有对称性, 但在利用服从 χ2 分布的枢轴量 h(X1,…,Xn;θ) 构造 (双侧) 置信区间时, 通常仍取 l,u 使得P(h(X1,…,Xn;θ)≤l)=P(h(X1,…,Xn;θ)≥u)=2α,也就是说我们将 h(X1,…,Xn;θ) 不属于 [l,u] 的概率等分到区间 [l,u] 的两侧.
若正态总体的期望 μ 已知, 则枢轴量可以取为σ21i=1∑n(Xi−μ)2,该枢轴量服从参数为 n 的 χ2 分布. 接下来 σ2 置信区间的构造我们留给读者完成.
大样本情形下比例的区间估计
本小节中我们考虑这样一个情形: 总体 X 服从参数为 p 的伯努利分布, 但 p∈[0,1] 未知, 我们希望对 p 进行区间估计. 在一些实际问题中, 若我们想要考察某类对象中满足某个特定条件的对象所占比例如何, 则可以认为总体 X 服从参数为 p 的伯努利分布, 其中 p 就代表待估计的比例.
我们只考虑样本容量 n 足够大的情形. 此时由中心极限定理可知p(1−p)/nX−p近似服从标准正态分布 N(0,1), 故我们可以尝试将其作为枢轴量进行置信区间的计算. 利用标准正态分布的上分位数, 可得P(−zα/2≤p(1−p)/nX−p≤zα/2)≈1−α.注意到上式括号中的不等式等价于∣∣p(1−p)/nX−p∣∣≤zα/2,(8.2.4)我们可以直接对该不等式两边进行平方, 得到它等价于(1+nzα/22)p2−(2X+nzα/22)p+X2≤0.求解该关于 p 的一元二次不等式, 可得p≤p≤p,其中p=p=(1+nzα/22)−1⎝⎛X+2nzα/22−zα/2nX(1−X)+4n2zα/22⎠⎞,(1+nzα/22)−1⎝⎛X+2nzα/22+zα/2nX(1−X)+4n2zα/22⎠⎞.由于 p 与 p 的表达式过于繁琐, 考虑到样本容量 n 比较大, 我们将 p 与 p 泰勒展开到 1/n 的一阶项, 可得p=p=X−zα/2nX(1−X)+o(n1),X+zα/2nX(1−X)+o(n1).故不等式 (8.2.4) 在 n 非常大时的近似解为X−zα/2nX(1−X)≤p≤X+zα/2nX(1−X).由此可得P⎝⎛⎣⎡X−zα/2nX(1−X),X+zα/2nX(1−X)⎦⎤∋p⎠⎞≈1−α.也就是说, 当样本容量 n 非常大时, p 的置信水平为 1−α 的置信区间可以近似取为⎣⎡X−zα/2nX(1−X),X+zα/2nX(1−X)⎦⎤.
实际上, 不等式 (8.2.4) 的近似解也可通过如下方法得到: 显然不等式 (8.2.4) 等价于X−zα/2np(1−p)≤p≤X+zα/2np(1−p).以上不等式中最左端与最右端均依赖于未知参数 p, 故不能作为统计量给出置信区间的端点, 但由于已经假设 n 非常大, 根据大数定律, 可以认为 X 的取值将与 p 非常接近, 因而可以在上述不等式的最左端与最右端中把 p 替换为 X, 由此得到不等式 (8.2.4) 的如下近似解: X−zα/2nX(1−X)≤p≤X+zα/2nX(1−X).这个结果与之前先严格求解不等式再用泰勒展开近似所得到的结果是一致的.