本节中我们证明, 在条件 C.1.1 下, 显著性水平 α 给出了第 I 类错误概率的上界, 且当 T 在原假设 H0 下为连续型随机变量时, 显著性水平 α 就等于第 I 类错误概率.
设 T 为假设检验问题 (C.1.1) 的检验统计量, 且条件 C.1.1 成立, p^:Rn→R 为将样本值映射到 p 值的函数, α∈]0,1[ 为给定的显著性水平, Cα 为相应的拒绝域. 则PH0(p^(X1,…,Xn)<α)=PH0(T∈Cα)≤α.特别是, 若 T 在原假设 H0 下为连续型随机变量, 则PH0(p^(X1,…,Xn)<α)=PH0(T∈Cα)=α,从而随机变量 p^(X1,…,Xn) 服从 [0,1] 上的均匀分布.
为了证明定理 C.2.1, 我们首先给出如下引理:
设 Y 为一随机变量, q(y)=P(Y≥y),y∈R. 则P(q(Y)<α)≤α,∀α∈]0,1[.特别是, 若 Y 为连续型随机变量, 则P(q(Y)<α)=α,∀α∈]0,1[,从而 q(Y) 服从 [0,1] 上的均匀分布.
证明. 定义函数 q+−1:]0,1[→R 为q+−1(α)=max{y∈R∣q(y)≥α},α∈]0,1[,则不难由 q 的单调性得到 q+−1(α) 关于 α 单调递减. 此外, 由引理 C.1.2 得{y∈R∣q(y)≥α}=]−∞,q+−1(α)],(C.2.1)从而 y>q+−1(α) 当且仅当 q(y)<α, 故P(q(Y)<α)=P(Y>q+−1(α))=q(q+−1(α)+0),其中 q(q+−1(α)+0) 表示 q(y) 在 y 从右侧趋向于 q+−1(α) 时的右极限. 而另一方面, 由式 (C.2.1) 可得, 当 y>q+−1(α) 时有 q(y)<α, 故令 y 从右侧趋向于 q+−1(α) 并由极限的保号性可得 q(q+−1(α)+0)≤α, 从而P(q(Y)<α)≤α.
而若
Y 为连续型随机变量, 则有
P(q(Y)<α)=P(Y>q+−1α)=P(Y≥q+−1α)=q(q+−1(α))≥α,其中第二个等号用到了
Y 服从连续型分布, 而最后一步不等号则是因为式 (
C.2.1)
意味着
q+−1(α)∈{y∈R∣q(y)≥α}. 故
α≤P(q(Y)<α)≤α, 从而
P(q(Y)<α)=α.
在得到引理 C.2.2 后, 定理 C.2.1 则可看成它的一个推论.
定理 C.2.1 的证明. 记 q(y)=PH0(T≥y). 对于单侧检验的情形, 有p^(x1,…,xn)=q(ϕ(x1,…,xn)),即 p^(X1,…,Xn)=q(T), 接下来由引理 C.2.2 即可得PH0(p^(X1,…,Xn)<α)=PH0(q(T)<α)≤α,而若 T 在原假设 H0 下为连续型随机变量, 则有PH0(p^(X1,…,Xn)<α)=PH0(q(T)<α)=α.
对于双侧检验的情形, 进一步令
q′(y)=PH0(−T≥y), 则有
p^(x1,…,xn)=2min{q(ϕ(x1,…,xn)),q′(−ϕ(x1,…,xn))},从而
PH0(p^(X1,…,Xn)<α)==≤≤PH0(2min{q(T),q′(−T)}<α)PH0(q(T)<2α 或 q′(−T)<2α)PH0(q(T)<2α)+PH0(q′(−T)<2α)2α+2α=α,其中最后一个不等号来自于引理
C.2.2. 而若
T 为连续型随机变量, 则由于
q(y)<2α⟹P(Y≥y)<21,而
q′(−y)<2α⟹⟹P(−Y≥−y)<21P(Y≥y)=1−P(−Y≥−y)>21,故
q(y)<α/2 与
q′(−y)<α/2 不能同时成立, 从而
PH0(p^(X1,…,Xn)<α)===PH0(q(T)<2α 或 q′(−T)<2α)PH0(q(T)<2α)+PH0(q′(−T)<2α)2α+2α=α.定理证毕.