9.6. 习题选编

习题 9.6.1. 设总体服从正态分布 $N (μ, σ^{2})$ , 其中 $σ^{2}$ 已知而 $μ$ 未知. 考虑如下假设检验问题: $H_{0} : μ = μ_{0}, H_{1} : μ < μ_{0},$ 其中 $μ_{0}$ 为一给定的实数. 令 $Z = \frac{X - μ _{0}}{σ / n}$ 为单侧检验统计量, $α$ 为显著性水平 (注意此时拒绝域的形式为 $z < - z_{α}$ ).

1.	试求功效函数 $w (μ)$ .
2.	若希望 $μ \leq μ_{0} - δ$ 时的第 II 类错误概率小于等于 $β$ , 其中 $δ > 0$ 与 $β \in] 0, 1 [$ 给定, 试求样本容量 $n$ 应当满足的条件.

习题 9.6.2.

1.	证明: 若 $X \sim t (n)$ , 则 $X^{2} \sim F (1, n)$ .
2.	设总体服从正态分布 $N (μ, σ^{2})$ , 其中期望 $μ$ 与方差 $σ^{2}$ 均未知. 考虑如下假设检验问题: $H_{0} : μ = μ_{0}, H_{1} : μ \neq = μ_{0} .$ 试设计一个服从 $F$ 分布的检验统计量, 用于对上述假设检验问题进行单侧检验, 并给出显著性水平为 $α$ 时的拒绝域.

习题 9.6.3. 设随机变量 $X$ 服从参数为 $(n, p)$ 的二项分布, 其中 $n = 19$ 已知而 $p$ 未知. 我们对 $X$ 进行了一次观测, 得到一个观测值 $8$ , 试对 $H_{0} : p = 1/3, H_{1} : p \neq = 1/3$ 进行假设检验.

习题 9.6.4. 设两个总体分别服从正态分布 $N (μ_{1}, σ_{1}^{2})$ 与 $N (μ_{2}, σ_{2}^{2})$ , 其中 $σ_{1}^{2}$ 与 $σ_{2}^{2}$ 已知. 考虑如下假设检验问题: $H_{0} : μ_{1} - μ_{2} = Δ_{0}, H_{1} : μ_{1} - μ_{2} \neq = Δ_{0} .$ 设两个总体的样本分别为 $X_{1, 1}, \dots, X_{1, n_{1}}$ 与 $X_{2, 1}, \dots, X_{2, n_{2}}$ , 取检验统计量为 $Z = \frac{X _{1} - X _{2} - Δ _{0}}{σ _{1}^{2} / n _{1} + σ _{2}^{2} / n _{2}} .$

1.	试求功效函数 $w (μ_{1}, μ_{2})$ .
2.	若希望 $∣ μ_{1} - μ_{2} - Δ_{0} ∣ > δ$ 时的第 II 类错误概率小于等于 $β$ , 其中 $δ > 0$ 与 $β \in] 0, 1 [$ 给定, 并假定 $n_{1} = n_{2}$ , 试求两个样本的样本容量应当满足的条件.

习题 9.6.5. 一研究机构开发了一种新的用于训练深度神经网络的专用芯片, 并希望它在某个测试样例上的训练时间较另一种商用芯片至少缩短一半, 故考虑如下形式的假设检验问题: $H_{0} : μ_{1} = 2 μ_{2}, H_{1} : μ_{1} > 2 μ_{2},$ 其中 $μ_{1}$ 表示商用芯片在测试样例上训练时间的期望, 而 $μ_{2}$ 表示新芯片在测试样例上训练时间的期望. 设两个总体均服从正态分布, 且各自的方差 $σ_{1}^{2}$ 与 $σ_{2}^{2}$ 均已知. 若用 $X_{1, 1}, \dots, X_{1, n_{1}}$ 表示商用芯片测试 $n_{1}$ 次的试验结果, $X_{2, 1}, \dots, X_{2, n_{2}}$ 表示新芯片测试 $n_{2}$ 次的试验结果, 试推导上述假设检验问题的 $p$ 值与拒绝域表达式.

习题 9.6.6. Benford 定律称, 在一个由真实世界的某类数据构成的大数据集中, 以 $n$ 为首位数字的数出现的概率约为 $p_{0} (n) = lo g_{10} (1 + \frac{1}{n}), n = 1, 2, \dots, 9.$ 下表给出了某份数据集中以 $n$ 为首位数字的数出现的频数:

首位数字	1	2	3	4	5	6	7	8	9
频数	342	180	164	155	86	65	54	47	56

试检验该数据集是否服从 Benford 定律.

注: 本题数据取自 [29].

习题 9.6.7. 设总体 $X$ 的分布函数为 $F (x; θ)$ , 其中 $θ \in Θ$ 为未知参数, $Θ \subseteq R$ 为所有 $θ$ 的可能取值构成的集合. $X_{1}, \dots, X_{n}$ 为总体 $X$ 的一组样本, $\underline{θ} = \underline{θ} (X_{1}, \dots, X_{n})$ 与 $\overline{θ} = \overline{θ} (X_{1}, \dots, X_{n})$ 为两个统计量, 且对任意的 $θ \in Θ$ , $\underline{θ}$ 与 $\overline{θ}$ 均服从连续型分布.

1.	若 $[\underline{θ}, \overline{θ}]$ 给出了参数 $θ$ 的一个置信水平为 $1 - α$ 的置信区间, 证明: 任取 $θ_{0} \in Θ$ , 假设检验问题 $H_{0} : θ = θ_{0}, H_{1} : θ \neq = θ_{0}$ 的一个显著性水平不超过 $α$ 的拒绝域可由 $θ_{0} < \underline{θ} (x_{1}, \dots, x_{n}) 或 θ_{0} > \overline{θ} (x_{1}, \dots, x_{n})$ 给出.
2.	反之, 若对任意 $θ_{0} \in Θ$ , 不等式 $θ_{0} < \underline{θ} (x_{1}, \dots, x_{n}) 或 θ_{0} > \overline{θ} (x_{1}, \dots, x_{n})$ 总能给出假设检验问题 $H_{0} : θ = θ_{0}, H_{1} : θ \neq = θ_{0}$ 的一个显著性水平为 $α$ 的拒绝域, 证明: $[\underline{θ}, \overline{θ}]$ 给出了 $θ$ 的一个置信水平为 $1 - α$ 的置信区间.

习题 9.6.8 ( $p$ -hacking). 设 A 在一项研究工作中需要验证课题组提出的新方法是否起效, 故设计了实验流程并考虑用配对 $t$ 检验方法对 $H_{0} : 新方法无效, H_{1} : 新方法有效$ 进行检验, 但一次实验之后发现得到的 $p$ 值大于 $0.05$ . 由于领域内顶刊只发表 $p$ 值小于 $0.05$ 的实验结果, 迫于压力, A 决定采取如下策略: 不断重复该实验, 直到某次实验给出的 $p$ 值小于 $0.05$ 或是实验次数达到 $M$ , 若最终得到的 $p$ 值小于 $0.05$ 则将该次实验数据保留并整理成论文投稿, 而若 $M$ 次实验的 $p$ 值均大于等于 $0.05$ , 则将这几次实验中最小的 $p$ 值在课题组组会上进行汇报并讨论新方法的改进. 设各次实验相互独立, 每次计算 $p$ 值时均只采用当次实验的数据.

1.	考虑单次实验, 用 $\hat{P}$ 表示其 $p$ 值并将其看成一个随机变量 (其随机性来自于样本的随机性). 则在原假设 $H_{0}$ 下, $\hat{P}$ 服从怎样的分布?
2.	用随机变量 $\hat{P}_{M}$ 表示 A 按照上述策略最终获得的 $p$ 值. 若原假设 $H_{0}$ 成立 (也就是说新方法是无效的), 则 $\hat{P}_{M}$ 服从怎样的分布? A 按照上述策略最终能够获得 $\hat{P}_{M} < 0.05$ 的实验结果的概率是多少?
3.	A 最终获得了 $\hat{P}_{M} < 0.05$ 的实验结果并将成果发表在了领域内顶刊上, 但遭到了同行质疑, 经过调查后 A 承认了上述 $p$ -hacking 的行为. 某同行 B 希望基于 A 公开发表的实验数据算出一个合理的 $p$ 值, 故考虑用一个因子 $c > 1$ 与 $\hat{P}_{M}$ 相乘来进行修正. 试求出一个 $c$ 值使得 $P_{H_{0}} (c \hat{P}_{M} < α) \leq α, \forall α \in] 0, 1 [$ 成立.

名字空间

视图

9.6. 习题选编