7. 参数估计 I: 点估计
本章以及下一章中, 我们对数理统计中的参数估计 (parameter estimation) 问题进行介绍. 在参数估计问题中, 我们假设总体的概率分布未知, 但可以由某个参数 所唯一确定, 也就是说, 总体可以表示为形如 的分布函数 (也可以是形如 的分布列或形如 的概率密度函数). 这个未知参数 可以是一个标量, 也可以是一个多维向量, 而不同的参数值 对应于不同的概率分布 1. 我们用 来表示所有可能的参数取值构成的集合. 现假设我们已经获取了该总体的一组样本, 那么应该如何根据样本的值, 来对这个总体的真实参数值, 或者是真实参数值的某个函数值进行推断?
例 7.1. 假设我们想要用温度传感器测量某个恒温箱中的温度. 由于测量原理以及仪器精度限制, 传感器给出的测量值 带有一定的随机性, 它服从期望为真实温度、方差为 的正态分布, 其中 已经由传感器生产厂家给出. 已知 为恒温箱温度的最小与最大可能取值. 我们希望通过对恒温箱中的温度进行多次测量, 来对真实温度进行推断.
上述问题可以转化为如下参数估计问题: 总体的概率密度函数可以表示为其中 为未知的参数, 它的取值范围为区间 . 通过多次测量可获得该总体的一组样本 , 我们希望基于样本 对未知参数 进行估计.
例 7.2. 依然考虑例 7.1 的情况, 然而这次我们假设测量值 的方差也是未知的, 只知道它大于 . 这种情况下, 我们需要把期望 与方差 均作为未知参数: 其中 , 而方差的范围可以取为 . 但另一方面, 若我们只关心真实温度的值, 那么只需要对未知参数 的函数值 进行估计即可.
目录
脚注
1. | ^ 一些实际问题中可能会出现同一个概率分布可由不同的参数值表示的情形. 本讲义中不对这类情况下的参数估计问题进行讨论. |