1.1. 随机试验

在现实生活中, 我们经常会遇到各种具有不确定性的现象, 这些现象难以在事前被准确地预测出来. 产生不确定性的原因可以是多方面的, 例如我们可能缺乏足够的数据, 或是现象背后的物理机制过于复杂, 从而难以进行准确的预测; 又如现象背后的物理机制本身具有内在的不确定性, 使得我们从原理上就不可能得出确定的结论. 但对于某些不确定性现象, 我们发现其背后具有一定的统计规律性. 具体而言, 这些具有统计规律性的不确定性现象具有如下特点:

1.

一定程度的可重复性: 导致不确定性现象的过程可以在 (近似) 相同的条件下被重复执行, 且下一次重复的过程可以认为不受到之前过程的影响.

2.

具备较为规律的 “平均行为”: 导致不确定性现象的过程在被重复足够多的次数以后, 对所得到的结果进行统计, 会发现它们的 “平均行为” 具有收敛于一确定规律的趋势.

例 1.1.1. 考虑一悬浮在水中的花粉粒, 观察其在一段长度固定的时间 内的运动轨迹. 我们会发现, 花粉粒在这段时间内的轨迹难以预测, 却具有上述意义下的统计规律性:

1.

获得花粉粒轨迹的过程具有一定的可重复性: 我们固定温度、气压等环境因素, 并且每次在观测时间达到 之后, 将花粉移回至某个起始位置, 再经过足够长时间后, 重新进行持续时间为 的花粉粒轨迹观测, 则可以认为后一次的观测过程是对前一次观测的重复, 并且两次观测之间互相没有影响.

2.

对花粉粒的轨迹进行足够多次 (例如 次) 观测以后, 对每个 , 计算如下量:

在第 次观测中, 若花粉在时间段 内的位移大小曾经超过 , 则令 , 否则令 .

次观测中, 花粉在时间段 内的总位移 .

次观测中, 花粉在前 的时间段内的位移 与后 时间段内的位移 .

次观测中, 花粉的位移大小第一次大于 时所耗费的时间 (若花粉的位移大小始终小于 , 则令 ).

我们发现, 如下平均量 足够大时均有收敛于一个定值的趋势; 换句话说, 上述几个量所描述的花粉轨迹的 “平均行为” 存在规律性.

我们将那些具有统计规律性的不确定性现象称为随机现象, 并用随机试验这一概念指代可以在相同的条件下重复进行的、对随机现象进行观察的理想化过程. 我们要求随机试验的所有可能结果是确定且已知的. 需要注意的是, 随机试验不仅可以代表现实世界中的试验, 还可以代表一些理想化的思想实验.

概率论就是在对随机现象与随机试验进行定量研究的过程当中, 逐步发展起来的数学理论. 大致说来, 对于一个随机试验, 概率论用如下方式对其进行数学建模:

1.

确定随机试验的所有可能结果, 并用一个非空集合 对其进行描述. 集合 被称为样本空间.

2.

的 (某些) 子集称为事件, 若某次随机试验的结果 属于某个 , 则称在该次随机试验中发生了事件 .

3.

对每一个事件 赋予一概率 , 用来刻画随机试验的统计规律性. 具体来说, 假设我们重复了 次随机试验, 将其中事件 发生的次数记为 , 则事件 在这 次试验中发生的频率理想情况下, 我们希望概率 等于 趋向无穷大时的频率 的极限值.

上述过程中涉及到一些概率论的基本概念, 包括样本空间、事件、概率等等, 将在 1.3 节进行更为严格的定义. 需要注意的是, 现实世界中我们只可能对随机试验重复有限多次, 理论上我们是没有办法从无穷多次的试验结果中求出 的. 一般来说, 确定一个事件的概率 不仅涉及到基于概率论的理论推导, 还可能涉及到超出概率论范围的对具体随机现象与随机试验的认识.

注意到概率论当中的样本空间、事件等概念均涉及到集合论的相关内容, 下面一节将对概率论当中所涉及的部分集合论知识进行简短的回顾.