1.5. 古典概型

对于一个只有有限个结果的随机试验, 若我们没有证据指出其中的某个结果会比其它结果更有可能发生, 则通常将这个随机试验用古典概型 (classical probability) 进行建模. 在古典概型中, 取样本空间为 , 其中 代表该随机试验的 个结果, 事件域 取为 (即 的所有子集都是事件), 概率测度 则由给出, 其中我们用 表示集合 中元素的个数. 不难验证上述 的确满足定义 1.3.2, 此外也就是说每个仅包含单个试验结果的事件都具有相同的概率 .

由于古典概型中的概率与计数直接相关, 因此关于古典概型的概率论问题通常会用到组合计数的诸多方法. 接下来我们对一些基本的组合计数方法进行简要回顾; 相关结果更详细的介绍以及证明可参考 [3] [4] 等教材.

乘法原理: 设某个试验共包括 个依次执行的阶段, 其中

1.

第 1 个阶段总共有 个可能的结果;

2.

在完成前 个阶段并得到一个相应的结果后, 第 个阶段将总共有 个可能的结果.

则该试验总共有 个可能的结果.

加法原理: 设完成某个试验有 种不同的途径, 且只能在这 种途径中选一种来完成该试验. 若采取第 种途径时总共有 个可能的结果, 则该试验总共有 个可能的结果.

排列: 假设有 个不同的个体, 我们需要从中选出 个个体并将它们排成一个序列. 则总共有个可能的排列方式.

组合: 假设一个集合包含 个不同的元素, 我们需要从中选出 个元素构成一个子集. 则可能得到的子集总共有个. 上式给出的正整数又被称作二项式系数 (binomial coefficient), 记作 , 这是因为二项式定理给出

多项式系数: 给定一组自然数 以及 , 相应的多项式系数 (multinomial coefficient) 被定义为多项式系数的含义可以有如下两种解释:

设总共有 类对象, 其中第 类对象包含 个不可区分的个体, 我们需要将这 个个体排成一个序列. 则可以证明, 可能的排列方式总共有 个.

设一个集合 总共有 个元素, 我们需要将这个集合划分为 个互不相交的子集 , 其中要求子集 包含 个元素. 则可以证明, 可能的子集划分方式总共有 个.

实际上, 第一种解释下的排列方式与第二种解释下的子集划分方式有一一对应关系: 给定第一种解释下的任一排列方式, 将其中第 个位置上的个体的类别记为 , 那么对于集合 , 通过将每个元素 分到子集 当中, 即可对应到一个子集划分方式, 且不难看出这是个一一对应关系.

此外, 多项式系数还出现在多项式定理当中: 其中的求和遍历所有满足 的自然数 .

例 1.5.1 (Banach 火柴盒问题). Banach 火柴盒问题 (Banach matchbox problem) 的表述如下: 一个人有两个火柴盒, 一开始每个火柴盒里有 根火柴, 之后每次随机选择一个火柴盒并从里面取 根火柴, 直到某次取火柴时发现那个待取的火柴盒已经空了, 求此时另一个火柴盒里还剩 根火柴的概率.

首先注意到如下事实: 若取火柴时发现待取火柴盒已空而另一个火柴盒还剩 根火柴, 则此时必定是第 次取火柴; 反之, 若第 次取火柴时发现待取火柴盒已空, 那么另一个火柴盒必定剩余 根火柴. 此外, 整个试验中取火柴的总次数 (包括发现火柴盒空了的这一次) 不会超过 . 基于以上观察, 我们可以把原问题变换成如下等价的问题: 一个人独立重复地抛 次均匀硬币, 并将其结果记录为多元组 , 其中 , 则 当中恰好出现 的概率是多少?

对于变换后的问题, 显然可以令并取 为古典概型, 其中每个 的单点集的概率为 . 记事件, 故 中的元素可以用如下方法不重不漏地构造出来: 首先从 中取出 个分量并将它们的值赋为 , 其余 个分量赋值为 ; 再令 ; 最后依次对 赋值 . 由乘法公式与排列数公式可得 的元素个数为由对称性可得 包含相同多的元素, 故最终有