【数理统计学简史】2.1 狄莫弗研究的动因

Abstract: 本文介绍狄莫弗研究二项概率的动机,和伯努利大数定律产生联系的过程
Keywords: 狄莫弗,狄莫弗公式,二项概率,大数定律

狄莫弗的研究动因

亚伯拉罕·狄莫弗出生在法国一个新教徒家中,19岁时因为宗教信仰问题被抓入狱,在狱中度过了两年,为了避免迫害,21岁流亡伦敦,担任一名教师,在哪里他在教课的空余继续研习数学,主要是阅读刚出版不就的牛顿著作《自然哲学的数学原理》,他在数学领域取得多方面成就,并使他于 1697年 当选为英国皇家学会会员,这年他刚三十岁,他的一项著名结果,用他名字命名的公式:
$$
(\text{cos}\theta+i\text{sin}\theta)^n=\text{cos}n\theta+i\text{sin}\theta
$$
不过当时他没把公式写成这个样子。

1718年狄莫弗出版了《机遇论》(Doctrine of Chances)此书奠定了他在概率史上的地位,此书共三个版本1718年1738年1756年。人们说较早期的概率史上有三部里程碑性质的著作:

  • 《推测术》——伯努利
  • 《机遇论》——狄莫弗
  • 《概率的分析理论》——拉普拉斯

有意思的是,狄莫弗研究二项概率并不受到伯努利的影响,反而,1718年版本的《机遇论》表明,他对伯努利的工作颇有一些看法,说白了就是对伯努利的研究没啥感觉,狄莫弗注意到这个问题纯属偶然:

1712年,一名叫亚历山大·喀明的人向狄莫弗提出一个问题:二人在甲家的地盘赌博,A每局获胜的概率是 $p$ ,B获胜的概率是 $q=1-p$ ,赌 $N$ 局,用 $X$ 表示A获胜的局数,约定:如果 $X\geq Np$ ,那么A付给甲 $X-Np$ 元,如果 $X<Np$ 那么 B付给甲 $(N-X)-Nq=Np-X$ 元,问甲所得的期望是多少。

提出这个问题的明显是个想开赌场的。不管结果,赢的多的一方要给甲服务费,而甲还很关系自己能收到多少服务费,所以希望狄莫弗帮忙算下期望。
根据问题,数学化后就是求下面的期望:
$$
D_n=E(|X-Np|)=\sum_{i=1}^{N}|i-Np|b(N,p,i)
$$
这里的 $b(N,p,i)$ 就是二项概率 $C^{N}_{i}p^i(1-p)^{N-i}$ 的函数形式。
狄莫弗在 $Np$ 为整数的条件下得到了下面的结论:
$$
D_N=2Npqb(N,q,Np)\tag{2}
$$
并且他只给 $p=\frac{1}{2}$ 的特例给出了证明,不过证明方法很容易推广到其他情况下,狄莫弗生成此公式在1721年提出,但是发表在1730年,现在我们可以在一般情况下证明:
$$
D_N=2\mu qb(N,p,Np)\\
\mu=[Np]+1\tag{3}
$$
其中 $[a]$ 这个表示为向下取整,也就是小于等于 $a$ 的最小整数。
容易验证, $Np$ 为整数时,公式(2)(3)是一致的。
这就完全回答了喀明的问题,但是 $N$ 较大的时候, $b(N,p,i)$ 不好算啊。所以狄莫想找到一种能便于计算的近似公式,他对这个问题进行讨论之前,对上面的公式做了点讨论( 其实是从 $D_n=E(|X-Np|)=\sum_{i=1}^{N}|i-Np|b(N,p,i)$ 得到的),记:
$$
K_N=E(|\frac{X}{N}-p|)=\frac{D_N}{N}
$$
则由(2)公式,可以得到:
$$
K_N=2pqb(N,p,Np)
$$
容易证明(证明过程可以参考陈希孺《数理统计学简史》p47的注4):
$$
lim_{N\to \infty}b(N,p,Np)=0
$$
这个证明可以用初等办法进行,而不必使用斯特林公式(斯特林公式在我们的基础概率论中有提到,但是当时是选学内容),由此可以得到 $lim_{N\to \infty}K_N=0$ 再因为 $P(|\frac{X}{N}-p|\geq \varepsilon)\leq \varepsilon^{-1}K_N$ 可以得到 $lim_{N\to \infty}P(|\frac{X}{N}-p|\geq \varepsilon)=0$ 。
没错,这就是伯努利的大数定理,当然这个证明方法与切比雪夫不等式证明方法类似,但是当时还没有方差这个东西。
狄莫弗继续证明了,当 $N\to \infty$ 的时候, $b(N,p,Np)$ 是以 $\frac{1}{\sqrt{N}}$ 的速度趋于 0 的,因此 $K_N$ 也是以同一速度趋于0,这可以解释为: 频率 $\frac{X}{N}$ 估计概率 $p$ 的精度,大致上和试验次数 $N$ 的平方根成比例,而不是当时看起来和 $N$ 成比例。后面我们还要继续研究这个问题。

0%