谭升
非主流人工智能科学家 我和外面那些妖艳的货不一样

【概率论】6-1:大样本介绍(Large Random Samples Introduction)

大样本介绍

身着简陋而举止优雅,身着华丽而举止粗俗,比选其一的话,我更愿意尊重第一种类型。
本章我们介绍一些近似的结果,简化大量随机样本的分析。

大样本介绍 Introduction

本文通过两个例子来举例两个不同的分析方向,并有不同的分析工具。


🌰 :
扔一个硬币,你可能感觉出现正反面的概率基本相同,也就是出现正面的概率大概是 $\frac{1}{2}$ ,然而,当你扔10次,出现五次正面的可能性不一定很大。如果你扔100次,也不一定出现正好的50次正面。多次扔硬币的过程可以通过我们前面介绍的二项分布来建模,参数是扔硬币的次数 $n$ 和正面出现的概率 $\frac{1}{2}$ 。那么上述两种情况的概率:
$$
Pr(X=5)=\begin{pmatrix}10\\5\end{pmatrix}(\frac{1}{2})^{5}(1-\frac{1}{2})^{5}=0.2461\tag{1}
$$
100次其中50次的概率
$$
Pr(Y=50)=\begin{pmatrix}100\\50\end{pmatrix}(\frac{1}{2})^{50}(1-\frac{1}{2})^{50}=0.0796\tag{2}
$$

可见在一定次数 $n$ 的独立实验中,出现 $n/2$ 的次数的概率并不大,并且试验次数越多,这个概率越小。
但是如果我们把这个概率稍微移动一下,产生一个区间,那么这个概率会急剧上升。

$$
Pr(0.4\leq \frac{Y}{100}\leq 0.6)=Pr(40\leq Y\leq 60)=\sum^{60}_{i=40}\begin{pmatrix}100\\i\end{pmatrix}(\frac{1}{2})^{i}(1-\frac{1}{2})^{100-i}=0.9648
$$

即使n不大的到时候

$$
Pr(0.4\leq \frac{X}{10}\leq 0.6)=Pr(4\leq X\leq 6)=\sum^{6}_{i=4}\begin{pmatrix}10\\i\end{pmatrix}(\frac{1}{2})^{i}(1-\frac{1}{2})^{10-i}=0.6563
$$

可见,同样的独立试验次数n越大的时候,在 $\frac{1}{2}$ 附近(比如 $[0.4,0.6]$) 的概率越大。


上述例子简单就简单在每次试验都是独立的伯努利分布,且概率固定。接下来这个例子稍微复杂一点。


🌰 :
一个队列的客户,第 $i$ 个客户在队列中等待 $X_i$ 其是随机变量,假设 $X_1,X_2,\dots$ 是i.i.d的,其是 $[0,1]$ 上的均匀分布,等待的期望是 0.5,所以当用户样本数量足够大的时候这些样本的均值越接近0.5 。但是多个样本的均值的分布其实是很复杂的,可能没办法准确的描述多个样本的均值与0.5的接近程度。


大数定理会给出数学基础来证明一些随机变量的大量样本的均值,接近于他们的期望。
中心极限定理来给出样本的均值来近似期望的概率。

总结

本文给出本章的研究方向,和基本研究背景。

Share

You may also like...

说点什么

avatar
  Subscribe  
提醒

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!