谭升
非主流人工智能科学家 我和外面那些妖艳的货不一样

【概率论】1-0:概率论介绍

概率论介绍

虽然我很冷静,但外面确实一片歌舞升平,各种AI应用如雨后春笋,各路AI大神伪大神如跳梁小丑各种雷人的说法也是层出不穷,有些行业确实要看谁的跑的快,但是有些确实需要看谁跑的更远,当方向明确的时候需要跑得快,方向不明的时候需要的是探路。

概率是什么

世界上有确定一定要发生的事么?有,按照目前人类能理解的自然,有些公理是确定要发生的,所以公理是不证自明的,比如生老病死,这些事对于生物来说是一定会发生的,但是更多事是不太确定的,今天下不下雨?明天有没有雾霾?后天拆不拆迁?
这里插播一条有点跑题的话,忘了哪本书曾经说过,人类的文明发展的任务主线是理解自然,比如我们最开始的宗教,哲学,以及最近的科学,所有的这些都是在解释自然现象,近代科学发展迅速的原因是因为科学,尤其是数学物理的发展,一些列结果表明科学可以更准确的描述和预测自然结果,没错概率论的任务很贴近上述的描述。
观察我们周围不确定事远远多于确定的事,当我们严格的定义了一件事的条件后(不存在模棱两可的词语),考虑这个条件产生结果的时候,这些结果一般是多个中的一个,虽然完全无法确定哪结果个会发生,扔硬币,扔骰子,但这些结果范围完全确定,概率论能帮我们确定么?不能,但是概率论能帮我们描述这个结果集,也就是某个结果出现的可能性是多少(用数字来描述发生的可能性,0~1,越接近0表示发生的可能性越小,越接近1表示发生的可能性越大)。

试验与事件

在我们深入研究概率是什么之前,我们先学习概率论从头到尾都要用的两个概念,试验和事件,从我们传统教育的角度来讲,这两个概念比本文其他讨论的知识都重要,因为这个是考点,当然我认为其他的知识同样重要,这两个概念要从始至终的跟随我们,但是其他知识告诉我们的是关于这个学科的整体思路,同样重要。

Advertisements

试验 Experiments

Definition:An experiment is any process,real or hypothetical,in which the possible outcomes can be identified ahead of time

试验可以使假设的也可以是实际的,但是他们的结果范围必须要已知。

最简单的real例子就是丢硬币,结果可能是正面,反面,或者立着;hypothetical的例子就是有一个不能立起来的硬币,丢硬币的结果就是“正、反面”,不存在“立着”的结果。
概率中实际的试验更有意义,因为我们的目的就是研究自然中实际存在的问题,当然有时候需要用hypothetical来建模实际的试验。

事件,随机事件,偶然事件 Events

An event is a well-defined set of possible outcomes of the experiment

事件是个集合!事件是个集合!事件是个集合!
事件相对于试验来说后面用到的更多,当我们描述一个过程的时候试验是描述条件,对应的我们知道结果集,事件的就是被完备定义的结果集合的子集。
解释一下:我们定义或者已知了试验,并对试验结果了如指掌,我们知道并且确定实验结果组成的集合X,那么事件就是X的子集x,数学描述:
$$x={x|x\in X,P(x)=1}$$
其中P就是我们的well-define的抽象写法,可以看成是函数P:
$$
P(x)=
\begin{cases}
0& \text{x 不满足well-defined的定义 }\\
1& \text{x 满足well-defined的定义 }
\end{cases}
$$

概率只有针对事件的时候才有意义
举几个🌰 :
1. 扔硬币10次,出现五次正面的概率是多少?
2. Thomas Jefferson出生在1741的概率是多少?

分析:
1. 例1中事件是出现五次正面,outcome集合是可以出现1次2次…10次
2. 例2中的时间是出生在1741年,outcome集合是可以出生于人类出现那年~2019年

注意,event可以是空集哦

必然事件

肯定会发生的,扔骰子,点数小于7的事件是肯定发生的,也即必然事件是所有outcome的全集

不可能事件

不可能事件对应必然事件,那就是其是个空集,比如扔骰子结果是-1点数的这个事件,或者结果既是基数又是偶数这个事件。

试验与事件

这两个概念之间还有一些其他的内容,这里补充一下,试验有的时候是人工的,比如扔硬币,但有时候是不参与的,比如下雨,如果我们不参与试验只是记录试验结果,这类试验可以叫做“观察”,在概率论中可能没啥区别,但是在数理统计里面有区别。
上面例子2中我们不能明确的确定全部可能的outcome(我们不知道人类哪年出现的),但是结果范围不会超出某个范围,后面随机变量出现的时候就是把这范围进一步的用数学抽象,处理起来就更方便了。

关于概率的几种观点

对于概率的定义,目前没有明确的一种定义被证明是真理而且他定义是谬论,而且这个问题的讨论也不是我们目前这个阶段要考虑的,很多事物我们并不知道其本身是什么,但我们却在研究事物之间的关系。以下几种观点可以从不同角度学派来定义概率

频率派解释 The Frequency Interpretation

频率派认为:事件的概率就是经过大量重复试验后,此事件出现的次数与试验总次数的比,也就是事件出现的频率,这个定义非常模糊,比如大量试验,多大算大?一万次?一亿次?而且当我们用一万次试验定义某个事件概率后,又进行了一万次试验很有可能结果不一,也就是按照一个定义做了两次,结果自相矛盾,那么这个定义是定义不成功的,但是这两个结果应该非常接近,或者说他们很接近真理了。
频率派和统计派是一个派。

古典派解释 The Classical Interpretation

古典概率派:认为假设所有结果等可能性出现,然后每个结果出现的概率就是结果的个数分之一。
这个定义有点搞笑的是里面出现了可能性这个字,而我们要定义的就是可能性,换种说法让他们定义人的话,他们会说:有一种是人的生物叫做人。这逻辑,神了吧
而且等可能性这个事情本身就不可能发生,比如扔硬币,你觉得可能出现正反面的可能性一致,但其实考虑到硬币两面不同的样式,以及重心的微弱变化,其结果不可能是完全等可能的。
但是这个古典派定义是很有用在于我们后面要反复研究丢硬币,扔骰子来引出各种其他的概念

主观概率 The Subjective Interpretation

主观概率,这个更有意思了,是我们猜一个事件的概率,比如我们猜测一下一会儿下雨的可能性,张三可能是个老人家,他在这里住了一辈子,他估计下雨的可能性是70%因为他很了解这个地方的天气,李四刚来本地,他说下雨的可能性是60%,他不熟悉本地天气,但是他根据他的人生经验给出了一个概率,在问一个刚说话的小朋友一会儿下雨的概率是多少,他说10%,没人信,他根本不知道10%什么意思,但是这也是他主观的概率。
事实上主观概率对于这个实验的概率计算没啥帮助,但是并不是完全没有用的,我们可以通过这个概率来研究这些人的某些性质,比如民调,那些万恶的不自由没人权的资本主义国家大选的时候不就经常搞个民调,研究下大家觉得谁更有可能当总统。

公理化概率 The Axiomatic Interpretation

数学公理化是近代数学的主要发展方向,所以概率这么大的学科肯定也要进行公理化。
伟大的前苏联数学家柯尔莫哥洛夫通过极为简单的若干个公理作为基础,建立了概率论的宏伟大厦。
后面我们关于概率的定义会引用柯氏公理,但是我们要知道柯氏公理的意义在于他用数学手段严格了数学化的概率论。

我们并不能说上述四个角度的优劣,频率派,古典派这些我们都要进行一定研究,能够准确的解决自然问题的都是好的,所以在没有严格证伪的前提下,都要进行研究。

如何研究概率论

其实这个扩展到告诉我们如何进行科学研究。
对于任何学科我们应该仔细区分理论的三个方面,这三个方面相辅相成,抛开任何一个都没办法进行研究,或者研究完全会跑偏。

形式逻辑的内容

公理化的数学只论及无定义事物见的关系,最简单的就是几何中点和线的关系,我们并不知道点是什么,也不知道线的定义是什么,但是我们可以研究这两个对象见得关系,点和线在这里是无定义的概念,我们更关系其间的关系,比如两个点确定一条直线,这是一个“规则的描述”,不同的公理系统能产生不同的规则,这样研究不同的问题就有更方便贴切的工具了,这就是公理化数学的魅力,你可以自己建立自己的体系,当然你要足够厉害。
国际象棋的例子也在于我们可以不知道每个棋子的本质是什么,甚至我们可以给他们不同的名字,不叫皇后,马什么的,改名叫a,b。。。照样可以按照规则来完成棋局,规则才是主要的,甚至我们没棋盘都能照样玩。

直观的背景

对于几何和物理,我们有非常直观的观察对象,比如对于重力,我们能观察苹果落地,对一件事很熟悉了之后我们的感官并不会感到迷茫,虽然路边的老人不懂概率论,但是你问他有多大可能性下雨的时候,他能用语言给你描述个大概,这里有部分是经验,有部分是直觉,当对某个领域非常熟悉后,直觉可能更可贵,虽然没办法用公理解释证明。
概率刚出现的时候,其结论与人们固有思维甚至统治集团的思想宣传都有冲突,但是百年之后,我们看到书上提到可能性的时候完全不会排斥,而是很轻松的就能理解其要表达的信息。

应用

应用是所有科学的最终目的,数学是抽象的工具,当要研究同一个自然现象的时候可以有无数多种抽象的数学模型:“数学理论的应用方式不依赖于事先形成的意见,他是一种有目的技术,依赖于经验,而且随经验改变”
再深入就是哲学了,我们必须剥离哲学和公理化的数学以及经验之间分别来研究,不然会跑偏。

以上三个方面是所有研究的基础思想,公理逻辑是重要的工具和原料,背景,经验灵感给了我们设计图纸,应用是我们的目的,这样捋顺一下,豁然开朗不?

概率论的核心问题

以下部分是概率论现在研究以及以后都要研究的重点,也是概率论最核心的问题!
1. 已知一个试验的所有输出及其概率,我们要确定一个方法来计算某个事件的概率。
2. 当得到附加的信息后如何调整修正当前事件的概率

总结

这是我写过的最详细的一篇介绍性文章,写了很多知识,尤其是后面如何研究概率论,对其他科目也有极大帮助,我们算是正式开启概率论了,明天继续。。。

Share

You may also like...

说点什么

avatar
  Subscribe  
提醒

试录了几节线性代数视频课程,欢迎大家支持,
点击试看
点击购买更多内容

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!