概率可以说是和生活最息息相关的数学了,从摇号买车买房、买彩票到天气预测、股票预测、人工智能等,背后都有概率的身影。那么什么是概率?在给概率下定义之前,先从日常生活中说起,我们可能会说,某楼盘摇号买房的中签率(概率)是1/400,股票上涨的概率是5%,明天下雨的概率是90%,这些话的共同点是都是在预测某件事在未来发生的可能性大小,而这个可能性的大小是用“概率”这个概念来度量的,因此概率的定义为:概率是表示某种情况(事件)出现的可能性大小的度量,值在0~1之间的,概率为0的事件为不可能事件,概率为1的事件为必然事件。这个定义符合我们的直觉,因此特别容易理解,但是对于数学来说,这个定义还是很笼统,因为还不能对概率执行各种数学运算。为此,还要引入更抽象的数学定义,不过,在正式引入数学定义之前,先介绍一些更基本的概念。
1.试验和事件
试验是一个广泛的术语,包含各种各样的人为主动做的科学实验,如抛硬币,掷骰子,公证处摇号等,也包括被动对客观事物的调查、观察,例如预测下雨情况。在概率论中,把满足以下三个特征的试验称为随机试验:
1.试验可以在相同的条件下重复进行;
2.每次试验的结果不止一个,并且能事先知道试验的所有可能结果或者虽然不知道所有结果但能知道范围 的,例如手机的寿命。所有可能结果或范围的集合称为样本空间,记为S;
3.进行一次试验之前不能确切知道哪个结果会出现。
要找到满足这三个特征的随机试验不难,一些例子如下:
1.抛2枚硬币试验,所有可能结果集合S={(正面,正面),(反面,反面),(正面,反面),(反面,正面)};
2.明天下雨情况预测,所有可能结果S={雨天,晴天,阴天,下雪,下冰雹}
3.观察明天股市情况试验,所有结果S={上涨,横盘,下跌}
4.某款手机的寿命,所有结果S={寿命>0}(这个是理论上的寿命,实际上厂家会安排2年后让手机变得很慢)
随机试验和样本空间的概念虽然是数学上的,但其实对我们的生活帮助也很大,例如碰到一件事,先想想这是不是一个随机试验,如果事情的后果有一种以上的结果,我们基本可以判断这是随机试验,那么我们就要想想,这件事可能的结果有哪些,有没有可能遗漏的,这叫三思而后行,而不是头脑发热不顾后果去做,再加上后面了解到的计算每种结果的可能性。
言归正传,我们继续看“事件”的概念。样本空间里的每一个结果称为样本点或者基本事件,一个或多个样本点或基本事件的集合构成事件。在掷骰子试验中,样本空间由6种点数的样本点构成(1,2,3,4,5,6),那么每个样本点是一个基本事件,其单个或多个组合构成事件,例如偶数点(2,4,6)构成偶数点事件,奇数点(1,3,5)构成奇数点事件。
基本概念介绍完了,现在可以来看概率的数学定义。
1.1.4 概率公理化定义
概率公理化定义是由前苏联数学家柯尔莫格罗夫完成的,定义了公理之后,大家就可以在公理所描述内容的基础上,推演出更多的内容。所谓的公理,就是不证自明的,所谓的不证自明,即他可以明确的告诉你,我就是对的,虽然看起来强词夺理,但却不是指鹿为马,硬把错误当正确且不容置疑,实际上公理符合我们的常识认知,例如两条平行直线不相交,在直觉是没有问题的。
柯尔莫格罗夫
我们来看概率柯氏公理化定义,柯氏公理体系中引入三元体(Ω,F,P),第一个元素Ω代表所有抽象集合,Ω的基本元素是ω,表示为基本事件,换句话说,Ω是由ω组成的集合。第二个元素F表示事件的集合,前面已经提过,事件是由一个和若干个基本事件构成,而每个事件有自己的发生的可能性大小,即概率的大小,概率根据事件的情况而定,换句话说,概率是事件的函数,接下来看第三个元素P即表示概率,对于F中的任意事件A的概率,用P(A)表示。概率P还必须满足以下三个公理:
A.公理1:任何事件的概率都是非负的且小于等于1,即1≥P(A)≥0
B.公理2:样本空间的概率P(Ω)=1,空集的概率P(∅)=0
C.公理 3:对任一系列互不相交的事件E1,E2,...,有P()=。
公理1说明,任何事件A的概率在0到1之间,公理2说明,Ω是必然事件,其概率定义为0,而空集作为不可能事件,其概率定义为0。到这里,我们可以看出,这把我们在最开始提到的概率定义已经包含进来了,而这里使用了更抽象的方式描述。再来看看公理3,公理3的公式看起来很不友好,其主要说的是,任意互不相交事件,至少有一事件发生的概率等于各个事件发生的概率之和。所谓的事件相交,指的是两个事件具有相同的样本点,例如掷骰子,事件A是得到点数{1,2},事件B得到的点数{1,3},因为事件A和B有共同的样本点点数1,因此事件A和事件B是相交的,我们定义事件A是得到点{1},定义事件B是得到点{2,3,4},由于A和B没有共同的样本点,因此A和B不相交,再定义一个事件C为事件A和事件B的并集,所谓的并集,表示至少事件A发生或者事件B发生,那么事件C的概率P(C)=P(A)+P(B)。