01
贝叶斯主义科学观
任何科学理论,都是有可能被证伪的,即使是牛顿的经典力学这样伟大的理论,最后也被证明是有适用条件的。所以在贝叶斯主义的科学观看来,一套科学理论的是对是错,是一个概率问题。
这个说法来源于数学上的一个理论,叫贝叶斯理论。
这个理论的精髓就是,我们可以根据新出现的证据,来描述一件事情发生概率的变化。整个调整的过程,是要根据一套严格的数学公式来进行计算的。
02
贝叶斯科学观与机器学习思维
很多人认为:“贝叶斯主义的科学观存在着一个非常严重的问题,因为在贝叶斯理论的算法中,我们必须要先给一个理论赋予一个概率,再来进行计算”,认为这是一个主观设定概率会影响最终的结果。
但是,随着机器学习的思路的出现,我感觉贝叶斯科学观也正体现了这种机器学习观念:这个概率刚开始可能是认为主观设定的,设置可能误差很大的,但是,随着新的事实不断出现,通过“机器”不断的学习,这个概率会越来越接近真实的情况。
03
频率学派
对概率的定义:在大量重复进行同一实验事件A发生的频率总是接近某一个常数,并在它附近进行摆动,这时将这个常数叫事件A的概率,记作P(A)。频率学派在评估不可重复实验事件发生的概率具有很大的限制性。
频率派认为参数是客观存在,不会改变,虽然未知,但却是固定值
04
贝叶斯学派
对概率的定义:贝叶斯学派评估事件A发生的概率带有主观性,且事件A发生的概率是当前观测数据集D下的概率,即条件概率P(A|D),当观测数据集更新为D1时,则事件A发生的概率为P(A|D1),不同的数据集预测A事件发生的概率不同。贝叶斯学派评估事件A发生的概率会引用先验概率和后验概率两个概念,贝叶斯定理是搭建先验概率和后验概率的桥梁。
定义包含了三个要点:
(1)、事件A发生的概率是变化的,并非常数。
(2)、事件A发生的概率是特定数据集下的条件概率。
(3)、事件A发生的概率是后验概率,且事件A发生的先验概率已给定。
P(A|B)为已知事件B下A发生的概率,称为后验概率;等式右边分子部分P(A)为事件A发生的概率,称为先验概率。贝叶斯定理是先验概率和后验概率转换的桥梁。
05
频率学派和贝叶斯学派在评估模型参数的异同
相同点:最大似然函数在频率学派和贝叶斯学派都具有重要的作用。
不同点:频率学派认为模型是一成不变的,即模型参数是个常数;贝叶斯学派认为模型是一直在变的,当获取新的信息后,模型也相应的在改变,即模型参数是个变量,用概率去描述模型参数的不确定性。
频率派最常关心的是似然函数,而贝叶斯派最常关心的是后验分布。
贝叶斯派因为所有的参数都是随机变量,都有分布,因此可以使用一些基于采样的方法(如MCMC)使得我们更容易构建复杂模型。
频率派的优点则是没有假设一个先验分布,因此更加客观,也更加无偏,在一些保守的领域(比如制药业、法律)比贝叶斯方法更受到信任。
参考文章