贝叶斯统计基本观点

总结贝叶斯统计的基本观点。

1.关于统计是什么,经典统计学和贝叶斯统计的分歧。英语中的“统计”(Statistics)一词来源于拉丁语status,是指各种现象的状态或状况,现象学观点现象是直接世界的反应,统计便是直接去追寻这一现象。经典统计认为,统计的量是基于测度论上的频率函数映射,当频率趋近无穷时,概率可得一个具体的常量,要统计概率需要总体信息,即趋向于无穷的样本个数,以及抽样信息,来自于具体现象群的信息总和,这种统计学派称为频率学派,也是目前应用最广的一种统计方法,通过大数据构建函数,以求得具体的值。贝叶斯学派在统计定义上也认为统计的是世界的直观现象,但是这个现象是一类基于样本和先验、总体的似然函数,也就是现实世界不是确定的值,而是一个处于随时变化的量,这点于频率学派是相同的,基于样本和总体的函数,但是贝叶斯拥有先验信息,也就是主观的对世界的认识,这导致在描述现象时,可能出现分歧,频率学派的观点是以样本求总体的常量(虽然构建函数,但随着样本量增大愈发趋向整体,则函数的估计是一定的),贝叶斯是以先验、样本乃至先前大样本构成的总体推算后验函数(这里需要求的就不是具体值,而是关于所求统计数据的函数),样本量的增加仅仅导致主观概率占比的缩小,也会愈加趋向整体,但先验主观概率仍然在发挥作用,也就是世界并不是客观实体,而是主观上有影响的。

2.关于似然函数。在求具体统计值时,会构建一个具有样本量和所求统计量的联合密度函数,这里样本值可用总体的公式带入,并获得总体信息,通过此函数利用贝叶斯公式和贝叶斯假设,构建一个基于样本量、总体、先验的后验密度函数,这个函数中统计量是一个随机变量,会随样本数值的变化随时发生变化,在样本量增加到无穷时,先验影响会无限减少,但是具有较强先验数值的仍然会造成影响。经典学派在求极大似然函数时,将所求统计量作为一个随机变量,利用微分等方法,求得该统计量,但是在做推断、假设检验、估计时,仍然将所求统计量视为是总体的无偏估计量,但这是建立在趋近于无穷的大量样本下构建出来的,现实中样本量往往存在着不足。

3.关于统计推断。点估计在经典统计中估计的是某个统计量的值,往往采用就极大似然估计,即使密度函数达到最大的量,就更为合理,出现的概率最高,这也叫极大似然估计,这是这个极大似然估计的量就变成了常量,这便是点估计,其问题是这个估计中对某一点的期望取值是基于样本区间的,而经典统计要求的无偏统计量,样本需要趋向无限大,还要基于总体分布考虑现实没有出现的情况,现实中不存在这样的样本,那么这个无偏统计量就不是真正的无偏。在贝叶斯统计中,推断是基于已经出现的样本和先验联合计算的,认为未出现的样本与推断无关,这种方法称为条件方法,有最大后验估计、后验期望估计、后验中位数估计。在区间估计中,经典统计的量是一定的,需要确定的是区间变化的情况,样本是变量,也就是区间在发生变化,能确定的只是区间的概率,而不是统计量的概率,即100次有95次这个区间能够盖住这个值,而不是这个值在这个区间出现存在95%的概率。在贝叶斯统计中,统计量由于是基于后验进行运算随机变量,通过对该统计量的区间进行积分,便能算出这个区间内的概率,通过不断趋近概率达到95%的值,在最小的区间有这个最大值,且区间外不存在比区间内大的值时,称为最大后验密度可信区间,当密度函数存在单峰时,可通过建立程序不断趋近,最后得到的这个区间,便是通常意义上人们认为这个值可能存在的区间。假设检验中,经典统计常常为了拒绝原假设而构建,当原假设存在明显错误时,很容易得到显著性结果,但是当原假设与备择假设差距不大时,无法得到显著性结果,但是确实存在差别,犯Ⅰ型(弃真)错误,而且构建需要检验统计量函数的方式不一致也会影响结果。贝叶斯统计是基于后验进行运算的,对于统计量已经有了一个函数,通过进行原假设和备择假设的除法对比,不需要再构建检验的函数,直接得到接受某个值的概率。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容