如何理解贝叶斯公式

1.条件概率公式

        设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率为:

                                                          P(A|B) = \frac{P(AB)}{P(B)}

一般事件A和B是同一实验下,不同结果组成的合集

韦恩图1

根据韦恩图来理解一下:“事件B发生的条件下,事件A发生的条件概率”。“事件B发生” = 样本的可选范围限制在B圈中,在这个情况下,A发生的概率(P(A|B)) = AB交集的样本数/B的样本数,通过分母相消,简化成概率相除。

2.乘法公式

        由条件概率得:

                                P(AB)=P(A|B)\bullet P(B) = P(B|A) \bullet P(A)

进一步推广得:对于任意正整数n \geq 2,当P(A_1A_2...A_{n-1})>0时,有:

       P(A_1A_2...A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1A_2)...P(A_n|A_1...A_{n-1})

3.全概率公式

        事件组B_1,...B_5满足:

            1. B_1,...B_5两两互斥,即B_i \cap B_j = \emptyset, i \neq jP(B_i) >0

            2. B_1\cup B_2... = \Omega

则称事件组B_1,...B_5样本空间的\Omega的一个划分。

全概率公式:B_1,...B_5是样本空间\Omega的一个划分,A为任一事件,则:        

                                               P(A)=\sum_{i=1}^{\infty}P(B_i)P(A|B_i)

通俗讲,A发生的概率 = B_i发生的条件下A发生的概率和。


韦恩图2

某实验样本的集合为\Omega,圆圈A代表事件所能囊括的所有样本,B_1,...B_5\Omega的一个划分,A的样本数目可以通过与Bi的交集来获得,=(A∩B1的样本数)+(A∩B2的样本数)+····+(A∩Bn的样本数)。样本数公式和概率公式,本质上是一样的东西。

4.贝叶斯公式

        贝叶斯公式:B_1,...B_5是样本空间\Omega 的一个划分,则对任一事件A,有

                                         P(B_i|A)=\frac{P(B_i)P(A|B_i)} {\sum_{j=1}^{n}P(B_{j}) P(A|B_{j}) } = \frac{P(B_i)P(A|B_i)} {P(A)}

贝叶斯公式=全概率公式+乘法公式。解释:当事件A发生(或A为真)的条件下,B_i发生(或B_i为真)的概率。是在反溯事件发生的原因。



三蓝一棕对于贝叶斯公式的解释

1.小华的工作是什么?

小华很害羞而且性格孤僻,虽然乐于助人,但却对周围的人或现实世界不太感兴趣。一个温顺而又井井有条的人,他做事条理性喜,热衷于钻研细节。综上,你认为“小华是一个图书管理员”或者“小华是一个农民”那个概率大?

小华

答:小华是农民的概率大。下面我们使用贝叶斯公式来算一下

2.贝叶斯攻势下小华的工作是什么?

a.在没有限制条件下,问:小华是什么工作?(这里我们假设只有管理员和农民两个选项)

答:农民,根据国家统计局2017年发布数据,中国共有5.7亿农村人口,去除2.3亿外出务工人员,真正职业为农民的人数为3.4亿。中国的图书管理员人数为0.37亿(我瞎说的,计算方便)。那么小华是农民的概率为:3.4/(3.4+0.37)=90%,是管理员的概率为:0.1。

b.那么根据条件1,问:小华的工作是什么?

答:农民,根据我们的认知,图书管理员中符合条件1描述的比例大概为40%,用概率论的公式表示:P(条件1|管理员)=0.4。农民中符合条件1描述的比例大概为10%(我知道“我爱发明”中有很多热爱钻研的农民,不用提醒我),用概率论的公式表示:P(条件1|农民)=0.1。假设全国总人数为100,那么农民为90人,管理员为10人。在根据条件1的概率,符合条件1的农民:90*10%=9人,符合条件1的管理员:10*40%=4人,所以农民的概率大。

根据贝叶斯公式:

在满足条件1的情况下(条件1为真时),小华是图书馆员的概率:

\begin{align}P(管理员|条件1) & = \frac{ P(管理员)*P(条件1|管理员)} {P(管理员)*P(条件1|管理员)+P(农民)*P(条件1|农民)} \\& = \frac{0.1*0.4}{0.1*0.4+0.9*0.1}  \\& = 30 \% \\ & = \frac{ P(管理员)*P(条件1|管理员)} { P(条件1)}\end{align}

注:其中,农民和管理员在总人数的比例我们称之为:先验概率。

c.条件2:小华爱好书法,问:小华的工作是什么?

答:管理员。当a,b中的条件为真时,图书管理员爱好书法的概率为50%,农民爱好书法的概率为10%。那么根据贝叶斯公式:“小华爱好书法” 为真,则小华的工作是图书管理员的概率:

                       \begin{align}P(管理员| 条件2 ) & = \frac{ P(管理员)*P(条件2 |管理员)} { P(条件2) } \\& = \frac{0.3*0.5}{0.3*0.5+0.7*0.1}  \\& = 68 \% \\\end{align}

注:其中,满足问题ab的农民和管理员人数之比例我们称之为:先验概率。


所以,小华到底是干嘛的?

问题的关键不是在于,人们对图书管理员和农民的形象认识是否有偏差,而是在于,一般人做判断的时候,没人把农民和图书管理员的比例信息考虑进去,这个比例是否准确不重要,重要的是,你是否考虑过。如果你考虑了,最起码可以做一个粗略的估计,所以,理性不是说知道事实,而是知道哪些因素会影响事实。

The upshot, and this is the key mantra underlying Bayes' theorem, is that new evidence does not completely determine your beliefs in a vacuum; it should update prior beliefs

                                                                                                           —— 3Blue1Brown

贝叶斯定理的含义:新证据不能直接凭空的决定你的看法,而是应该更新你的先验看法

鸣谢:B站up主:3Blue1Brown,传送门: https://www.bilibili.com/video/av84799361

3.你是否患有肝癌?狼是否来了?


来自 概率论与数理统计--茆诗松


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容