1.前言
数学一直是我的弱项,从初中到大学成绩都不好,于是累觉不爱,与数学从此绝缘。反而离开校园后,有时对某一方面的数学问题产生兴趣,就会继续追寻下去。就像这个神奇的贝叶斯定理,原理多看几遍其实很简单,但是上学那会儿怎么总是学不会呢?大概上学的时候,只是单纯的记忆公式,而数学是对现实的高度抽象,恰恰是人类大脑所不擅长的领域,而工作后带着实际问题去学习数学,符合人类从具体走向抽象的认知规律,故而能够理解。
贝叶斯定理正是在这个背景下,被我初步理解的。所以各位不要觉得涉及到数学就觉得畏惧,连我这个数学渣都能理解,其他人更是不在话下。后面会讲到,贝叶斯定理作为一个思考的框架,一种决策的工具,具有神奇的作用。这正是我们构建多元化思维模型中数学模型的一部分。
2.什么是贝叶斯定理
我们将一枚硬币抛向空中,落地时正面和反面的概率都是50%,这是常识。但如果我们抛100次,正面和反面的次数并不会都是50,有可能正面40次,反面60次。那抛1000次,10000次呢,正面反面的次数有可能还不会是五五开。只有将抛硬币无数次,正面和反面出现的次数才会趋向于相等。也就是说,正面和反面出现的概率50%是一个极限、客观的概率,并不会随着抛掷次数的增减而变化。
但是贝叶斯定理与这个精确客观的概率不同,它要求当事人估计一个主观的先验概率,再根据随后观察到的事实进行调整,随着调整次数的增加,结果将会越来越精确。这里有一个问题,数学不是讲究客观吗?这里怎么冒出一个主观概率出来?这也是当时的学者质疑贝叶斯的问题。事实上,贝叶斯定理在17世纪提出后,一直受到冷落,直到20世纪30年代电子计算机出现后才得到广泛应用。如今我们每天都在和贝叶斯定理打交道:你上搜索引擎搜寻问题,背后的算法中就有贝叶斯公式的身影;你邮箱里的垃圾邮件,很有可能就是运用贝叶斯定理帮你拦截的。
为什么会出现这种情况?因为贝叶斯定理符合人类认知事物的自然规律。我们并非生而知之,大多数时候,面对的是信息不充分、情况不确定,这个时候我们只能在有限资源的情况下,作出决定,再根据后续的发展进行修正。实际上,这也是科学研究的步骤。
说了这么多,贝叶斯定理到底长什么样啊?围观群众的小心脏可承受不起一坨挤眉弄眼的数学符号。那简单的用中文来描述一下:
后验概率=先验概率调整因子*
是不是也没这么难?没错,就是这么简单。翻译成数学语言就是:
P(A丨B)=P(A)P(B丨A)/P(B)*
这是一一对应的,P(A丨B)是后验概率,P(A)是先验概率,P(B丨A)/P(B)是调整因子。P(A丨B)意思是在B发生的情况下,A发生的概率;P(B丨A)意思是在A发生的情况下,B发生的概率;P(A)是A发生的概率,P(B)是B发生的概率。P(B)=P(B丨A)P(A)+P(B丨A')P(A'),这称为全概率公式。
看到这里,是不是有点糊涂了?其实这些公式并不难,证明过程也很简单,自己搜一下文氏图,一目了然。现在看起来,这些公式还是太抽象,别急,到后面实例的时候就派上用场了。
3.贝叶斯定理有什么用
先来看一个非常经典的例子,几乎是讲到贝叶斯定理必提。
某种病发病率约为0.1%,即1000人中有一个人是阳性,现在的检测手段很成熟,准确率高达99%,但是有5%的误报率。如果一个人的检测结果呈阳性,那么这个人真的感染这种病的概率有多大?
使用贝叶斯定理分析,假设A为得病,B为检测呈阳性。可知P(A)=0.001,P(B丨A)=0.99,P(B)=P(B丨A) P(A)+P(B丨A')P(A')=0.99x0.001+0.05x0.999=0.05094
P(A丨B)=P(A)*P(B丨A)/P(B)=0.001x0.99/0.05094=0.019
是不是很惊讶,哪怕准确率这么高,检测结果呈阳性的可信度只有2%。如果一种病的发病率很低,对于检测结果呈阳性,我们不用过多担忧。
来看看贝叶斯定理更实际的用处——帮助你量化对某些事物的态度或看法。比如说,你看到周围很多人去庙里拜菩萨,他们跟你说很灵的,心想事成,你是否应该相信他们呢?作为一个追求独立思考的人,肯定不能凭别人几句话就决定皈依我佛。正确的态度是,自己去统计多少人信奉佛教,其中多少人祈福有求必应,如果比例很高的话,那我们就可以相信。但事实上,限于个人的能力和时间,这种大规模的统计我们无法做到。但是有了贝叶斯定理,我们可以试着计算一下。
A代表相信向菩萨祈福有用,假设你半信半疑,给定P(A)=0.5,B代表一个朋友向菩萨许事业的愿后,果然升职加薪。假设你认为朋友对你说了实话,P(B丨A)=0.8,如果没有菩萨保佑,你认为他凭借自己能力升职加薪的概率P(B丨A')=0.5,根据全概率公式,P(B)=0.8x0.5+0.5*0.5=0.65。可以算出,
P(A丨B)=0.5x0.8/0.65=0.615。这时,你对菩萨的信任度已经从50%上升到了61.5%,说明看到你朋友的事后,你是越来越相信菩萨的作用的。如果再多几个同事向你诉说他们的心想事成,你的信任度越来越高,最后就会皈依我佛了。
但世上没这么好的事,要是都心想事成,那不世界太平了。所以你接下来碰到了另外一个同事,他说他去求了菩萨爱情,至今仍是光棍一条。于是你就开始调整你的看法。注意,这时的P(A)=0.615,B代表菩萨未能保佑抱得美人归,P(B丨A)=0.2,不变的是P(B丨A')=0.5,此时P(B)=0.2x0.615+0.5*0.385=0.3155,可以算出, P(A丨B)=0.615x0.2/0.3155=0.39。这时,你对菩萨的信任度又由61.5%下降到了39%,如果再碰到几个这样的同事,你就会彻底对菩萨保佑失去信心。
事实上,我们可以用贝叶斯定理来搭建一个思考的框架,不断的动态调整我们的看法或态度,在经过一系列的事情证实后,就会形成比较稳定而正确的看法。大多数人对事物的看法是摇摆不定的,因为我们的直觉思维是粗放而快速,所以很难稳定下来。而运用贝叶斯定理以后,它能够量化我们的看法,不致于因个人的偏好而偏差太远,而且哪怕你给定的先验概率是随便写的,也没关系,经过几次事实的印证后,它会越来越接近于真相。