神奇的贝叶斯定理

图片来自网络

1.前言

数学一直是我的弱项，从初中到大学成绩都不好，于是累觉不爱，与数学从此绝缘。反而离开校园后，有时对某一方面的数学问题产生兴趣，就会继续追寻下去。就像这个神奇的贝叶斯定理，原理多看几遍其实很简单，但是上学那会儿怎么总是学不会呢？大概上学的时候，只是单纯的记忆公式，而数学是对现实的高度抽象，恰恰是人类大脑所不擅长的领域，而工作后带着实际问题去学习数学，符合人类从具体走向抽象的认知规律，故而能够理解。

贝叶斯定理正是在这个背景下，被我初步理解的。所以各位不要觉得涉及到数学就觉得畏惧，连我这个数学渣都能理解，其他人更是不在话下。后面会讲到，贝叶斯定理作为一个思考的框架，一种决策的工具，具有神奇的作用。这正是我们构建多元化思维模型中数学模型的一部分。

2.什么是贝叶斯定理

我们将一枚硬币抛向空中，落地时正面和反面的概率都是50%，这是常识。但如果我们抛100次，正面和反面的次数并不会都是50，有可能正面40次，反面60次。那抛1000次，10000次呢，正面反面的次数有可能还不会是五五开。只有将抛硬币无数次，正面和反面出现的次数才会趋向于相等。也就是说，正面和反面出现的概率50%是一个极限、客观的概率，并不会随着抛掷次数的增减而变化。

但是贝叶斯定理与这个精确客观的概率不同，它要求当事人估计一个主观的先验概率，再根据随后观察到的事实进行调整，随着调整次数的增加，结果将会越来越精确。这里有一个问题，数学不是讲究客观吗？这里怎么冒出一个主观概率出来？这也是当时的学者质疑贝叶斯的问题。事实上，贝叶斯定理在17世纪提出后，一直受到冷落，直到20世纪30年代电子计算机出现后才得到广泛应用。如今我们每天都在和贝叶斯定理打交道：你上搜索引擎搜寻问题，背后的算法中就有贝叶斯公式的身影；你邮箱里的垃圾邮件，很有可能就是运用贝叶斯定理帮你拦截的。

为什么会出现这种情况？因为贝叶斯定理符合人类认知事物的自然规律。我们并非生而知之，大多数时候，面对的是信息不充分、情况不确定，这个时候我们只能在有限资源的情况下，作出决定，再根据后续的发展进行修正。实际上，这也是科学研究的步骤。

说了这么多，贝叶斯定理到底长什么样啊？围观群众的小心脏可承受不起一坨挤眉弄眼的数学符号。那简单的用中文来描述一下：

后验概率=先验概率调整因子*

是不是也没这么难？没错，就是这么简单。翻译成数学语言就是：

P(A丨B)=P(A)P(B丨A)/P(B)*

这是一一对应的，P(A丨B)是后验概率，P(A)是先验概率，P(B丨A)/P(B)是调整因子。P(A丨B)意思是在B发生的情况下，A发生的概率；P(B丨A)意思是在A发生的情况下，B发生的概率；P(A)是A发生的概率，P(B)是B发生的概率。P(B)=P(B丨A)P(A)+P(B丨A')P(A')，这称为全概率公式。

看到这里，是不是有点糊涂了？其实这些公式并不难，证明过程也很简单，自己搜一下文氏图，一目了然。现在看起来，这些公式还是太抽象，别急，到后面实例的时候就派上用场了。

3.贝叶斯定理有什么用

先来看一个非常经典的例子，几乎是讲到贝叶斯定理必提。

某种病发病率约为0.1%，即1000人中有一个人是阳性，现在的检测手段很成熟，准确率高达99%，但是有5%的误报率。如果一个人的检测结果呈阳性，那么这个人真的感染这种病的概率有多大？

使用贝叶斯定理分析，假设A为得病，B为检测呈阳性。可知P(A)=0.001，P(B丨A)=0.99，P(B)=P(B丨A) P(A)+P(B丨A')P(A')=0.99x0.001+0.05x0.999=0.05094
P(A丨B)=P(A)*P(B丨A)/P(B)=0.001x0.99/0.05094=0.019
是不是很惊讶，哪怕准确率这么高，检测结果呈阳性的可信度只有2%。如果一种病的发病率很低，对于检测结果呈阳性，我们不用过多担忧。

来看看贝叶斯定理更实际的用处——帮助你量化对某些事物的态度或看法。比如说，你看到周围很多人去庙里拜菩萨，他们跟你说很灵的，心想事成，你是否应该相信他们呢？作为一个追求独立思考的人，肯定不能凭别人几句话就决定皈依我佛。正确的态度是，自己去统计多少人信奉佛教，其中多少人祈福有求必应，如果比例很高的话，那我们就可以相信。但事实上，限于个人的能力和时间，这种大规模的统计我们无法做到。但是有了贝叶斯定理，我们可以试着计算一下。

A代表相信向菩萨祈福有用，假设你半信半疑，给定P(A)=0.5，B代表一个朋友向菩萨许事业的愿后，果然升职加薪。假设你认为朋友对你说了实话，P(B丨A)=0.8，如果没有菩萨保佑，你认为他凭借自己能力升职加薪的概率P(B丨A')=0.5，根据全概率公式，P(B)=0.8x0.5+0.5*0.5=0.65。可以算出，
P(A丨B)=0.5x0.8/0.65=0.615。这时，你对菩萨的信任度已经从50%上升到了61.5%，说明看到你朋友的事后，你是越来越相信菩萨的作用的。如果再多几个同事向你诉说他们的心想事成，你的信任度越来越高，最后就会皈依我佛了。

但世上没这么好的事，要是都心想事成，那不世界太平了。所以你接下来碰到了另外一个同事，他说他去求了菩萨爱情，至今仍是光棍一条。于是你就开始调整你的看法。注意，这时的P(A)=0.615，B代表菩萨未能保佑抱得美人归，P(B丨A)=0.2，不变的是P(B丨A')=0.5，此时P(B)=0.2x0.615+0.5*0.385=0.3155，可以算出， P(A丨B)=0.615x0.2/0.3155=0.39。这时，你对菩萨的信任度又由61.5%下降到了39%，如果再碰到几个这样的同事，你就会彻底对菩萨保佑失去信心。

事实上，我们可以用贝叶斯定理来搭建一个思考的框架，不断的动态调整我们的看法或态度，在经过一系列的事情证实后，就会形成比较稳定而正确的看法。大多数人对事物的看法是摇摆不定的，因为我们的直觉思维是粗放而快速，所以很难稳定下来。而运用贝叶斯定理以后，它能够量化我们的看法，不致于因个人的偏好而偏差太远，而且哪怕你给定的先验概率是随便写的，也没关系，经过几次事实的印证后，它会越来越接近于真相。

神奇的贝叶斯定理