什么叫贝叶斯推算?就是我们根据新的证据,事物,数据等客观结果去更新我们的看法,判断。然后,这种循环不断重复。你会发现人人基本都是这样,都是贝叶斯动物。
贝叶斯推理本质上是条件概率的变形:已知如果A则B,那么反过来求解B则A的概率。
算出 B 发生的概率有多大,是 P(B);再算 B 发生的情况下,A 也发生的概率有多大,是 P(A|B),那么 A、B 都发生的概率,就是把这两个数相乘,结果是 P(A|B)×P(B)。同样道理,先考虑 A 发生再考虑 A 发生的条件下 B 也发生,结果是 P(B|A)×P(A)。这两个算法的结果一定相等,P(A|B)×P(B) = P(B|A)×P(A),于是
这就是贝叶斯公式。之所以要这么算,就是因为常常是 P(A),P(B) 和 P(B|A) 都容易知道,而这个逆概率 P(A|B) 只能用这个公式间接知道。
每个讲贝叶斯定律都要说一个例子,一般都是说检测疾病
如果有种疾病,总体发病率是千分之一。针对这种病的检查,准确率很高,如果得了这病,那么测出来是阳性的概率是99.5%;如果没得这病,相应地被测出来为阴性的概率也是99.5%。现在,检查测出是阳性,请问当事人得这病的概率是多少?
千分之一的发病率意味着一千个人当中有一个感染艾滋病,而这个人测出阳性的概率是99.5%,约等于1个。同时,剩下999个没有感染艾滋病的人中,因为检查结果有千分之五的假阳性,会检测出4.995个阳性,约等于5个。加起来,1000人检查会有接近6个人检出阳性,但其中只有1个是真的感染者。这是人类特有的认知偏差。
真正的贝叶斯人不这样。他们会尊重先入之见,因为它是一切新知的出发点,但又随时准备清空存量,以避免掉入这一陷阱。
真正的贝叶斯在婴儿的世界就是这样,我们成人却很难做到,我们应该像婴儿学习。
你说到了贝叶斯方法的软肋,就是它无法对抗黑天鹅。这是没办法的事情,黑天鹅的定义就是无法预测之事。现在动不动说黑天鹅成群飞起,这至少不是黑天鹅的原意。小概率事件不是黑天鹅,不在概率集合里头的事件才是,或者换句话说,一个是 known unkown(已经知道不知道),一个是 unknown unkown(还不知道不知道)。
贝叶斯方法倒不怕跳跃,再大也不怕。比如说,假如天黑只有两个原因,一个是太阳爆炸了,一个是太阳在地球的另一侧。如果我们有绝对可靠的证据证明太阳并不在地球另一侧,那么,无论太阳爆炸的可能性本来是多么微乎其微,我们都只能接受这个解释。正如福尔摩斯所说,When you have eliminated the impossible,whatever remains,however improbable,must be the truth. 排除掉所有不可能之后,剩下的就是事实,无论多么不可思议。插一句,卷福版福尔摩斯第四季三集全部播完了,终局之作,值得去目送一程。
但贝叶斯方法对付不了未来的大转折大断裂。太阳每天升起,贝叶斯方法对明天太阳继续升起这个预测的信心会越来越大,直到不可思议的事情发生,那时只好重置。