3 贝叶斯定理
也叫贝叶斯规则,是由18世纪出生于英格兰坦布里奇韦尔斯的一名牧师托马斯·贝叶斯率先发现、后续不断演化而来的一套推导公式,如今已被广泛运用。
一开始上述公式仅用于两种条件概率之间的转换。后来引申到作为对人类信念进行理性校正的评判标准:
如果通过简单的数学变形,还可以得出另一公式(给定新数据D后非焦点假设~H成立的后验概率):
再推导一下会更精彩,得出“后验概率”、“先验概率”、“似然比”三个概念:
4 贝叶斯定理的运用实例
著名的蓝、绿出租车肇事逃逸案例是个典型,在《思考,快与慢》等其他书中也被引用并加以详解,用以说明基础比率的关键性:
以下是经由贝叶斯定理的精准计算结果:
但经过专业训练者其实也可以不通过计算就得出比较准的“主观概率”(因为有时候仅仅是需要认定绿车的嫌疑更大,而非求得0.41这个具体数字),心算推理过程如下:
不过丹尼尔·卡尼曼的研究更为深入、对我们习得逻辑思维也更有指导意义。他先是用2种基础比率概念替换成更容易引起人们警觉的表述:
接着其实是从人脑总是选择性地依靠一快一慢两个系统当中之一来应对思考这个高度讲述了个中理由:
他说道:
在出租车问题的情境中,忽略基础比率信息是一个认知错误,是贝叶斯定理的失败;依赖因果关系基础比率才能获得令人满意的答案,形成对绿车司机的思维定式便会提高判断的准确度。然而,在其他敏感复杂的社会情境中,我们不想根据某个团体的相关统计数据对个人做出可能是错误的结论。事实是我们认为应该将基础比率视为与整体相关的统计学事实,而不是与个人相关的假设性事实。换言之,我们反对利用因果关系基础比率。
让我们再看类似的一个案例:
这次变成一个“关乎人民群众生命健康”的问题了,而研究对象是“专业的医生”,人们能否正确进行推理呢?
基础比率千分之一,说明1000人中会有1人得病,999人不得病,是不是很低呀?
假阳性率是5%,等于放大到1000人的话是50人会被误诊。
是不是很显然抽中被检测为阳性的这个人患病率已经拉得很低呢?
千万小心哟!我们女性乳谢癌也会存在这种高概率误诊咯。
请读者耐心阅读上图两种表述,结合前文两例猜测下再看答案:
8/107,约等于7.5%。8+99=107个人阳性,真正得癌的只有前面那8个人。
坦言之,概率思维缺乏的我,面对上图:左边那种表述,大脑估算很是混乱,右边这种版本,则略微有点感觉。这也吻合前文有关因果关系基础比率反而不为人所用的研究结论。
我们可以把右边看成左边的“土话版”,不是说文字表述严谨性、逻辑性降低了,而是人脑惯常思维更适应右边的语言,看到右边这段文字就会激发敏感与警觉,注意未得乳腺癌的人概率更高这个基础比率,而换成左边的纯统计学数字(尽管还是基础比率)就会当成无关信息略过或者分析判断时容易被忽略。而这,是逻辑校正需要突破的口。
让我们切换下角度,再来看书中2个也是关于疾病和治疗方案的例子:
假想自己是医生,要当机立断一名红疹病人罹患另一怪病的可能性,你是否能一眼关注到必须首先确认的是“有红疹但没得怪病之人的比率”?
还是作为医生,你是如何知道一项治疗方案很可能并非许多人误以为那么有效的呢?
从图上方2*2矩阵表里,我们往往抓住第一行——接受过该治疗方案并收效的人数高于无效人数;孰不知第二行的结果令你大跌眼镜——不用治疗好得快的人数更高。(200/275<50/65)
讽刺的是,临床医疗中这种错觉更甚。是不是万一被医生判刑要再来回顾下本文然后无视诊断、继续好吃好喝呢?
下一篇我们要总结几个贝叶斯思维要点来。