我想给大家讲个有关概率的故事。
故事的背景是1999年的英国,一个三十几岁的女律师,因为自己的孩子在出生两个多月后不明原因的猝死,于是她被怀疑有虐待儿童或者心理变态的倾向,被检察机关公诉。
对于英国的医学界而言,虽然婴儿猝死症发生的概率很低(八千五百四十三分之一),但这是有先例的,为什么单单她被检察院公诉了呢?
原因很简单,这不是她的第一个孩子,在这个女律师34岁时,她有了自己的第一个孩子,不幸的是,她的第一个孩子也是不明原因的猝死,在孩子还只有三个月大的时候。
这样的低概率事件连续两次发生在同一个人身上,你会怎么看这个问题?难道这个女律师真的有问题?我想,当时的检查机关也是这样想的。
于是这个女律师被送上了法庭,一审时,检查机关请到了当时刚刚被女王授予爵位的儿科专家,他提供决定庭审的关键证词:“婴儿猝死症,在英国的医学历史上发生的概率是八千五百四十三分之一,如果这样的事件连续发生三次,我们几乎可以肯定这个女律师有罪,而两次这样低概率事件同时发生在一个人身上的概率是七千三百万分之一,也就是说这个女律师在很大程度上是有虐待儿童倾向的。”所以一审判决,女律师有罪。
女律师不服,提起上诉。因为案件本身涉及的人物身份特殊,同时因为案件涉及了医学和概率学的多方问题,所以受到广泛关注。
当时,英国有一家统计工会提出的观点最终决定了案件的走向,因为他们提出,一审判决时提到的概率计算方法存在明显漏洞。
一、群体的概率不等于个体的概率;
得出八千五百四十三分之一的概率结果是因为综合了很多个个体样本,在这些个体样本中,因为基因不同、先天发育不同、父母喂养习惯不同等等原因,可能有些风险概率大大,有的风险概率小小,而八千五百四十三分之一是平均之后的结果。也就是存在一种可能:女律师的孩子因为先天的基因缺陷,就是很容易猝死,也就是孩子的发病率不是这八千五百四十三分之一,而是比这个概率高得多的其它概率。所以群体概率去评估个体本身就是不科学的。
再举个例子,我们知道丢骰子,每个点数朝上的概率都是1/6,但如果这个事件只重复12次,我们可以算一下,在这12次试验中1点朝上的概率是多少呢,还是我们坚定以为的1/6吗?
也就是说概率是群体的长期的特征,是频率的极限,短期的个体的概率是没有办法预估的。
二、女律师两个小孩生病事件并不是相互独立的,而是存在某种关联的。
我们知道两个相互独立事件同时发生的概率P(AB)=P(A)*P(B),但是女律师两个小孩生病并不是相互独立的事件,因为存在着基因的先天不足的可能性,所以说一个孩子因为这个原因猝死,另外一个孩子出现这个死亡的概率就会大很多,所以它们是条件概率的计算方法:P(AB)=p(A)*p(B/A),所以并不是之前专家所的那个七千三百万分之一。
虽然女律师最终被法庭无罪释放,但不明个中缘由的舆论却毁了她的生活,她从此一蹶不振,吸毒、酗酒,不久便英年早逝了。
故事讲完了,这个故事对我们的生活有什么启发呢?我们是不是也常常会把自己的概率等同于集体的概率呢?
很多时候我觉得概率是极其有趣的一件事儿,我们可以尝试着思考下面的问题:
为什么我们老觉得天气预报不准,家人总是交代“天有不测风雨,勤带雨伞”?
在押大小的游戏中,在游戏开始之前,你觉得出现大大大大的概率大,还是小小小小的概率大,亦或是大小大小的概率大?
如果前面三把都是大,我们会不会在内心深处觉得下一把出现小的概率会大很多呢?但是独立事件中的历史不会影响未来,我们从心底里面期待着平均数的回归,只是我们忘记了自己能够提供的样本数有限,所以才有了“赌徒谬误”。而只有当样本数量够大时,频率才会向概率收拢。前提是我们有时间、也有机会等到平均数的回归。
有趣的概率问题值得好好研究,尤其喜欢玩德州扑克的小伙伴们。