这一章是在介绍贝叶斯概率,也曾经称之为“逆概率”:
贝叶斯理论所讨论的全部内容,就是当其他事件已经发生,或说给定其他事件发生的前提下,对于某事件发生的可能性所造成的影响。
案例:
为了看看这个影响究竟为何,我们转到与第三章中的两个女儿问题相关的另一个问题上来。设想一个远房表亲有两个孩子。回想一下,在两个女儿问题中,我们知道这两个孩子中有一个或两个是女孩,而我们要搞清的,则是到底有几个女孩,一个还是两个?如果一个家庭中有两个孩子,那么如果其中至少有一个是女孩的话,两个都是女孩的可能性为多大?第三章并没有用如上的语言来讨论这个问题,但“如果”两字,将问题变为了一个条件概率问题。如果没有这个“如果”,两个孩子都是女孩的可能性是1/4,对应的4种可能的出生顺序为(男孩,男孩)、(男孩,女孩)、(女孩,男孩)和(女孩,女孩)。但知道至少有一个是女孩的这个额外信息时,两个都是女孩的可能性就变为了1/3,这是因为如果至少一个孩子是女孩的话,那么两个孩子的性别就只有3种可能情况——(男孩,女孩)、(女孩,男孩)和(女孩,女孩),其中1种正好对应了两个孩子都是女孩的结果。这也许就是理解贝叶斯思想的最简单方法——也就是个算账的问题嘛。首先,把样本空间——也就是所有可能情况的清单——写下来,如果这些情况的可能性不等,就将其各自的概率也一同记下(在分析任何容易犯糊涂的概率问题时,这的确是个好办法)。接着,把被条件(在现在的问题中,就是“至少有一个女孩”这个条件)所否定掉的那些可能性划掉,剩下的就是条件满足时的可能情况,以及它们的相对概率。
再复杂一点:
这个变体如下:某家庭有两个孩子,如果两个孩子之一是名叫佛罗里达的女孩,那么两个孩子都是女孩的概率有多大?
答案就完全不同了:
既然初始样本空间是一张所有可能情况的清单,那在现在的例子中,它就是一张包括了性别与姓名的清单。我们以女孩F来表示“名叫佛罗里达的女孩”,以女孩NF来表示“名字不是佛罗里达的女孩”。于是样本空间写下来就是这么个样子:(男孩,男孩)、(男孩,女孩F)、(男孩,女孩NF)、(女孩F,男孩)、(女孩NF,男孩)、(女孩NF,女孩F)、(女孩F,女孩NF)、(女孩NF,女孩NF)和(女孩F,女孩F)。
现在我们来裁剪样本空间。既然已知两个孩子之一是名为佛罗里达的女孩,故样本空间可以缩小为(男孩,女孩F)、(女孩F,男孩)、(女孩NF,女孩F)、(女孩F,女孩NF)和(女孩F,女孩F)。至此,现在的问题就与原先的两个女儿问题有所不同了。由于一个女孩叫或不叫佛罗里达的概率并不相等,因此,这个样本空间中的元素并非是等概率事件。
在1935年,即社会福利局(Social Security Administration)提供姓名统计数据的最后一年,大约每30000名女孩中,就有1人叫做佛罗里达。由于这个名字现在已慢慢消失,为了叙述方便,让我们假定如今一个女孩名为佛罗里达的概率是100万分之1。这也就意味着,如果我们知道某个女孩的名字不是佛罗里达,那并不稀奇;但如果我们知道某个女孩的名字确实是佛罗里达,那简直就等于买彩票中了大奖。即使不考虑父母通常都不会给孩子们起重名的这个事实,两个女孩都叫佛罗里达的可能性也仍然微乎其微,因此我们完全可以忽略掉两个女孩都叫佛罗里达的可能性,而剩下的样本空间中,就只剩下(男孩,女孩F)、(女孩F,男孩)、(女孩NF,女孩F)和(女孩F,女孩NF),而它们十分近似于等概率事件。
既然在4个元素中有2个——或者说有一半——对应了这一家子有两个女儿的情况,因此问题的答案就不再如两个女儿问题那样是1/3,而变成了1/2。这个增加的信息——关于女孩姓名的知识——造成了答案的不同。
重点是:“增加的信息” → “答案的不同”;而不带来变化的信息,可能也不是信息了。
这和“假阳性”是什么关系呢?
贝叶斯理论表明,B发生时A也将发生的概率,一般不同于A发生时B也将发生的概率。医生这个职业中的一个常见错误,就是未能清楚认识到这一点。比如一些在德国和美国进行的研究中,已知有7%的乳腺 X射线检查在实际没有肿瘤时仍给出阳性结果,在此前提下,研究者们请医师估计一下,一名无症状的、40至50岁且乳腺X射线检查结果为阳性的妇女,她真正患乳腺癌的可能性有多大。此外,这些医生们还被告知,实际的乳腺癌发病率约为0.8%,而真实的假阳性率约为10%。把所有这些数据凑拢来,利用贝叶斯方法就能得出:真正因癌症而导致的乳腺X线检查阳性结果的比例,仅仅只有9%左右。但在德国医生组中,有1/3的医生认为这个概率为90%,而所有估计值的中值为70%。在美国医生组中,100名医生中就有95名估计这个概率应该在75%上下。
说了半天,什么是“假阳性”?上个案例中的7% —— “乳腺 X射线检查在实际没有肿瘤时仍给出阳性结果”:
作者还提出了一个区别,概率与统计的区别:
科学家们也发现他们处境相同:他们一般不是在给定了某个物理量的值之后,去得到对该物理量测量的结果是这个或那个的可能性,而是在给定了观测结果后,去试图发现某个物理量的真实值。
我着重强调了这两类问题的区别,因为它十分重要。这个区别定义了概率与统计之间最根本的不同:前者关心的是根据确定概率来进行预测,而后者考虑的是根据观测数据来推出那些概率。
人生,都是被概率所影响 —— 但必须做的是统计的工作,也就是参与赔率的游戏。
但回到本章的标题,什么是“好错误”呢?我是没发现,但似乎也不重要(O(∩_∩)O哈哈~)。