01 流感了没
最近在自学统计学,和大家分享一个很有意思的知识吧~
天气渐凉,你开始咳嗽了,头昏昏沉沉的,于是你去医院检查了一通。
检查结果显示,你患流感了!
等等,别着急,让我们冷静下来一起算一算,你真的患流感了么?
我们现在知道的是:
- 你被诊断为流感阳性
- 若某人已患流感,那么他被诊断为阳性的概率为90%
- 若某人未患流感,那么他被诊断为阳性的概率为9%
- 患流感的概率是1%
其实我们想要知道的是你真正患流感的概率对吧。
有朋友会讲了,既然你都被诊断为流感阳性了,那么你患流感的几率肯定已经非常大了,基本上就是铁板钉钉的事情了。
是么?
下面的推算可能会跌破的你眼镜。
02 跌破眼镜
当我们被确诊为流感,我们一般都会选择相信这个诊断结果——我们真的患流感了。
但是啊,‘确诊’这个词太具有迷惑性了。
让我们从概率论的角度来计算一下我们真正患流感的概率吧。
已知条件:
若某人已患流感,那么他被诊断为阳性的概率为90%;
若某人未患流感,那么他被诊断为阳性的概率为9%;
患流感的概率是1%
我们假设
A:患流感,A':未患流感
B:诊断为阳性,B':诊断为阴性
P(B|A) 表示A发生的条件下,B发生的概率
那么已知条件可以表示为
P(B|A)=90%,P(B'|A)=10%
P(B|A')=9%,P(B'|A')=91%
接下来我将引入一个很有用的知识——贝叶斯规则
我们想要知道的就是‘我被确诊为流感且患流感’这件事情的概率,在这件事情中包含了两个事件:
- 被确诊为流感
- 患流感
其中‘被确诊为流感’是前提,如果写成P()的表达形式,那么我们想要知道的其实就是
P(A|B)——‘被诊断为阳性’发生的条件下,‘患流感’发生的概率
这个概率就是‘患流感’且‘被诊断为阳性’的概率比上‘被诊断为阳性’的比值。
这句话可能需要你多琢磨琢磨,你会有茅塞顿开的感觉,我点一下:
’被诊断为阳性‘,有两种情况,一是‘患流感’且‘被诊断为阳性’,二是‘未患流感’且‘被诊断为阳性’。
把上面的意思写成表达式,我们就得到了下面这个式子:
P(A|B)=P(A)P(B|A)/[P(A)P(B|A)+P(A')P(B|A')]
其实这就是著名的贝叶斯规则,用它可以玩儿出很多花样来,比如垃圾邮件分类算法,这里我们就不详解了。
利用贝叶斯规则,结合上文的已知条件,我们就可以得到我们关心的东西了——我被确诊为流感,且我真正患流感的概率。
P(A|B)
=P(A)P(B|A)/[P(A)P(B|A)+P(A')P(B|A')]
=0.01x0.9/(0.01x0.9+0.99x0.09)
=0.0917
=9.17%
虽然你被确诊为流感,但你真正患流感的概率其实是9.17%!
有没有被惊到呢,“确诊”其实并不是100%,其实10%都不到!
03 思维体操
现在我们改一下条件,你也来算一算概率吧,可以把答案写在留言里哦,我会公布答案的。
已知条件
- 若某人已患流感,那么他被诊断为阳性的概率为99%
- 若某人未患流感,那么他被诊断为阳性的概率为1%
- 患流感的概率是1%
现在你被诊断为流感阳性,那么你能告诉我你真正患流感的概率么?