看到了一篇微信公众号文章,标题是:为什么「患者总存活率」更低的医院,反而可能更值得推荐?(https://mp.weixin.qq.com/s/NSO8j7-cpeqj0o8VE0xSLw)文章中提到了一个现象叫辛普森悖论(Simpson'sParadox),这由英国统计学家E.H.Simpson于1951年提出。大意在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。具体在这个案例中就是,A、B两家医院实施同样的一种手术,B医院的轻症患者、重症患者的存活率均高于A医院,但是B医院患者总存活率却低于A医院。如果只看患者总存活率,很多人会认为A医院更值得推荐,但事实却与之相反。造成这种现象的原因是两家医院的轻重症患者比例有很大不同。轻重患者比例就是一个潜在变量,它造成了结论的彻底改变。
在这之前,我并没有听说过辛普森悖论,也会理所当然地觉得如果一家医院患者的总存活率更高,那么它肯定更值得推荐。事实上,有时候统计数据也会欺骗你。如果仅仅看表面的上数据,很容易做出错误的决策。统计学中还有一些常见的谬误,如:基本比率谬误(Base Rate Fallacy)、威尔·罗杰斯现象(Will Rogers Phenomenon)、伯克森悖论(Berkson's Paradox)等,他们都有可能影响我们的判断。我们在看到一组统计数据时,一定要多思考一下,不要急于得出结论,看其中是否存在这些常见的统计学谬误。如果条件允许,要对整体数据和分组数据都加以分析,这样才能更准确地把握数据真正要表达的信息。