辛普森悖论与直觉的缺陷

None of My Business!

关键词:辛普森悖论 | 直觉 | 统计 | 可加性

辛普森悖论真是个很经典的东西,引用维基百科

在分组比较中都占优势的一方,在总评中有时反而是失势的一方。

简书上有一篇文章提到一个结石治疗方案对比的例子,可视化得挺好,值得一看:辛普森悖论。举个极端一点的例子,更容易说清楚这个悖论到底是什么情况:

假设一个学校正在招生,其A学院对女生的录取率100% > 男生录取率99%;B学院女生录取率10% > 男生录取率0%。
现有男女生各100人。
女生报名A学院10人,报名B学院90人,所以A录取10个女生,B录取9个女生,共录取19个女生;
男生报名A学院100人,没有人报名B学院,所以A录取99个男生,B录取0个男生,共录取99个男生。
整体来看,女生录取率19/100=19% < 男生录取率99/100=99%。

问题来了:无论A还是B学院,对女生的录取率都比男生高,直觉上整体的女生录取率也应该更高,但实际相反。

这是怎么回事?

先尝试给出一个说得通的解释:站在学生的角度看,报名不同学院像是赌球。报名A学院类似于赌输赢,风险小;报名B学院类似猜比分,风险大。虽然因为女生整体水平比男生厉害(更懂球)或者学校偏好女生(妹子猜谁赢我们尽可能就让谁赢),女生赌赢的机会更大(两个学院录取率都更高),但是女生大部分选择猜比分,男生大部分选择猜输赢,而猜比分和猜输赢的难度相差很大,大过男女差异,因此有优势更冒险的女生都死得差不多,较弱但更保守的男生活下来更多

进一步思考,这种现象为什么违背直觉呢?

因为我们的直觉里有这样一个逻辑:如果一个东西的各部分都分别大于另一个东西的各部分,那么这个东西大于另一个东西。可以形式化如下:

假设:
A=A1+A2+...+An
B=B1+B2+...+Bn,那么:
如果对i=1,2...,n都有Ai>Bi,则A>B

这个逻辑在例子里显然hold不住了。根本原因在于假设里的“+”和“=”,其中隐含了可加性的前提。A1、A2、A3到底是什么,可不可加呢,加起来是不是等于A呢?如果A、B、Ai、Bi都是实数,那么可加性来自于定义,上面的逻辑自然没问题。然而对于学院录取的例子,我们有没有定义,或者能不能推导出录取率的可加性呢?不能。

在形式化之前,我们似乎很难看到可加性这个隐含前提。

要和数字玩游戏,最忌讳的便是想当然,直觉在某种程度上等同于碰运气,效果取决于问题的性质与直觉假设的吻合程度。不要讲数字会说谎,说谎是一种带有目的的主动行为,数字只会被算错,但不会说谎。

维基上还从几何角度解释了这个现象,将录取率表示为斜率,绿线和红线的斜率分别是整体的女生录取率和男生录取率,可以看到向量而非斜率的可加性

女生单独两个向量斜率都比男生大,说明它们的比率都比较高。但最后男生总体向量斜率却大于女生

201906:辛普森悖论现象的背后有两组要素,以前例而言:一组要素是学校对男女学生的录取率,另一组则是男女学生报考的选择。 从认知的角度上理解,直觉让我们倾向于认为只有前一组要素对系统结果有质(最终录取率谁大谁小)的影响,而忽略了后一组要素。特别前一组要素与要考察的结果都是“对男女学生的录取率”,语义上似乎很接近,所以被我们“自然地”认为是决定性因素。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容

  • 我真的很奇葩,总是猛然间特别想要吃零食,而且属于一旦产生想法得不到满足就会执念的那类人,明明嘴是用来沟通交流的但是...
    往后只求己阅读 158评论 0 0
  • 资源,资源,努力要资源。
    哎哟喂Gg阅读 129评论 1 0
  • 子张学干禄。子曰:“多闻阙疑,慎言其余,则寡尤;多见阙殆,慎行其余,则寡悔。言寡尤,行寡悔,禄在其中矣。” 子张向...
    石埭生阅读 422评论 0 1