辛普森悖论

辛普森悖论(Simpson Paradox)定义

辛普森悖论为英国统计学家E.H.辛普森(E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。

例子说明

  1. 比赛100场球赛以总胜率评价好坏。取巧的人专找高手挑战20场而胜1场,另外80场找平手挑战而胜40场,结果胜率41%;认真的人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比41%小很多。但仔细观察挑战对象,后者明显更有实力

2.详见 数据分析必须警惕的坑:辛普森悖论 中的IOS/Andrioid设备的转化率

其他

  • A/B Test 实验时需注意

避免方法

  • 样本选取要随机、均衡
  • 加权重参数计算各项的总和

参考文章:

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容