回归分析是一种非常强大的统计学方法。专门用来研究那些影响因素很多的复杂问题,回归分析就是通过一个已知的现象来找到未知的原因。它可以通过严格数学分析复原出每种原因对结果的贡献比例。回归分析的作用就好比一个可以调节孔径的筛子。
举个例子,医学家发现,级别较低的公务员更容易患上心脏病。 “白厅”研究项目组经过长时间纵向数据采集,比对了可能导致心脏病的一系列原因,包括低阶公务员的学历普遍偏低、烟民比例高、医疗服务差、加班多、锻炼少等等。面对这些错综复杂的变量,统计学家建立回归方程,计算了各个变量和心脏病发病率的线性关系。
回归分析表明,造成心脏病高发的真正原因,是对工作缺乏控制力和话语权。而这类存在感较低的岗位,在低级别职位中更常见。而现在低控制力现在已经成为一个专有名词,
但回归分析,忽略了变量或者遗漏了反面因素,得出的结论有可能给错误的结论批上合理的外衣。
上世纪90年代,哈佛大学医学院对12万名女性开展纵向调查,经回归分析显示,定期摄入雌激素可以减少女性心脏病发病率,随后医院开始提供雌激素的补充治疗。而后来的临床试验发现,此举会导致乳腺癌和血栓病高发,因此死亡的女性患者可能达到上万人。
电脑永远不能代替人的工作,如果在进行回归分析时遗漏了变量,就会得出危险的结论,甚至杀人。
统计学原理虽然看似简单,但却不是人人都能分析,因为它既能给我们的观点找到严谨的数据支持,但有时也会给一个错误的结论,披上合理的外衣。需要随时带着客观谨慎的态度去审视数据。