在2021年9越5日的《硅谷来信》专栏中,吴军老师从一个新闻出发,展示了如何分析因果性和相关性。
我听了之后,很有启发。关于因果性和相关性的定量分析,这是我以往知识体系中所模糊的,学到新知,不甚欣喜,下面我也将详细的笔记分享给大家。
这则新闻是说美国酷帕地诺学区委员会,对一个骚扰威胁中学女生的男生进行了勒令退学的处罚,之后,不少人认为处罚太重,担心这个男生从此会更加学坏。
那实施处罚和从此学坏之间到底有没有因果关系呢?退一步说,有没有相关性呢?
有四种情况:
第一种情况,对孩子实施处罚,之后所有被处罚的孩子都从此学坏。如果这样我们就说处罚和学坏之间有因果关系,这时我们可能就要考虑放弃实施处罚,这里是考虑不是就必须放弃,因为还有其他因素。
第二种情况,对孩子实施处罚之后,一部分人学坏了,另一部分人从此不再犯这类错了。这时就不能说实施处罚和从此学坏之间有因果关系。
第三种情况,对所有人都不实施处罚,结果所有人都继续犯错,从此学坏了。这时说明不实施处罚和从此学坏之间有因果关系。
第四种情况,孩子犯错之后,不实施处罚,结果一部分人从此学坏,还有一部分人虽然没有受到处罚但也改正了错误。这时就说明不实施处罚和从此学坏之间也没有因果关系。
第一和第三种情况都过于绝对,现实情况是不论是否处罚,孩子都有可能学坏,也有可能不学坏,因此,我们不能用一个人是否从此学坏作为对他进行处罚的根据。
无论实施处罚还是不实施处罚,都不构成这个人学坏或者不学坏的原因,因此如果我们以孩子是否学坏来判断是否实施处罚,就犯了诉诸不当理由的逻辑谬误。
决定是否处罚,要看他是不是违反了相应规定。如果以这个孩子“开除了很可怜”来辩护就犯了“片面辩护”的逻辑谬误。
判断相关性就要进行概率计算,先要算出三个概率:
- 学生犯错后实施处罚的概率,记为Pa,假设为0.5;
- 犯错了的学生之后学坏的概率,记为Pb,假设为0.3;
- 犯错的学生被实施处罚并且从此学坏的概率,这涉及到两个随机因素(联合概率),用被实施处罚并从此学坏的人数除以犯错的总人数,记为Pab,假设为0.15.
那么,我们现在能否因为1000个学生中有150个被处罚后从此学坏了就认为两件事情有相关性呢
不能,因为若Pa为0.5,Pb为0.3,即使二者毫无相关性,是彼此独立的事件,在随机作用下Pab就会达到0.15。
因为我们计算两个独立事件同时发生的概率,方法就是用第一事件的概率乘以第二事件的概率。如果Pab是0.15,那恰恰说明实施处罚和从此学坏两件事情是彼此独立的,没有相关性。
另外几种情况:
1.Pab大于0.15,也就是说有超过150个从此学坏的人来自那500个被处罚的学生,或者说这两个事件的联合概率Pab大于两个独立事件的概率Pa*Pb,那么我们就可以认为这两件事情存在正相关性。并且如果Pab达到最大值0.3,意味着300个从此学坏的学生全部来自被处罚的那500个人当中,这时候我们可以说处罚和学坏之间有高度相关性。Pab越接近0.3,正相关性越强,越接近0.15相关性越弱,如果在误差允许的范围内也基本等于没有相关性。
即便Pab等于0.3,由于依然存在200个被处罚的学生没有变坏,所以因果关系依然是不成立的。
2.Pab小于0.15,就是说不到150个人被处罚后学坏,Pab小于Pa*Pb,这就说明两件事情是负相关的,这时候Pab越接近0,负相关性越强
3.Pab等于0,没有任何一个学坏的学生来自那些被处罚的人,这说明两件事情是互斥的,也就是一件事情发生,另一件事情必然不发生。
比上述分析更难的是得到准确的统计数据,这正是社会研究者要做的工作。
基本上每一个政策都会进行好处和坏处的研究,所以,一个政策,但凡能长期实施,都不会太坏。
黑格尔:凡是现实的,都是合乎理性的。
保护每一个人,特别是那些容易受到伤害的人的安全和权益。
结语
人类已经进化了几百万年,原始社会对确定性的追求早已经刻入基因,我们都希望这个世界是确定的,发生的事情有因有果,清清楚楚。于是呢,从最早的迷信,到后来的宗教,再到现在的科学,我们不断的找寻对事物因果关系的解释。
问题是我们对因果关系的确定往往过于草率,又往往在没有因果的地方强加因果,所以,我们编织的因果之网看似牢固,内里却一开始就千疮百孔。
再想到在中医治疗的现状,各种疗法层出不穷,却都没有扎实的寻证医学支撑。疗效,别谈因果性,相关性都存疑。
普通老百姓眼中的神医神药问题就更多了,老百姓只看到自己和周围人的例子,而又只能看到例子表面的现象,对于判断什么有效的说法,在我听来基本是毫无根据的。