昨天天气有些阴,快下班的时候,同事问下雨没。我跑到窗边,从我们9楼的办公室往下看,半分钟内3个行人从我视野里走过,都没有打伞。于是,我斩钉截铁地说,没下,我观察了3个样本点呢,都没带伞。
当我走出办公楼后,发现沾衣欲湿杏花雨,吹面不寒杨柳风。细雨抚摸着我仿佛被打的脸庞,我的心里充满了对同事的抱歉。
我至少犯了两个统计学错误。
一,观察的样本量太少。
简单来说,统计推断就是用样本推断总体。比如我们不知道天鹅是黑的还是白的,就观察了好多天鹅,来推断天鹅的羽毛颜色。被我们观察的天鹅就是我们的样本。我们都知道世界上有黑天鹅。如果我们只观察了旁边公园里的2只天鹅,它们恰巧是喜闻乐见的小白鹅,就下结论说天鹅都是白的,也太没有说服力了。所以,在通过样本推断总体的时候,样本量一定要大。实际上,在统计学上,计算样本量是一个很大的学问。在我们一时无法计算样本量的时候,也要记住,在人力物力许可范围内,样本量大总比小好。比如,我昨天观察时,完全可以观察六七个人再下结论嘛,半分钟看了3个人,这样本量还是太小了。
二,把替代指标完全等同于终点指标。
有些我们最终想观察的指标不好判断,我们会找一个指标替代它。在是否下雨这个问题中,是否打伞是替代指标,是否下雨是终点指标。下雨了就一定要打伞吗?我简单把二者划等号是很武断的。事实上,当雨很大时,窗边完全能看到雨滴,不需要我看人是否打伞。最重要的就是判断出下的是不是那种可打伞可不打伞的毛毛细雨。在毛毛雨时,很显然,不打伞不等于不下雨。我如果当时想到这个问题,结论也不会如此武断。
生活中,做很多判断都需要注意这两点。比如判断孩子的英语老师是不是一个好老师。“好老师”这个指标很模糊,不好判断,于是我们找了个替代指标——孩子的英语成绩。那么在判断时,我们就要注意,不能只看一次考试成绩,而且要时刻提醒自己,“成绩”只是一个替代指标,做判断还要考虑其他部分,比如孩子学英语的积极性、课外阅读的能力等。
可能上面写得不是很严谨,随便说说,我接着去复习统计学了哈。