与很多公司不同的是,我所在的公司对于员工腐败现象有极为严格的查处力度。小到吃回扣的基层员工,大到操纵招标的领导,但凡有危害公司利益的贪污腐败行为,都会严惩不贷。
所有员工入职时都会欣赏到一部由公司和检察院合拍的犯罪纪录片,浓重的《今日说法》的味道,里面所有的案例都是本公司的(前)员工。
一开始,其实我是很诧异的,不单单是这个形式闻所未闻,而且如此大量的公司员工贪污腐败让我觉得很陌生,“非国家工作人员受贿罪”这个词本身就冲击了我的潜意识。
咱们平时能听到、想到的贪污受贿一般都是政府官员,比如哪个官员贪钱了,哪个官员受贿了。可是,哪个公司的员工因为受贿被抓了起来,这种新闻就很少出现在我的视野里,所以受贿这两个字,在我的认知里,只与政府官员挂钩。
这种认知错误如果深究起来,其实很容易放纵腐败,因为这会导致员工忽视一些明显的犯罪行为,导致对自己和同事都放松警惕。
而这种错误就可以被称为“可获得性启发式”(Availability heuristic)错误,因为我做的判断仅仅依靠自己的记忆和经验,只关注那些我容易想起来的事件(官员腐败),而忽视那些不容易想起的事件(公司员工腐败)。
可获得性启发式(Availability heuristic):
人们的判断推理过程常常受到可获得的记忆的影响,倾向于认为容易想起的事件比不容易想起的事件更常见。
假如我想买一辆车,因为怕死~我特别看重安全性。众所周知,《消费者报告》是汽车评价的权威杂志,研究了一段时间以后我得出结论,沃尔沃汽车的安全性评价是最高的,所以我决定买一辆沃尔沃。
结果刚把这个决定告诉自己的一个朋友,朋友立马提醒我:“我有个朋友前两年买了一辆沃尔沃,毛病特别多,又漏油又爆胎的,都送去修车厂好几次了。”
假设我很信任这个朋友,那么,我很有可能对Ta说的话深信不疑,赶紧打消了这买沃尔沃的念头,并且庆幸自己早点知道了这个消息,否则差点买错车。
就像我们生活中做的很多“明智的”决定一样,错的很可能还是我自己。因为我忘了,一个靠谱的评价(比如《消费者报告》的车评)是基于成千上万的数据总结出来的,而即使我的朋友所说全部属实,这也仅仅是一个案例。我们都应该明白,再优质的产品线都会生产次品(只是次品率的高低不同),因为一个次品就否定成千上万的好评是否明智呢?
想清楚这个道理并不难,但是很少有人能够真的做到,因为比起数字,这些发生在我们身边的故事更加生动逼真、细节丰富,关键的关键,它是真实发生在我们身边的案例,比那些冷冰冰的数字不知道真实多少倍。
我们之所以如此的依赖可获得的经验来做评价和行动,是因为在信息不发达的过去,这是唯一可行的手段,那时候可没人去统计食客对于店家的评价,也没有可能把这么多信息精确、实时的传递给用户。
但现在不同,越来越多的评价体系建立起来,信息的流通变得前所未有的便利,如果再死守着身边一两个亲戚朋友同事的个人经验去看世界,恐怕比坐井观天的那只青蛙也好不到哪里去了。
想要利用好这么多的信息,学几个简单的统计知识不但是必要的,也是几乎唯一可行的方法,虽然只要学过数学的中学生都应该有所接触,但放下书本,能用统计的眼光看世界的人绝对少见,所以只要拾起这简单的不能再简单的统计知识,我们就比那些一看标题就怒发冲冠的路人们强上不知道多少倍。
1、百分比:
名词就不解释了。这个指标利用率非常大,效果也很明显,曾经一度最高大上的职业---管理咨询顾问,几乎用这一个指标就能写出价值百万千万的报告(当然还有其他的聪明才智)。
比如那些号称很能打的武学大师,让他们统计出与格斗高手的比武胜率(而不是用玄而又玄的武学道理给我们讲课,或者找几个学生装模作样的被隔山打牛),就完全可以证明自己的实力了(至于实力多少,就要看这个百分比了)。
2、平均数:
也不解释了。这个信息被利用的很多,被批判、吐槽的也很多,比如北上广深的平均工资等等。
那些经常被平均的“可怜人”注意,多问一句这个数据的出处和定义,有时候就解决困惑了。
比如前段时间,有位领导说深圳不缺房,因为深圳的房子约有1035万套,而深圳只有不到2000万人, 按照深圳户均2.59人的比例,深圳户均拥有住房1.34套。这明显不符合多数人的实际感受。
而如果我们追问一句,领导说的房,到底是什么房呢?结果发现,这1000多万套房里,有62.8%是农民房,面积小,基本没有厨房,当然也没有学位,这个平均数的意义也就突然变味了。
当然平均数的一个最重要的问题,就是受极端值影响太大。取100个人的月薪数作为样本,假设其中99个人的月薪3000元,另外一个人的月薪50万,他们的平均薪酬就是7970元,这个平均数对所有人都没有意义,无法让我们了解他们的薪酬情况。
所以这时候,让我们多想想下面几个统计指标。
3、众数:
这个词在书本之外很少听到,其实非常简单,就是一组数据中出现次数最多的数。拿前面的例子说,3000就是那组数据的众数,如果一组数据中有极端值,众数能提供一个视角,让我们快速发现这组数据中的代表。
但是,众数毕竟只是只能看到一个代表,对其他数据的分布一无所知,这时候,中位数就能帮到忙了。
4、中位数:
把一组数据从大到小排列,位于中间位置的数,就是这组数据的中位数。
比如9个人的月薪如下:
3千、3千、3千、4千、6千、8千、1万、2万、30万。
因为有极端值30万,平均数几乎没啥用;众数是3千,但是其他几个人的工资在什么水平我们就无法知道了;但是看一眼中位数6千,至少让我们知道,这组人中,有一半的人的薪水高于6千,有一半的人薪水低于6千;这对于我们了解这组数据就提升了一个档次。
5、方差(标准差)
虽然众数和中位数有一定的辅助作用,但是平均数毕竟还是非常有用的,尤其是在没有极端值的情况之下,最好是各个数据之间的差异不要太大,比如下面两组数据。
A组:10、20、30、40、500、960、970、980、990
B组:100、200、300、400、500、600、700、800、900
这两组数据的平均数一样,都是500,但是我们都能看出来,用500去描述B组数据更合适,对于A组数据,500并不能说明什么问题,所有其他数据都是“被平均”。
造成这个差异的原因就是两组数据的离散程度不一样,也就是各个数据之间的差异,而测量离散程度最常用的指标就是标准差。标准差是方差的平方根,而方差是各个数值与平均数的差的平方和的平均数。
比如计算6、7、8、9四个数的标准差,方法如下:
回到刚才A、B两组的数据,A组标准差高达475,而B组标准差只有274,B组数据的离散程度明显更低,所以平均数的使用自然也就更为恰当一些。
计算一组数据的标准差,不但能了解它的离散程度也能判断平均数的作用有多大,离散程度越高,平均数的作用也就越小。
说了这么多,点一下题。我们每天都看到各种各样的信息,有的人一刷新闻刷一天都不嫌累,但是看完之后,往往只是增加了对这个世界的某些偏见,因为几乎没有多少信息是认真对待数据的,要么干脆一个数字没有,要么就是给出一个耸人听闻的数字,但是不告诉你数字背后的计算方法。
如果连一点点统计学都不懂,一点点分析数据的能力和意愿都没有,那我们只能是被反复洗脑、利用或欺骗。