我是谁?
我是一名大三学生。日常生活除了上课,花费最多时间的就是看书,每年我都会读上100本书左右。临近毕业,心中还是不免产生一种恐慌感。归其原因,是因为能力不足导致对社会竞争的畏惧。虽然读了一些书,但感觉读的那些东西对我的就业并没有太大帮助。过去我可以乐在其中,但为了不让毕业即失业的案例在我身上上演,我必须转移注意力。因此,在毕业之前,我决定学习一项技能作为毕业后找工作的敲门砖,以此增加自己的竞争力。最终,我选择了数据分析。之所以选择它,这与我读《魔鬼经济学》有很大关系。
《魔鬼经济学》这本书讲了什么?
首先介绍一下这本书的作者之一史蒂芬-列维特,这是一个自称对经济学所知甚少,但出版的经济学著作连续一年荣登美国畅销书榜首的作家。他是怎样在经济学领域独树一帜?答案是数据分析。他可以在混乱枯燥的数据中寻找逻辑,颠覆传统观念。
罪犯都去哪了?教师和相扑是如何作弊的?为何毒贩还在和母亲同住?恐怖分子的银行账户有何特点?犯罪率升高是因为电视看多了?这是书本中的部分题目。这本书的话题涉及的领域非常广,被称为经济学的帝国主义。我将列举三个案例详细说明。
恐怖分子的银行账户有何特点?
“9-11”事件和接连几次自杀式人体炸弹袭击后,恐怖主义笼罩整个美国。国家投入巨大的人力、物力、财力,但对预防恐怖袭击效果甚微。但在这方面做出贡献的是一个银行职员霍斯利,他学习的是计算机编程,主要负责银行的基础数据库。他曾经通过对银行的数据进行分析查出银行员工的欺诈和消费者诈骗。于是,作者与他一起开始思考这个问题:如果他的算法能够筛选浩瀚繁复的数据,找出诈骗犯,那么同样使用这一算法,能否巧妙地识别出恐怖分子。
于是,他们通过对19名恐怖分子的银行业务反映出了他们的某些行为方式,总体而论,与银行一般客户的行为特征有着显著差别:1、他们的账户平均数额为4000美元。2、他们的邮政地址经常变化。3、频繁收到国外电汇。4,往往一次性存入大量现金,随后取出小额现金。5,没有反映正常的生活费用6,每月存钱或取款的时间没有明显的规律可言。7,不用储蓄账户或保险业务。8,支取现金比使用支票和比例明显高出许多。
通过以上信息,可以在数百万的银行客户中发现潜在恐怖分子,很大程度的缩小了反恐范围人群。
犯罪都去哪了?
上世纪四五十年代美国的犯罪率开始缓慢爬升,六十年代高涨,八十年代再一次攀升,从民间到政府困扰不已,但是1990年,尤其是2000年之后,犯罪率突然下降。于是,关于犯罪率下降的原因铺天盖地覆盖了各大媒体的头条,内容五花八门。警局将其解释为破案策略的提高,监狱说是对罪犯管理的好,政客说是某项法案提的好,各部门可谓“百家齐放,百家争鸣”。本书作者将其一一反驳,正确的原因是几十年前,美国各州允许堕胎。不是犯罪管好了,而是罪犯还没出生就被杀掉了。
现在理解起来好像也不难,犯罪分子大多来自贫困家庭,这些家庭意外怀孕,不得不将其生下,又无力抚养,最终这些孩子每天在贫民窟结交一些和自己有相似经历的朋友,长大后走上犯罪道路的就概率非常大。
如何判断堕胎与犯罪之间是因果关系。还是相关关系呢?
作者找出犯罪率下降幅度最高的五个州,也是堕胎提前合法化的州,分别是纽约、加利福尼亚、华盛顿、阿拉斯加和夏威夷。1973堕胎全面合法化,1988-1994将是堕胎合法化以来成长的第一波青年,这几年间,提前合法化的这五个州犯罪率下降幅度比其他州高出13%,1994-1997年,高出23%。数据还显示,在20世纪70年代堕胎率最高的州,在90年代犯罪率下降幅度也是最大的,堕胎率较低的州,犯罪率下降幅度也较小。
以上数据可以显示出犯罪率下降与堕胎合法化是因果关系。
如何知道教师在作弊?
自考试以来,就存在驱使学生作弊的因素,但高标准从根本上改变了教师所面对的现实,让他们也有理由作弊了:在高标准测试制度下,如果学生测试成绩不佳,教师就需要接受审核,或被取消加薪升职资格;如果学校整体不佳,联邦政府则会扣留拨款;有些老师就起了帮学生拉高分数的念头,让他们将年头付诸实践的是:教师作弊鲜有人查,很难被发现,也几乎从未有人受过处分。
直到奥克兰市一名五年级的小学生放学回家后,兴高采烈的告诉妈妈,她的老师非常体恤学生,把州内统考的答案抄在黑板上。由此,教师作弊才引起政府的注意。但是怎样知道过去的几年有哪些教师作弊呢?本书的作者有办法。
他首先换位思考,排除其他风险高的作弊方案,交卷后改答案是一个不错的选择。假如你想帮学生改答案,不会改太多题目,也不会将每一个学生都改。因此,你的做法是挑选8~10道连续的题目,在一半或三分之二的考卷上填上正确答案。你或许还会选择试卷末尾的题目,因为他的难度会大点。
了解这些,万事俱备,只欠数据。、
在该例中,芝加哥公立学校系统公布了数据库中1993~2000年每年每年级3万名学生,答案70万份,题目近一亿道的数据。这份数据按考场编排,包含每名学生阅读及数学测试的逐题答案序列。数据还包括每名老师的部分信息、全部学生人数的统计信息以及此后的考分,这在追查教师作弊行为的过程中起到了关键作用。
接下来书中呈现的是两份相同的数据,第一份是密密麻麻的数字和字母,我看不出任何诡异之处,但当作者将异常之处加粗,呈现第二份数据时,我豁然开朗,数据中可以看出学生做正确的题目是如此 雷同、相似和集中,这场考试作弊嫌疑很大。于是学校做了重考决定,果然,被认定有作弊情形的教师,其学生成绩一落千丈。
(由于篇幅因素,以上列举的三个案例中展现的逻辑并没有书中紧密,仅仅写出了作者的基本思路。)
本书通过数据分析得出的颠覆传统观念的结论还有,酒后步行比酒后驾车危险性更高;恐怖分子大多来自受教育程度高和高收入家庭;犯罪率上升是因为电视看多了;游泳池导致儿童死亡的概率远大于枪击致死;印度女性思想解放是由于电视的流行等有趣的观点。
看完此书,心想,如果我也掌握了数据分析技术,能在工作和生活中发现一些有违传统但正确的观点,并能为企业创造价值为生活提供便利,那将是一件多么酷的事!因此,我走上了数据分析的道路!