统计学 by David Freedman, Robert Pisani, Roger Purves, Ani Adhikari
我竟然看完了这样一本看似高冷的书,而且觉得挺好看,在车上看时,有几次还差点坐过站。这本书跟他枯燥的外表很不相符,其实十分好读,说理深入浅出,例子有趣,很多地方还有一点小情调,翻译也大致顺畅,作为统计学应用入门再好不过了。
我始终觉得,每个人都应该掌握基础的统计知识,这对于培养逻辑思维,规避常见思维谬误,大有益处。看了这本书,我才知道,很多时候要证明某件看上去合理的事,需要作出多么大的努力,而多数人的观点,则并没有这样的程序--要做到严谨其实是很难的。让我们离真相更近一些的,是知识。
一、有趣的原理阐述
书里的原理阐述,都配有大量的真实实验,比如赌博、美国选举、民意调查。这也是很大程度上这本书有趣的原因。什么是随机对照实验、双盲实验、机会误差、偏性,讲解深入浅出。
另外,很多定义、属性的阐述,直接又清晰,让我多有恍然大悟之感。比如,标准差表示数列中的数离它们的平均数有多远;斜率是测量路的陡峭程度。
二、赌博真的没人能赢过庄家
以Nevada轮盘红黑赌为例,轮盘赌转盘有38个球囊,一个标着0,一个标着00,其余标着1到36的数,0和00涂绿色,其他的数字交替涂上红色或黑色。如果你把1美元赌注押在红色,一个红色数字出现,你收回1美元同时还赢得1美元,如果出现绿色或黑色,那么你的1美元就输掉了。
仔细一点看,如果18个红色数字中有一个出现,你就赢,如果18个黑色数字中有一个出现,你就输,如果出现0或00,你也输,这就是庄家占上风的地方,你赢的机会是38中的18,输的机会是38中的20.
更进一步,独立的赌10000次,每次1美元押红,计算可得,庄家所赢多于250美元的机会大约是99%。对于赌场来说,轮盘赌是像杂货店一样安全经营的大商店。
所以,相信概率,远离赌博--除非你总是庄家。
三、错误的想当然耳
这本书纠正了我很多想当然耳的错误认识。
比如说:抛硬币实验,头像和背面出现的概率都是50%,那么抛的次数越多,出现头像的次数越接近次数的一半。
其实不是,抛的次数越多,头像数与抛的次数的一半之间的差会变得较大(抛30次,头像17次,差是2,抛10000次,头像5067次,差变成了67),但是头像的百分比越来越接近50%。误差按绝对值可能是大的,但是相对于抛的次数是小的,这才是平均数率。
四、还有些小情调
作为一本教科书,每一章之前,总有一些看上去没太大关系的引言。
比如,第一章对照实验的引言来自马克·吐温:“总是做得对,将使一些人满意,而使其余的人惊讶”。
而我最喜欢的一段引言在“平均数和标准差”一章,“很难理解为什么统计学家通常限制自己的调查于平均数,而不着迷于更广泛的考虑。对于变化的魅力,他们的灵魂看来如同平坦的英格兰国家之一的当地人一样迟钝,那些当地人关于瑞士的回顾是,如果可以将它的山脉扔进它的湖泊,那么两种讨厌的东西将立即去除”。
这真是最可爱不过的讽刺了,将瑞士的山脉和湖泊与被平均数掩盖的离群点作比。事实上,去过瑞士的人想必都同意,瑞士的美丽很大程度上正是来源于众多的山脉和湖泊。
书里还有很多有趣的插图,比如:
我们的教科书,擅长把在实用中很有趣的知识,板出严肃却不知所云的面孔,更不知将用到何处。什么时候,我们的教科书也能这样可爱呢。