测量与误差定律 —— 读《醉汉的脚步》(八)

这一章实际讲的是测量一定有误差;在误差没有朝着特定一个方向偏离的情况下,得到的是正态分布(钟形曲线):

在揭示钟形曲线重要性的3个人中,其发现者分到的功劳却是最少。亚伯拉罕·棣莫弗(Abraham De Moivre)的突破产生于1733年,当时他正是65岁左右的年纪,而直到5年后他的《机率论》(Doctrine of Chances)第二版出版,人们才知道了这个突破。棣莫弗要找的,是那个被我们在第10行就截断的帕斯卡三角形,当它继续向下深深延伸几百行或几千行时,这些延伸区域中数字的近似值。这个追寻最终通向了钟形曲线。雅可布·伯努利在证明他自己版本的大数定律时,也不得不为这些行中的数字的某些性质而大伤脑筋。这些数字可以非常大,例如在帕斯卡三角形第200行中的一个系数,有着59个数位!在伯努利的时代——实际上在计算机出现之前——这样的数字显然非常难以计算。而我提到过,伯努利在证明定理时进行了种种近似,并最终降低了结果的实用性,这就是原因所在。而利用所发现的曲线,棣莫弗可以得到远好得多的近似系数值,从而极大地改进了伯努利的估计。

如果像在登记卡上所做的一样,我们也将帕斯卡三角形某行的数字,以高度在条形图中表示出来的话,那么棣莫弗推导得到的近似就是一个很显然的结果。比如,在帕斯卡三角形第三行中的3个数字是1、2、1。在条形图中,第一个条形为1个单位高;第二个的高度是第一个的一倍;而第三个条形的高度又再次为1个单位。现在来看看第五行中的五个数字:1、4、6、4、1。这时的图中将有五根条形,且同样起始于矮条,在中间上升到顶点,然后又对称地降下来。那些非常下面的行,其系数会形成有非常多糸形的条形图,但行为方式却是一样的。帕斯卡三角形的第10行、第100行和第1000行所对应的条形图在139页中给出。

案例1 —— 大部分基金经理的成绩是不是来自于运气:

在图中,以正方形标出的,是300名学生对10次扔硬币结果进行猜测的数据。水平轴上的数字,代表这10次中猜对的次数,从0次到10次。垂直方向上画出的,是正好猜中水平轴中相应次数的学生个数。曲线的形状像一口钟,中心处在猜中5次的位置,该点处的曲线高度对应了75名学生。在左边,差不多是3次到4次中间的地方,曲线高度大致为最高值的2/3,即约51名学生;而在右边,这个高度所对应的点落在了6次与7次的中间。对于猜测扔硬币的结果这样的随机过程而言,产生这个数量级标准差的钟形曲线,是一个典型的结果。

在同一张图上,我们还画出了另一组以圆形标出的数据。这组数据给出的,是300名基金经理的表现。此时,水平轴表示的不是10次扔硬币中猜对的次数,而是10年中某个经理的表现高于这个群体平均水平的年份数量。注意两条曲线之间的相似性!在第九章中,我们将回到这个问题上来。

这里是说,大部分基金经理的成绩,就是来自于运气 —— 但是并不否认,还是“有可能”有真正水平高的基金经理,这是这类检验所能得到的答案。

案例2 —— 如果考虑到测量误差,很多抽样调查的比例变化,并没有意义:

无论在何时对任何类型的调查或民意测验结果进行评价时,关键都在于我们应该认识到,当这个调查或测验重复进行时,结果会不出意外地发生变化。举例来说,如果真实情况是有40%的登记选民认同总统的作为,那么6次独立调查更可能给出像37%、39%、39%、40%、42%和42%这样的结果,而并非所有这6次调查都发现总统的支持度为40%(前面这6个数字,实际上是2006年9月的头两周中,对美国总统任职情况支持度进行的6次独立调查结果)。这也就是为什么——同样作为一条经验规则——任何误差幅度之内的差别都应当被忽略的原因。但是,《纽约时报》虽然不会登出《下午两点的职位与薪水中等增长》这样的头条,但在报导政治民意调查时,类似的头条却随处可见。举个例子,2004年共和党全国大会之后,CNN发出的头条是《布什的支持度显然有中等程度的反弹》。CNN的专家们接着就解释道“布什在大会上的支持率反弹看来约为2个百分点……潜在选民中声称要选他为总统的比例,从大会前的50%立刻上升到了之后的52%”。只是到了后面,报导者才指出,调查的误差幅度为正负3.5个百分点,这实际等于说上面的新闻根本毫无意义。显然,“显然”这个词在 CNN评论节目中的真正含义是“显然不”。

本章的核心洞察是,既要看到个体的成绩,也要看到历史的进程:

当看到一次成功或失败时,我们所观察到的只是一个数据点,一个钟形曲线上的采样,它仅仅代表了那早已存在的可能性之一。我们无法得知这个单独的观测所代表的,到底是均值本身,还是某个“例外值”;也无法知道这个观测所对应的,到底是我们有把握赌一把的事情,还是某个不大可能再次产生的罕见情况。但至少应当清楚,一个采样点就是一个采样点,相比于简单地将其作为真实情况来接受,我们更应在产生该采样点的标准差或概率分布这个语境下来认识它。

首先看到、看清、接纳一个点 —— 也就是接受这个“点”的成功结果;其次,去思考背后的那个生成机制,在这里是钟形曲线 —— 点背后的系统,更加地重要。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,794评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,050评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,587评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,861评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,901评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,898评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,832评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,617评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,077评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,349评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,483评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,199评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,824评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,442评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,632评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,474评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,393评论 2 352

推荐阅读更多精彩内容