小数定律

记得小时候,很喜欢抛硬币,然后猜测是正面向上还是反面向上。当发现某一面出现的次数更多时,就会认为该面更可能出现,于是就会通过不断的抛硬币来强化自己的认知。但是,结果往往和自己想的不一样:有些时候正面向上的次数大于反面向上的次数,有些时候则是相反。

自己总会认为某一面出现的概率会大于另一面。因为不管你重复多少次,正面反面出现的次数几乎总不相同。譬如,如果重复20次,正面出现了13次,反面只出现了7次,那么大脑就会强化正面出现的概率更大的认知。随后自己会做更多的实验来证明这个认知是正确的。如果后来的实验中,反面出现的次数大于正面,自己会认为是实验的次数不够导致的。

如果发现是正面朝上的可能性比较大,自己便会去找个因果关系:譬如正面更轻,所以在下落的过程中,正面会大概率的出现在上面(毕竟大脑善于找因果关系)。

无独有偶,在打鸡蛋的时候也会想这个事情。在打鸡蛋的时候,一个鸡蛋不动,然后用另一个鸡蛋去撞它,看看哪个鸡蛋先碎。我总想找出个规律,是静止的鸡蛋先碎还是运动的鸡蛋先碎。如果发现是静止的鸡蛋比较容易碎,会认为静止的鸡蛋受力比较大,毕竟它是被冲击的。

后来学习了概率论,知道抛硬币时正面向上的概率和反面向上的概率是一样的,虽然每次实验正面及反面向上的次数几乎不相同,但是从概率上看,二者是相同的。学习了牛顿力学后,知道鸡蛋的相互作用力是一样的,静止的鸡蛋破的可能性和运动的鸡蛋破的可能性是一样的。当然,前提是鸡蛋壳的硬度是均匀分布的。

心理学领域有个著名的现象,该现象是由一个研究引起的:一项研究对美国3141个县的肾癌发病率进行了调查,调查显示该病的分布模式很值得注意。发病率最低的县差不多都位于中西部、南部和西部人口稀少的乡村,这些乡村按照惯例由共和党管辖。

听到上述调查,你会怎么想?首先,你很有可能认为这个结果是可信的,在此基础上,会去找出导致这个现象的原因:乡村比较穷,民风淳朴,压力比较小,吃的很好,早起早睡,所以肾癌发病率比较低。

但是,如果把上述调查结果改变一下:美国共和党统治的乡村地区的肾癌发病率比较高。人们就很容易去想:地方比较穷,吃的不健康,工作比较辛苦,酗酒吸烟,医疗条件比较差等导致了这种结果。上述说法肯定有问题,因为乡村生活方式不可能既是肾癌发病率高又是其发病率低的原因。

在某个人口稀少的县,癌症发病率并非比真的比正常情况下更低或者更高,只是这个县正好在某个特殊的年份赶上了抽样调查罢了。

对于一次调查的结果,很有可能是偶然导致的,随机事件是不需要也不能解释的,一连串随机事件就有规律可循了。对于偶然情况,你可以找各种原因去解释它,只要逻辑上可信。但是,给偶然结果找原因是没有意义的。

一次调查并不一定是可靠的。调查结果是建立在样本之上的,如果样本量不够多,特征不够丰富,调查结果很有可能就是以偏概全,是错误的,或者是别有用心的。

《快思考,慢思考》的作者丹尼尔·卡尼曼(2002年诺奖得主)对于样本是这么说的:

心理学家并不是通过计算来选定样本大小,他们往往听从自己的直觉,但是这些判断往往是错误的。

他也是直觉性统计学家(自认为不好),尽管他自己也教过统计学。他之前并不是通过计算来确定样本大小,相信自己设计实验的直觉。后来他发现,很多数学家也会犯相同的错误,即使是专家,在选择样本品大小时也无法充分集中注意力。

丹尼尔·卡尼曼继续说:相比于大样本,极端的结果(如高发病率和低发病率)更容易出现在小样本中(小数定律)。他提到一个表述:

1. 大样本比小样本更精确

2. 小样本比大样本产生极端结果的概率大

第一个表述清晰的陈诉了一个事实,但是直到感受到第二个表述传达给你的意思,你才意识到自己并没有真正理解第一个表述的意思。

很多时候,我们会看到各种各样的调查报告:譬如中国家庭平均资产,中国人均住房面积,杭州白领平均工资,杭州平均年终奖,外面骑手平均工资等各类调查报告。很多时候我们觉得自己始终是拉后腿的那一方(至少我是这么认为的)。

譬如,中国家庭平均资产是161.7万,听到这个时,发现自己家拉了太多后腿。当然,不否认中国财富分配的不均匀,顶层人口占据了太多太多的财富,但是中国有太多的地区很贫穷(国家统计局给出的中等收入的工资是2000-5000元)。平均资产那么多,要么是故意选择的样本,要么在选择样本时,没有经过仔细的思考,或者是把房子的负债(未来的收入)也算入了资产中。

关于外卖骑手的收入,有个很矛盾的调查。美团给出的结果是平台30%的骑手的工资达到了5000块,而58同城给出的结果是,全国外卖骑手平均月薪达到了7750元,杭州以9121元排名第一(杭州白领平均工资9547元)。真的是很讽刺,差了这么多。相比而言,美团的结果更可信,因为自己平台的数据比较多。

很多调查有特殊的用意:故意让人点击去看,故意引领社会舆论。一次的结果你会怀疑,但是一直重复类似的调查结果,你就会相信。

既然知道了小数定律,看到某一调查结果时,就可以谨慎一些,不能被带偏了。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,928评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,192评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,468评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,186评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,295评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,374评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,403评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,186评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,610评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,906评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,075评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,755评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,393评论 3 320
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,079评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,313评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,934评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,963评论 2 351

推荐阅读更多精彩内容