我们是一台探测规律和模式的机器

拥有统计学家、遗传学和演化生物学家等多个头衔的罗纳德·费希尔(也叫费雪),有个女同事,声称可以品尝出来一杯(英式)奶茶是先倒的茶还是先倒的奶。费希尔不相信就决定检验一番,于是费希尔就提供了八杯奶茶给这位女士(免费)品尝,其中一半是先加茶,另一半先加水,将八杯随机拿给这位淑女。

奶茶是先加茶还是先加奶

费希尔假设这位女同事根本品尝不出来,因为八杯都猜中的概率只有1.43%(1/70,别问我怎么知道),他给自己的假设起了个统计术语叫做“零假设”(Null hypothesis),而要验证这位淑女有这种能力的假设就叫做“备选假设”(Alternative hypothesis)。

科学的方法就是首先要否定她品尝不出来的这个零假设,然而再检测实验结果,这叫做“假设检验”(Statistical hypothesis testing),如果备选假设,也就是说这位女士猜中的几率高于随机水平,那么就是说结果具有统计显著性(Statistical significance),从而否定了“零假设”并验证了“备选假设”。费希尔的实验结果显示,这位女士成功地全部猜中了八杯奶茶的次序,其远远大于5%统计显著标准,从而证实了这位女士具有这种判定奶茶先后次序的能力(以及憋尿能力)。

“零假设”现在已经成为科学研究的基础,总结起来大意是说当你观察到一组实验结果时,你不能认为这个结果刚好就符合了你脑子里想着的预测,你得首先说明这不是一个随机发生的情况,只有否定了零假设之后,你的“备选假设”,也就是你期待的解释方案才可能有效,但还需要进一步检验实验结果的显著性水平。

网上能轻松找到关于“零假设”的很多资料,反而大多偏重于太难懂的术语,枯燥无味让无法理解(没办法,这就是科学),反而最早提出“零假设”的费希尔是用这样一个有趣的“淑女品茶”(Lady tasting tea)例子提出来的,科学研究也可以这么玩。

类比一个最为大众所知的例子,就是我们经常看好莱坞电影里所说的“无罪推定”。也就是说,在没有找到相关证据证明犯罪嫌疑人有罪的情况下,我们只能先承认其无罪,要想给犯罪嫌疑人定罪,检方必须要拿出充足的证据来推翻嫌疑人的清白假定。

“无罪推定”涉及到了谁来提供证据的“举证责任”问题,因为在这里的零假设是无罪的嫌疑人,所以要想推翻这个假设,检方就必须提供证据,比如不在场证明是否有效、目击者证词、作案凶器以及犯罪动机等等。“无罪推定”让犯罪嫌疑人无需自证清白,而是要让怀疑方(检方或原告)拿出证据来。

举个例子,你早上起来发现手机找不到了,你认为可能是外星人偷走了。在证明你的说法合理之前,你需要首先证明它不是被你女/男朋友拿走去破解了。在这里,被女/男朋友拿走就是“零假设”(当然严格来说,这并不是真的,所以请放心),在接受被外星人偷走的看法之前,你得先否认被女/男朋友拿走的可能性,比方说你没有女/男朋友。这个否定的过程,专业的说法就是“排除零假设”(Exclusion of the null hypothesis)。

在医学上,这个零假设就是安慰剂效应。衡量一个新药是否批准上市(美国FDA标准),就是在双盲实验中,新药的效果要明显好于安慰剂。比如你开发了一种新药可以治疗痛经,如果含药的白开水效果并不比一杯普通白开水要好,那么你的新药是无法上市的。只有当你女友告知某一杯白开水的效果明显改善了疼痛,而你发现正好是含药的那杯的话,那么这就不是安慰剂效应在起作用,那么恭喜你可以申请FDA批准了(前提是没被女友打死,因为白开水的安慰剂效应已经大不如前)。

在日常生活中,在没有排除零假设的情况下,我们往往得出一些五花八门的结论,而最常被取笑的就是股评家,还有彩票预测大师。股市的涨跌和彩票的号码通常是随机发生的,就像你每天不同时刻的心情一样,但股民们和彩票迷们并不认可随机的零假设,他们认为一定有什么原因导致的,所以新闻和媒体中就会看到各色的股评家,在一些城市里满大街也会有摆摊算号总结彩票趋势的大师们,就会给我们一些离奇的备选假设,可能是南美的一只蝴蝶,或者是北美的一次选举,也可能是中东的一场悲剧等等。

股评家和彩票大师往往被当作笑话看待,但学术研究中,经济学家却不认为自己是个笑话,他们往往以为经济是可预测的,殊不知有些重大的不可预测的“黑天鹅”事件也会发生,由此导致了很多悲剧。塔勒布就是一个善于讽刺和谩骂经济学家不懂随机性和不确定性的思想家,归根结底来说,经济学家在得出备选假设之前,没有首先排除零假设(见《塔勒布的“不确定”四部曲:如何避免蠢货》)。

不光是在经济学,人文学科和社会科学里也有众多的“笑话”,却被当作正经的学术理论。拿历史学科的研究来说,很多历史学家在没有排除随机和偶然的零假设下,就提出了他们的理论。当然,历史不同的是,她是已经发生事件的回顾,所以其零假设还需要解释当一个事件出现之前,为何历史并没有按照现状保持下去。

历史学家常常把已经发生了的事情当作必然发生的事情,于是急于寻找其发生的原因。例如,要解释为何秦统一了六国,那么不是去寻找秦能够统一的证据,而是要先解释为何战国时代七国并立的状态没有继续进行下去,同样的多国并立欧洲为何最终没有完成统一。 

用塔勒布在《黑天鹅》中的话总结来说:

历史和社会不是缓慢爬行的,而是在一步步地跳跃。它们从一个断层跃上另一个断层,其间极少有波折。而我们(以及历史学家)喜欢相信那些我们能够预测的小的逐步演变。我们只是一台巨大的回头看的机器。

我们同时也是一台探测规律和模式的机器,不相信偶然和随机。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,347评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,435评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,509评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,611评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,837评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,987评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,730评论 0 267
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,194评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,525评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,664评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,334评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,944评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,764评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,997评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,389评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,554评论 2 349

推荐阅读更多精彩内容

  • 2 Hypothesis Testing 学术专家和行业专家 ,会有各种各样的问题 ,作为数据分析师 我们努力帮助...
    IntoTheVoid阅读 3,394评论 1 10
  • 通常在研究中,我们会对已有的一些结论或者主张抱有合理的质疑 reasonable doubt,此时该如何通过概率统...
    拓季阅读 11,426评论 1 17
  • 假设检验和零假设 我们不需要通过大量可能的假设来检验:药物C和药物D是否不同。我们使用零假设来决定是否存在不同(药...
    不到7不改名阅读 935评论 0 0
  • 这是零假设和对立假设 零假设:在统计学中,零假设(虚无假设)是做统计检验时的一类假设。零假设的内容一般是希望证明其...
    不懒狮Blaise阅读 12,149评论 0 0
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,705评论 0 5