知识点一:
P<0.05:科学家的隐藏动机
讲一点真正的科学研究的操作方法。
在你听说的所有心理学、医学和社会调查研究中,凡是涉及到统计方法的研究,从理论上来讲,哪怕科学家都是兢兢业业老老实实地工作,大约每20篇论文中,就有一篇的结果,其实是无效的。而因为科研界很多灰色的做法,实际情况比1/20要坏很多。
这个误差,是科学方法本身所决定的。
讲香农信息论的时候,有一句话叫“信息就是意外”。那么当你遇到一个统计结果,你在多大程度上应该对这个结果感到意外呢?
1.统计结论是怎么来的
比如现在有人发明了一种新药,你怎么证明这个药是有疗效的呢?有个病人吃了这个药,然后他的病就好了,你能说这个药有疗效吗?不能。因为有些病不吃药也能好。
科学的做法,当然是做个随机实验。我找100个病人,随机分成两组,每组50人。我们给第一组病人吃新药,给第二组病人吃跟新药看上去一模一样的……糖豆,也就是“安慰剂”。病人自己并不知道被分到了哪一组,甚至还可以让负责发药的医护人员也不知道每次发的是新药还是安慰剂,这样所有病人除了吃的药不一样,其他方面都是一样的,这就做成了一个“双盲”实验。
如果在一个疗程之后,第一组病人全都治好了,第二组病人全都死了,那就有充分的理由相信这个新药是有疗效的。
但真实世界没有这么好的事儿。即便是在市场上很火的药,有效率也没有那么高,经常都只是比不吃药稍好一点而已。你的实验结果更可能是第一组有22个人的病好了,4个人死了,第二组只有15个人病好了,但是只死了3个。
这就让人很无奈。说这个药无效吧,第一组的治愈率确实比第二组要好。说这个药有效吧,疗效似乎不怎么明显,死亡率还上升了。那如果你是科学家,这个论文应该怎么写呢?
这就得用到统计方法了。这个思想的关键,就是要判断,现在这个结果,到底是药物疗效导致的呢,还是纯粹是个偶然事件。
考虑一个最简单的例子,只看死活:假设第一组的所有病人都活着,而第二组死了5个病人。也许正是新药的疗效,才让第一组没死人,但也许这只是一个巧合。
科学家的做法,是先来一个“无效假设”:
— 假设药物无效,并且这个疾病的死亡率就是第二组所揭示的10%。
科学家的问题是,如果这个无效假设是对的,那么请问,出现第一组不死人这个结果的可能性,有多大?
这个问题的本质,就是问,你第一组这么好的结果,到底是不是纯属偶然。纯属偶然是完全可能的。哪怕药物完全无效,以至于这个病还是有10%的死亡率,那也不见得第一组就也应该死5个病人 — 你要知道,哪怕是抛硬币,也存在一个连抛50次都正面朝上的可能性。
那就来算算这个可能性。每个病人不死的概率是0.9,50个人都不死的可能性就是0.9的50次方,等于0.00515。
科学家把无效假设成立的可能性,称为“P值”。那么在这个例子中,
P = 0.00515。
那也就是说,无效假设不成立、第一组实验结果并非偶然的可能性,是 1 - P = 0.99485。
那么科学家就会这么写论文:“实验证明,这种药是有效的,P= 0.00515。”
读者读到这句话,就可以这么理解,实验结果应该不是巧合,这种药有效的可能性高达99.485%。
这才是理解论文的正确思路。P值告诉我们巧合的可能性。回到最开头的实验,在一定的 P值的指导之下,也许可以说:药物疗效大概是真的,第一组的治愈率高很可能不是巧合,而第一组多死了一个人这件事,很可能只是巧合。
但是对不起,注意到没有,前面说错了一句话。“这种药有效的可能性高达99.485%”,这句话是错的。
2.怎样理解 P 值
关于 P值有很多错误理解。前面那句“这种药有效的可能性高达99.485%”其实是错的,但是很多科学家跟记者也这么说。
P值的真正意思是说,相对于“死亡率是10%”这个“无效假设”,实验结果纯属巧合的可能性是0.00515。那为啥非得用死亡率是10%这个无效假设,为什么不用别的无效假设呢?这纯粹是科学家的主观选择。
还有一点特别重要,P值只能更好地评估这个药*有没有*疗效,但是它可没说这个药的疗效有多大。
比如《自然》杂志上有个影响很广的论文说 --
“针对19,000人的研究表明,如果夫妻双方是通过婚恋网站介绍认识的,他们离婚的可能性比在线下认识的夫妻低 (P< 0.002) ,他们收获较高婚姻满意度的可能性也比线下认识的夫妻要高 ( P< 0.001)。”
这两个 P值很低,说明结果绝非偶然。那能从这段话里得到什么结论呢?是不是说在生活中找对象这种做法太落后了,应该把命运交给婚恋网站的匹配算法呢?
要仔细看这篇论文的结果,婚恋网站只不过把离婚率从 7.67% 降到了 5.96%,把婚姻满意度从 5.48 分(满分 7 分)提高到了 5.64 分而已!这点效应根本不值得你太认真。
现在学术界的一个几乎是“黄金标准”的标准,是 P值要小于 0.05。如果 P> 0.05,别人会认为你这个结果很可能纯属巧合,根本不值得认真对待,你都不好意思写论文发表。如果 P< 0.05,人们就说这个结果是“显著的(significant)”。
但是请注意,这个“显著”的意思,可不是说疗效很厉害 —— P值关注的仅仅是*有没有*疗效,不是疗效的大小!
还有个关键问题。为啥非得是 0.05 呢?
3. 0.05 啊 0.05
有些统计学教材都把 0.05 当成了一个硬性标准,P< 0.05 就显著,否则就不显著。但事实上这个标准根本没有科学依据,纯粹是科学家的约定俗成而已。
这一整套看 P 值的检验方法是英国的统计学家罗纳德·费希尔(Ronald Fisher)提出的,这个理论才只有几十年的历史。
费希尔先生是个体面人。他当时选择了0.05这个数值,可不是说 P< 0.05 就可以发表论文 —— 他的意思是 P< 0.05 的结果才“值得看”。那满足什么标准才算可以接受的结论呢?费希尔当时想的可是 P< 0.001。
但问题在于,做实验想要得到 P 值小于0.001的结果,需要找太多受试者,成本实在太高。大家退而求其次,都默认了 0.05。其实即便是这个标准都是很难达到的,不知道有多少科学青年的青春,就消耗在了这个 0.05 上!
其实就算做到了 P< 0.05,也不能说实验结果就是真的 —— 根据我们前面的分析,P= 0.05 意味着有 1/20 的可能性,在你这个特定的无效假设之下,这篇论文的结果纯属巧合。事实情况比这个严重得多,根据有人研究,如果考虑到无效假设的任意性之类的统计方法上的因素,一篇 P = 0.01 的论文,属于巧合的可能性,在某些情况下,高达11%!
而这还不算完。
4.动机性推理
一个概念,叫“动机性推理(motivated reasoning)”。所谓动机性推理,就是如果你事先有一个达到什么结论的强烈动机,你的推理过程就会刻意地满足这个结论。
如果科学家非常希望自己的结论是对的,他想让 P值小于0.05,他就有可能采取一些主观的做法,达到这个标准。
你可以选择一个不一样的无效假设。你可以看 P值太高就再多招几个受试者做实验。再比如说,实验组多死了一个人,你可以说这个病人是个特殊病人,他有别的病,他的死亡是因为别的病的并发症,这样的数据不算数!—— 你就把这个不利的数据给剔除了。这个做法叫“数据采摘”,英文叫 cherry-picking — 你就好像挑选樱桃一样,只要你想要的数据。
Cherry-picking 不算造假,但是也不能算诚实的科研态度。
那你可能问,科学家刻意美化了数据,这有根据吗?的确不能拿着一篇论文就说人家的 P值是经过美化的,不了解人家的实验是怎么做的。但是如果把很多论文都放在一起,看看P值在这些论文中的分布情况,就会发现一个很有意思的现象。
P < 0.05纯粹是人为的约定,没有任何自然意义,所以各个研究中 P值的分布应该是一条光滑的曲线,0.05这个数值在曲线上不应该有任何突兀之处,对吧?当然,有些P > 0.05 的结果也许没有发表,那么曲线应该在0.05这个地方有个截断,但是0.05不应该比0.045重要,对吧?
可过去这几年,就不断有研究发现,在经济学、心理学和生物学论文中,P值的分布,在0.05处有个明显的凸起 ——
唯一的解释,就是有很多论文故意把 P值*做*到了“恰好”在 0.05 以内。
由此得到
P值代表*在一定的无效假设之下*,实验结果纯属巧合的可能性 —— 有相当比例的实验结果其实就是巧合。
P值只能预示*有没有*疗效,而与疗效的大小无关。
P值小于 0.05,是个不怎么体面的人为约定。
即便如此,还是有很多科学家使用 cherry-picking 之类的手段,美化了自己研究的P值。
《头脑里的大象》这本书,说每个人都有隐藏的动机 —— 现在看来,连科学家也不例外。那别的行业是什么样,也就可想而知了。
那科研结果还能信吗?能信,科学方法是获取知识“最不坏”的方法。而且近年来,科学家们自己,也正在积极反思 P 值代表的问题。
真实世界就是这样 —— 没有我们最初想象的那么美好,但是总值得我们活下去,而且有一点你不能不承认:它比我们想象的更有意思。
知识点二:
复利的鸡汤和真实世界的增长
人人最关心的一个问题就是钱是怎么赚来的,人人最喜欢的赚钱方法就是投资,而投资中最简单的方法就是依靠“复利”。所谓复利,就是利息产生利息。
1.鸡汤
假设你现在有10000元,利息是10%,那明年就会变成11000元。如果利息也能产生利息,也就是所谓“利滚利”,那么到了第二年,你就不仅有12000元,而是10000×1.1×1.1,就是12100元。
到第 N 年,你的财富就是10000×(1.1的N次方),这就叫“指数增长”。
10%的利息,25年就达到10倍。也就是说你现在存一万元,25年内你什么都不用干,就能获得10万元。
那为什么非得是10%的利息呢?15%不是更好?如果利息是15%,只要17年就能达到10倍,34年就是100倍!如果你父母在生你的那一年给你存了1万元,那到你34岁的时候,你已经拥有了100万元。如果当年存10万元,你就有了1000万。如果利息是20%,那更是只要26年就能变成100倍,正好结婚买房。
所以复利实在是厉害啊。要不怎么爱因斯坦说,宇宙中最强大的力量就是复利!
要用复利挣钱,你就要自律,推迟享乐,把钱放在那里坚决不用。那些钱已经不是普通的钱,而是宝贵的种子 —— 你只需耐心等待复利的回馈。
一个关于鸡蛋的故事。
从前有个人,得到一个鸡蛋,但他没有吃。他想,如果我等这个鸡蛋孵出小鸡,把小鸡养大,还能生出好多好多蛋,那些蛋再孵出小鸡,由此鸡生蛋、蛋生鸡,我不就发大财了吗?
他这么想着,一不小心,鸡蛋掉地上摔碎了。这个人非常难过,因为他损失的不是一个鸡蛋,而是一笔巨额的财富。
如果你觉得指望靠一个鸡蛋发家致富不靠谱,指望复利致富也不靠谱。这两件事本质上是一样的,只不过利率可能不同。
不是质疑你的自律精神 —— 完全相信你能攒钱。问题不在于本金。
问题在于,去哪,找长期的、稳定的、20%的利率。
2.利率
在真实世界中,不但找不到20%的利率,也找不到15%的利率,甚至找不到10%的利率。如果华尔街哪个投资公司说能提供保证10%的利率,无数人会哭着喊着把资金交给它管理。现实是只有庞氏骗局那种非法集资公司做这样的保证。
关于股票投资有两个基本知识,其中一个可能不知道,另一个早就知道。
可能不知道的知识是,很少有哪个投资基金能*系统性地*打败市场。所谓“打败市场”,就是在比较长的时间内,你的投资增长率高于大盘指数 —— 比如标准普尔指数。哪怕是老江湖的投资经理,都做不到打败标准普尔指数 [1]。
每年都有人的投资回报率远远超过标准普尔指数啊 —— 的确有很多,但无法排除运气因素。看看今年投资表现排名前十的公司,再看看去年排名前十的公司,会发现这两个名单非常不一样。可以在一时打败市场,但没有办法长期打败市场。
应该知道的知识则是,就连大盘指数也是有风险的。看看标准普尔指数过去40年的历史 ——

大部分时间内它的确在增长,而且可以连续很多年增长,回报率大大超过把钱存银行。但是请注意,它也有下跌的时候 —— 永远都不知道它明年到底会增长还是下跌。
两个知识放一起,这就意味着,没有哪个投资机构能承诺在20年、30年的时间内年年都给你一个比较高的回报率。据我所知,有一个叫文艺复兴的公司最近这些年做到了高回报率 —— 它用的投资算法不一定是可持续的,而且它不轻易接受新客户 —— 这个要点是几乎所有公司都做不到。
所以,复利赚钱模式的质疑就在于,找不到长期稳定地给你10%回报率的地方。
事实上,那种指望根本就不符合自然规律。真实世界中就不存在长期指数增长的东西。
3.真实世界里的增长
真实世界里一个什么东西的增长,常常呈现像数学家说的“逻辑函数”的样子 ——

可以忽略其中所有的数学细节,记住这个形状就可以。很多学者把这个形状称为“S曲线”。一般公司业务的增长,常常就是S曲线 ——

可以把这个曲线分成婴儿期、扩张期和成熟期三个阶段。
在婴儿期,公司刚起步,在相当长的一段时间内可能是不挣钱的。
一直坚持下去,有一天新产品打开销路了,公司就会迎来一个高速增长的扩张期。扩张期的增长就非常像指数增长。用户带来口碑,口碑又带来新用户,整个是个正反馈的过程。但是这个指数增长不会持续很长时间!
增长速度会很快衰减下来,达到一个平台,相当于是一家成熟的公司。为什么一定会遭遇平台呢?因为市场是有限的。终有一天,竞争对手会赶上来,或者就是你发现全国有可能买你产品的人都已经买了你的产品,你的营销手段到顶了。
这种增长现象在自然界也存在,比如美国每年新感染艾滋病毒的人数,也符合S曲线 ——

所以千万别信什么“长此以往国将不国”之类的论断,病毒不会一直扩散,是会被控制的。
全世界手机用户的增长情况,完美符合S曲线 ——

一开始涨的很慢,然后连续二十年手机用户数快速增长,而到今天据说全世界已经有77亿个手机用户,每10个人拥有10.3个手机,你还能指望快速增长吗?
所以世界上根本就没有“长期指数增长”这种事情。正所谓花无百日红,潮起有潮落。
那难道说一个公司到了平台期就没指望了吗?也不是。如果能制造一个新的增长点,就可以突破平台。
比如说 iRobot 公司的一段经历 ——

iRobot 公司的主要产品是家用的扫地机器人,有过快速增长,到2009年遭遇平台期。就在这时候,他们开辟了一个新领域,搞了个医疗看护的机器人产品,结果获得了第二轮的高速增长。
所以企业必须不断创新才行,只有创新能带来新的增长 ——

理想情况下,一轮又一轮的创新带给你一波又一波的增长 ——

但就是这样也是很难的。如果仅仅是原有产品的一个改进,那还不足以带来新一轮增长,仅仅是维持而已。比如我们看苹果公司 iPod 这个产品的销售历史,虽然历经多次创新,但总的来看还是一条S曲线 ——

真实世界里就算是不断创新,也很难有持续的高速增长。整个地球的人口就那么多,购买力就这么大,你苹果公司再厉害,就算你将来卖汽车、卖游艇,你总不能卖飞机吧?就算你真的卖飞机,也不可能每家每户都买你的飞机。
长期的指数增长,根本不符合自然规律。
4.回报与风险
专门把钱投给成长期的公司,行不行呢?也不行。
成长型的公司未来都尚未可知,可能变成伟大公司,也可能涨几天就没有了。就好像说的那个鸡蛋,搞不好就摔碎了。
再者,即便你判断出这家公司的前景确实很好,那难道别人就看不出来吗?上市公司的未来前景其实都已经包括在它的股价里面了。看市场上有很多市盈率(P/E)特别高的公司,它们当前的盈利非常少,可是股价却特别高,这就表现了市场对它们未来的预期。等你想起来买它股票的时候,它很可能根本就没有被低估。
所谓投资,就是在风险和回报之间做一个取舍。要安全可靠,回报率就很低。要高回报,就得承担高风险。
所以马克思不是说吗?10%的利润就能让资本活跃起来,50%的利润就得铤而走险,100%的利润就可以犯法,300%就得冒绞首的风险 —— 没有这个觉悟当什么资本家?
普通人投资,如果没有时间一天到晚研究股票,特别是如果认为自己并不比专业投资经理更了解股票市场,最好办法大概是去买指数基金。请注意,这个“指数(index)”可不是“指数增长”那个“指数(exponential)”。
这个道理就是,想“用钱生钱”,就得冒险。就算放高利贷,你都还得担心钱能不能收回来 — 古代民间借贷利率之所以那么高,就是因为很多钱根本收不回来。现在买个利率6%的理财产品,人家还得评估一下你的风险承受能力。买国债、把钱存银行,都还有一个能不能打败通货膨胀的风险。
在真实的世界里想要发财,要么拥有某种稀缺的能力,要么掌握稀缺的资源,比如你是谁儿子,要么就是你有眼光。而眼光,说白了,不管是选择投资机会还是选择职业,跟运气非常有关系。当然投资不等于赌博,运气是可以管理的,但是你不能不承认运气的作用 —— 而且在很多情况下是最重要的作用。
那些金融产品的存在,并不是为了让人用存钱的方法发财。
其实在一个金融发达的社会,年轻人不但不应该存钱,而且应该借贷花钱。刚毕业的年轻人又要成家立业又要吃喝玩乐,这时候存什么钱?过去人们总是年轻的时候想用钱却没钱,老了不用钱了却有很多钱,金融的重要作用就是把这个时间上的差异给抹平。
那些把发财的希望寄托在复利上的人,是认知上的懒惰者。当别人拼命工作、甚至冒着风险创业的时候,他们唯一的自律就是少看两场电影、少吃一顿大餐省钱。当别人努力研发创新的时候,他们唯一动脑的地方就是算算这个利率在理论上25年以后能带来多少钱。他们难道不觉得,这想的太简单了吗?
最后,据有人考证,爱因斯坦根本没说过什么“复利是宇宙中最强大的力量”这种傻话。