爱看书的青年,大可以看看本分以外的书,即课外书……譬如学理科的,偏看看文学书,学文学的,偏看看科学书,看看别人在那里研究的,究竟是怎么一回事。这样子,对于别人,别事,可以更深的了解。 ——鲁迅
这本封面的书,现在大概已经买不到了。我读的实际上是下面这本,它是本书的第十版。
译者序中写到:清华大学心理系主任、加州大学伯克利分校终身教授彭凯平老师曾经说过,在美国,如果一本心理学教科书能够再版3次以上,这本书就堪称经典教材了。
那么按照这一标准,这本书绝对是经典了,很值得一读。
这本书从名字来看,似乎是要讲心理学的事。
实际上,它讲了很多关于科学的事情:科学是什么,科学思维是怎样的。对于厘清科学与伪科学非常有帮助。
纲要:
1、可证伪性
2、知识公开化
3、观察实践
(1)操作性定义
(2)研究方法演进
a. 个案研究
b.相关性研究
c.控制与操纵变量
4、概率与偶然性问题
1、可证伪性
首先,必须要明确,科学研究的问题是,能通过现有技术解答的问题。
比如“人性本善还是本恶”,在目前的科技水平下无法解答,因此也就不属于科学的范畴。
前段时间看了一个纪录片,讲中国风水文化的,弹幕和评论里就科学问题吵了起来。一部分人认为,这简直就是封建迷信,不足为虑;另一部分人认为,你们呀就是太迷信科学,世界上存在着许多科学无法解释的问题呢。
本来我是坚定站在前者立场上的科学青年,但看着书中的这一主张,我现在想纠正一下:
风水,以及其他未得到科学检验的理论体系,无所谓科学或者不科学,它只是不属于科学的讨论范畴而已。
我认为这样的说法,应该是公平公正的。
一项现在不认为是科学的事物,或许会在将来技术得到进步后得以解释,而成为一个科学问题。
既然科学研究的问题都是现有技术能够解答的问题,那么相关的理论自然就是可以得到检验,因而就引出了“可证伪性”这一观念。
什么是可证伪性?
一项科学理论不仅能在事后做出解释,更重要的是,它可以进行明确地事先预测,并且这种预测是两面兼顾的:既会告诉我们哪些事情会发生,也会告诉我们哪些事情不会发生。
如果理论预测正确,那么理论就得到了证实;
如果理论预测错误,那么说明这项理论有问题,需要进行修正完善,逐步向真理靠近。
从某种角度来看,后一种情况甚至对科学的发展更有价值——科学就是通过不断排除不正确的理论和假设而走向完善的。
因此,科学从来不承认自己是完美的,科学从不惧怕错误,反而还热衷于把自己处于被推翻的危险境地。
而不可证伪性恰好处于事情的反面:一项理论预测包括了所有可能的结果。它永远不会出错,因此永远不可能被修正,我们也将被禁锢其中,失去了进步的可能。
不可证伪性是伪科学经常使用的保护色。
像这样直白说出来很容易理解,那么为什么会有人相信这种不可能被证伪的理论呢?
因为它们给人们提供了应对世界的安全感。一切都在掌控之中的感觉很好。
然并卵。
2、知识公开化
刚才说到,“科学不惧怕错误,反而还愿意把自己处于被推翻的危险境地”,但人就并非如此了。
人类通常极力避免将自己的信念暴露在可能被驳倒的环境中,科学家也是这样。
于是,他们设计除了一套精巧的系统来约束自己:同行评审。
简单地说,同行评审就是同一领域内科学家交叉检验彼此的知识和结论。只有得到科学团体认可的知识,才是真正的知识,从来不存在只单独存在于某个体头脑中的科学知识。
那么,为什么知识一定要公开化?
因为所有建立在个人直觉、经验基础之上的信念体系都存在一个问题:当出现矛盾观点时,缺乏一种机制来判别孰对孰错。每个人都认为自己是正确的,历史表明,这种信念、观念的矛盾,最终结果通常是权力斗争。
所以,科学要先建立一个公开的、大家都认可的评判标准,然后将各自的结果拿这个评判标准量一量,让所有冲突的观点以双方都能接受的方式得到检验。
而伪科学却通常回避这种公开性的检验。它们通常是恶人先告状,说科学界对它们充满了苛责,不允许它们进入,从而它们自己就躲过了科学的评判。
3、观察实践
科学结论的得出通常都是基于系统性的观察。
(1)操作性定义
科学家怎样给一个科学概念下定义的方式?
他们将概念与可观测、可测量的事件联系起来。
比如,你如何定义“羞怯”?
来看看科学家是如何定义的:他们做出了一个《羞怯量表》
也就是说,科学家是通过一系列的操作、行为事件,并对这些事件进行测量,最终得到某个概念的定义。
为什么要这么做呢?
这种方式使概念从个人化感觉中分离了出来,公开化了——《XX量表》可以使标准得到公开,从而知识就也能得到公开。
想起我之前写《霍乱时期的爱情》书评时,大家都很纠结,男主对女主一生的等待到底是不是爱情呢?我当时提出,要先给“爱情”下一个大部分人都能接受的定义,然后才能公开地评价这个问题。(https://www.jianshu.com/p/011fb242d5b1)
在那篇文章中我使用的是爱情三角理论,《亲密关系》一书中还引用了鲁宾爱情量表,附在下面,以供理解何为“操作性定义”
有些人可能觉得,这样的定义太冰冷了,特别是涉及到心理领域,太没有人情味了。
但这正是最有人情味的。正如前面说过的,只有将人类的理论观点建立在可观测的行为基础之上,让知识公开化,才可以让有冲突的观点以双方都接受的方式得到检验,而不是变成撕逼扯皮,甚至是权力斗争。
(2)研究方法演进
对概念定义结束后,就要进行进一步研究了。
一般对一个现象的研究会分成三步走:个案研究→相关性研究→因果性研究
我们一一来看。
a. 个案研究
通常来说,个案在科学研究中,毫无价值。
是不是很震惊?好吧,那我说严谨一点,个案还是有一点用的:
在特定问题的早期研究阶段,个案或许有用,它可以提供需研究的变量,甚至开启一个新的研究领域;但是当研究成熟后,个案将不再有任何价值,因为它只是个孤立事件,无法提供比较信息。
说人话就是,某一个案说,A因素对事件结果起到了重要作用,但由于它只是一个个案,我们无法获知,当没有A因素时,事件会怎样发展。所以,这个个案没有任何说服力。
此外,之所以个案毫无价值,还有一个很重要的原因是:安慰剂效应。
安慰剂效应就是,无论治疗是否有效,人们都会报告这种疗法有帮助。
因此,无论某个人使用的疗法多么荒唐,只要被应用于一大群人,就总有一些人会乐于为它的效果作证——是不是很像民间偏方的套路?
除了安慰剂效应,还有鲜活性效应在影响我们。
何谓鲜活性效应?相比于更可靠的统计信息,个案更具有说服力,引人注意。
想想我们的日常购物决定吧,有多少次,经过大量的浏览收集资料你终于决定了买某牌子的商品,但突然一个同事或朋友说他/她用了这个质量差极了,你就改变了决定?
虽然个案在检验科学理论时毫无用处,却对人影响极大!人们的这一心理,也为伪科学打开了方便之门。
本来是江湖骗子的把戏,身边有那么一两个人信誓旦旦地跟你说,他们体验过了,效果非常好,你是不是就蠢蠢欲动而无视它身后并不坚固的理论了?
b.相关性研究
当个案研究结束,初步确定了可能起作用的变量。因素A和结果B之间,看似是A引起了B,但一定要不停地敲打自己:相关≠因果!
A与B相关,但不一定A引起B。
一,A和B之间可能存在第三个变量C,与A、B都有关系。
例如,某地调查发现,私立学校的学生成绩优于公立学校的学生成绩,所以,学校类型和学生成绩有关。但这并不能推出,我只要上私立学校,就可以得到更好的成绩。因为成绩与许多因素有关,比如家庭条件,如果是高知家庭,孩子成绩很可能更好,而且高知家庭更可能把孩子送到私立学校。这就是家庭条件分别影响了学校类型的选择和孩子的成绩水平,而从表面看,却好像只是学校类型和成绩的关系。
二,样本的其他特性导致了最终结果。
例如,某地的呼吸疾病死亡率很高,但该地的空气质量良好,这是肿么肥四?
仔细看一下这些呼吸病患者可能会发现一个共性:他们本身都患有呼吸疾病,所以从各地搬到了这个空气质量好的城市来居住。所以,并不是该地的空气导致他们患病。
三,可能是方向错了,并不是A引起B,而是B引起A。
c.控制和操纵变量
在确定了相关性之后,我们就需要进一步细致地研究两者之间是否真的存在因果关系、是怎样的因果关系。
分两步,第一是控制。
所谓控制,就是其他条件完全相同的情况下,需要分别研究含有因素A和不含因素A两种情况下,对结果的影响。后者可称为控制组。
例如,杂志上一篇文章《离婚的持久性伤害》列举了许多历史案例,全都是离婚造成了持久性伤害的案例。
有说服力吗?我看未必,因为我们缺乏非离异家庭个体的控制组,所以我们不能得出任何结论。
除了控制,第二就是操纵变量。
任何事情都是与很多因素有关的,在自然条件下是很难辨别其中某一因素起了怎样的作用,所以需要在实验室创造一种特殊环境,可以将各种因素分割开来,单独研究。
仅观察两个变量(自变量和因变量),直接操纵自变量的变化,可以排除第三变量的影响,相当直观地观察到自变量和因变量之间的关系情况。
除了上述两点,还有一件事情需要特别说明。
自然事件、人类行为通常都是由多重因素共同决定的。当认定变量A和结果B之间存在显著的因果关系时,并不意味着变量A是引起B的唯一原因。
这个道理说起来很简单,很多人也都明白。
但是人们常常会忘记。当人们在讨论一些容易引发情绪的话题时(比如歧视、财富分配、犯罪动机等等),都好像这些事情是很简单的、单维的,导致结果的原因只有一个似的。
4、概率与偶然性问题
我先要说,科学不是确定的。
不要震惊,因为,我们生活的世界本就不是确定的,因此,许多的科学预测都是概率性的。
(《上帝掷骰子吗》一书的后半部分写到相关的物理学原理,有兴趣可以一读。此书是科普向的物理学史,简明易懂,写得也十分有趣,推荐一读。)
引起的常见问题有二:
第一,根本就忽略了科学预测的概率性。
我说,抽烟容易引发肺癌。肯定会有人跳出来说,你看那个XXX,抽了一辈子烟,活到90岁了!你说的不对!
这就是所谓的“某某人”统计学——人们经常认为一个特例就可以让一个规律失效。
然而科学本来就没有奢望可以百分百预测某事,我说“抽烟容易引发肺癌”,意思是,抽烟有90%(这个数字是我随口说的,并没有去查证,只是作为举例)的可能性引发肺癌。
知识不需要完全确定后才是有用的,即便某些知识不能预测个体的具体情况,但如果能对群体总趋势有预测能力,它就是非常有益的。
第二,对样本大小的误用。
理科生肯定都十分明白,样本越小,产生极端值的可能性就越大。
但是样本量涉及的范围远远超出了我们能意识到的范围。
比如,抽血,是从你体内庞大的血量中抽取一点进行化验,用这一点来代表你体内血液的整体情况;肿瘤切片检查亦如此,是从整个肿瘤上切下来极小一部分进行化验。因此,化验结果都是概率性的。
上述说到的依然还是在科学范畴内,在生活中,我们也十分容易误用样本量大小。
不管我们是否意识到,我们会对较大的群体持有一些普遍的看法。我们把对几个邻居、同事、同学的观察,以及在新闻里看到的一些事情放在一起,就迫不及待地要对“人性”啊“中国人”啊发表见解了。
那么既然科学预测都是概率性的,那么预测错误的那极小一部分是什么原因造成的呢?
我的答案是:偶然性、巧合,而已。
是不是非常不满这个回答?
心理学研究发现人类有一种称为“错觉相关”的行为——人类具有解释偶然性事件的倾向:我们的大脑总是不懈地寻求事物之间的关系和背后的意义,努力建立各种模式来对现象进行描述,我们的大脑就是一个贪得无厌的意义制造者。
然而,偶然性和随机性就是我们所在环境中不可分割的一部分,巧合的发生不需要偶然性以外的特别解释。事实上,概率法则已经确保了罕见巧合出现的可能。
举一个生活中的例子。假定某一天里你参加了100件不同的事情(在如今繁杂的信息社会中,这个数字应该很容易达到,你每天会看电视、坐公交或者开车、使用电脑处理各种事情、与人面谈、做家务、就餐、看书、上班完成各种复杂任务等等),罕见巧合指的是这100件事情中有两个事件不可思议地联系起来了。那么这一天中100件事之间共有4950个不同的配对组合,而一年有365天。
这么庞大的基数,罕见巧合的出现,也就不罕见了。
总体来讲,科学的框架基本如此,书中还提到一些细节问题,我没有在此一一罗列。
这本书可以帮助我们辨别出伪科学的真面目,同时也纠正我们有时不那么正确的思维方式。
那么至于伪科学嘛,我就没有在文中举例了,我害怕引起撕逼,大家自己内心做思考即可。