心理学虽然被大众视为一门学科,但却很难找到统一的高层理论,而是分散成了众多细分领域去各自研究,在这一点上其实并不陌生,就和物理学分为力学、光学、电学、量子物理学等等。
为什么心理学是一门科学?因为它符合科学方法的三条原则:
- 科学采用系统实证主义的研究方法;
- 它以可公开验证的知识为研究对象;
- 它研究实证可解的问题,并产生可检验的理论。
科学研究常常发表期刊并接受同行评审,正是为了保证其公共性。
我们平时总是学习到和相信一些常识,并用这些常识来解释人类行为和事物发展,比如“人类的大脑只使用了10%”、“成绩好的学生比成绩差的学生要不擅长体育和交际”等等,且似乎总能解释得通,但心理学实证研究后往往总是证明其为谬误不实的,但公众却往往掩耳盗铃般不愿相信这些真实地科学。
心理学研究往往受到诋毁,不实因为认为它不好,而是因为他们希望避免研究结果可能给他们带来的影响。
一种理论是否是科学的真理,往往要求其有被证伪性,这听起来很矛盾,但其实很好理解,你不能提出一个听起来完全没有手段去证伪它的理论,然后让人们相信,比如你不能说灵魂是存在的,只是人们看不到而已,这种理论无法被证伪,因为你都说了人们看不到,那证伪的手段就被你给堵死了。真正科学的理论,要求必须是详细到可以被证伪的,任何一个地方出了问题,都能说明它是错的,正因其有这种底气,恰恰才是科学的。
对于科学的概念,需要用可操作性的方式来表述它,而不能是虚的,纯意识性的表述,这样才能提供证伪性。
个案研究和见证作为评估心理学理论和治疗的证据是毫无价值的。
……这一康复比例中,有相当一部分是由于安慰剂效应和时间推移这两个因素共同作用的结果,时间推移通常被称为自然康复现象。
在说明一项理论主张时,是不能用一些个例和见证来作为证据的,而这正是大量偏方、传说的证明方式。为何不能只用个例和见证,因为一个个例可能被太多因素影响产生某种结果,要进行证明,必须采用控制变量的方式。此外,安慰剂效应的存在也大大影响了效果的置信度,因为人类本身就有着很强的自愈性,当你产生了效果,往往安慰剂效应占了很大的比例,而这同样需要在实验检测中进行变量控制,来排除影响。
但是人们确实太容易被个例和见证所影响了,即使你有着大量的研究材料作为基础,也很容易受直观的一些个例和见证摆布,使你的思维产生怀疑和偏差,但是要知道,每件事情都有太多种可能,你所遇到的鲜活个例,只是恰好被你遇到了,但其实还有大量没有被遇到的情况,而覆盖大量个例的调研材料,才是更可靠的资料。
人们很容易受到一类误导,就是认为相关性很强的两个变量具有因果关系,但实际上,这两个变量之所以相关性很强,可能是由于都与第三个变量相关,而这个变量,才是真正的因果。实际生活中,这种情况经常出现,但人们往往很难发现这个诡计,如果被有心人特意拿出来说明问题,更是可能被人们坚信,毕竟数据很好地证明了他的理念。在这一点上,还有一点要注意的就是不要遗漏了证据的有效性。有时候拿来进行说明的数据证明,很可能会陷入选择性偏差,即错误的选择了数据进行对比,但实际上却是有差别的,这也可以用上面说的控制变量法来进行避免。
具有讽刺意味的是,急于让科学家们解决实际问题,而不让其考虑“其他事情”(基础研究)的做法,被证明是最不切实际和目光短浅的。
现在正在做着类似应用研究的工作,即使用现有的算法模型来解决实际应用场景的问题,看到这句话,深感震撼。
在做研究时,有两点需要保障。第一是实验是需要控制变量的,即常常要在人为干预的情况下,设立自然界中不太会出现的情境,来剥离复杂变量之间的相互影响,使假设中的变量成为唯一的区别。第二,是被试者的随机性问题。这个随机性,主要是指被试要随机分配在实验组和控制组中,使两组人的分布尽量均匀,而不是要对被试者的取样进行随机。在心理学中,有些研究属于应用研究,这本身就要求被试是具有特殊性的,另一种基础研究,虽然不对应特殊情境,但由于心理学本身就很有普适性,对于被试的随机采样并不过分要求。这就如生物实验往往从动物开始,确定理论后才开始在人身上做测试一样,你可能会质疑动物不能代表人,但实验结果往往证明,动物和人的实验结果常常是相似的。同样的,在心理学上,很多时候在不随机采样的的被试者身上(例如大二学生)进行实验,其得出的结果常常也能和其他人相契合。而一些不那么契合的情境,心理学家们也常常进行重复试验进行验证,并且自己时刻会提醒自己这一点。
心理学,乃至其他科学的理论发展,都不是跃进式的,不会突然出现一种颠覆性的理论来推翻所有以往的理论,即使是爱因斯坦的相对论也不例外。每一种新理论,除了能解释新问题,还必须要能够兼容旧问题,否则不能说他是确定的。非跃进式还有一个原因在于,一种理论不会仅仅基于一项实验数据得出,它必须经由“聚合性证据”来汇总说明,可能会从大量的相互关联、甚至相对的实验结果中分析得出。
在解释一种行为或现象时,一定要牢记的一点就是,原因是多样性的,是多重因素共同影响的结果。千万不要走入单一因素影响的误区。也许,会有某些因素比较重要,上文所说做控制变量的实验来找因果关系的方法似乎就是在找寻单一因素的过程。这也是有意义的,因为有些因素即使不是唯一影响因素,但其影响力足够大,对其的研究已经能够产生足够的意义,例如降低多少死亡率等等。更常见的,是多种因素交互影响之下,其效果会远远大于其任何单个因素的影响力,甚至大于其之和,也就是1+1>>2的效果。因此,在寻求解释时,不要钻牛角尖去力挺某个因素而无视另一个因素——它们两个,及其结合,可能都是原因所在。
在心理学中会大量使用概率式的结论,其实这一点在其他学科中也频繁使用,比如在医学上无法说某款药100%对所有人的该种疾病都有用,但只要治愈效果达到一个比例,就有运用的必要,人们也不会对此有何苛求,但到了心理学上人们往往要求的更多,而且由于鲜活性例子的出现,人们很可能拿某一个例来反驳一项心理学结果,可能只是因为该个例与自己的期望相反,这一点当然也会在其他学科出现,比如吸烟是否会引起肺癌的例子。
关于概率的另一个问题在于,人们很容易产生赌徒谬误,即人们很容易对随机事件强加自己对随机的理解。比如抛一枚硬币,连续出现了五次正面,人们往往认为下一次更容易出现背面,但其实下一次的结果不会和之前的任何结果有关系,概率还是1/2。这个例子看起来比较好理解,但生活中的各种各样其他结果往往为人们所忽略,从而做出错误的预期。赌徒谬误的另一个方向在于,当人们需要给出随机序列的时候,人们总是去避免长期重复出现某一案例,但实际上真正的随机序列中,该种情况出现的可能往往比人们所以为的要多。由于这种人为控制,刻意地想要实现“真随机”,造出来的反而是“假随机”,这一情况确实很有意思。
以上列举的涉及统计推理理解中出现的错误,仅为冰山一角,有可能阻碍人们正确理解心理学。有兴趣的读者可以阅读由吉洛维奇 (Gilovich )格里芬(Griffin)和卡尼曼(Kahneman)编写的《思维捷径和偏见:直觉判断心理学》( Heruistics and Biases: The Psychology of Intuitive Judgment,,22002),它在这一方面提供了比较完整、详细的描述。
吉格瑞泽(Gigerenzer)的《计算的风险:如何察觉数字是在欺骗你》( Calculated Risks: How to Know When Numbers Deceive You,2002)对统计与概率做了很通俗的介绍(对没有受过任何数学训练的初学者尤其适用)。此外还有哈斯戴(Hastie)和达维(Dawe)的《不确定世界的理性选择》(Rational Choice in an Uncertain World,2001)和拜农(Baron)的《思考和抉择》(Thinking and Deciding,2000)以及尼克尔森(Nickersn)的《认知和几率:概率推理的心理学》( Cognition and Chance: The Psychology gf probabilistic Reasoning, 2004)。
除了概率之外,还有一个相似的概念叫做偶然性,偶然性无处不在,人们在日常生活中总是会遇到一些巧合,但人们总是试图对此作出解释,或者想象冥冥中的天意。作者认为这是由于人们总是想要控制偶然性,很有道理,并且人们认为世界是公平的,或者说老天是公平的,也因此相信善有善报,恶有恶报,这是一种美好的希望,但实际情况是,每个人都有差不多的概率偶然地遇到善报或者恶报,这反而是另一种更宏大的公平。就如再一个上帝的故事中说,有一个大善人非常富有,但它非常虔诚,也常常做好事,但某一天发生自然灾害把他的财产都给弄没了,他自己更是妻离子散,非常悲惨,于是他开始像上帝发问,为何对他如此不公平,上帝的回答了一系列宏大的自然事件,其主旨是,个人的成败荣辱只是非常小的一件事情,上帝关心的是更宏大层面的“公平”。这种说法和作者的偶然性概念非常接近,人们必须正视这种偶然性,否则甚至会产生一些不好的道德观念,比如认为好人是不会受到磨难的,所以一些遇到磨难的人,一定是自身有问题,这种观念实际上就反而非常不道德了。
在多个临床领域中,研究者给临床心理医生一份病人的信息,让其预测这个病人的行为。与此同时,他们也把同样的信息加以量化,用一个统计方程加以分析,这一方程是以先前研究发现的统计关系为基础编制的。结果都是统计方程大获全胜。这就表明,统计预测比临床预测更为准确。事实上,即使是在临床心理医生可以获得比统计方法更多的资料的情况下,后者仍然比前者的预测更准确。也就是说,临床心理医最大生除了拥有与统计预测一样的量化资料以外,还拥有与病人单独接触和群体访谈所得到的资料,但是这并没有令其预测变得像统计预测那样准确。“即使拥有信息优势,临床判断仍然不能超越统计方法;实际上,拥有更多的信息,并不能弥补两种方法之间的差距”(Dawes et al..,1989,P.1670)。产生这种结果的原因当然是统计方程将各种信息数据按照优化标准整合起来,并且做得准确而稳定。优化和稳定这两个因素就让临床心理医生通过非正式方法收集到的资料和信息的优势消失殆尽。
检验临床-统计预测的研究文献中,还包含这么一种方法,那就是给临床心理医生由统计方程得来的预测结果,让其根据自己与病人接触的经验来对这一预测做出调整。结果,临床医生对统计预测做出调整后,预测的准确度非但没有增加,反而降低了(见Daes,1994)。在这里我们又看到了一个不能“接受错误以减少错误”的绝好例子,与前面所述的那个红蓝灯预测实验非常类似。应当利用灯亮次数多少这一统计信息而采用每次都预测红灯的策略(可以获得70%的正确率)时,被试却为追求次次正确而在红灯与蓝灯之间换来换去,结果正确率反而降低了12%(只有58%的次数是正确的)。同样地,在上述研究中,临床心理医生相信,他们的经验应该可以提供给自己一些“洞察力”,从而得以做出比定量数据更好的预测。实际上,这些“洞察力”根本不存在,他们的预测比依赖公开的统计信息所做出的预测要差。最后需要指出的是,统计预测的优越性并不局限于心理学,它业已扩展到了许多其他临床科学中——例如,医学中对心电图的解读(Gawande,1998)。
在让被试者猜下一次亮红灯还是蓝灯的游戏中,被试者会观察到亮红灯的次数多一些,如果他们放弃想要百分百命中率的预测,而使用每次都猜红灯亮的方式进行游戏,猜对的次数反而多于他们自作聪明认为随机性地在两种灯中换来换去猜,这就是不愿放弃错误的存在,执意追求绝对正确,反而错的更多。在临床预测和统计预测的结果上来说也是如此,根据大量数据统计预测的诊断结果往往高于有丰富经验的医生去临床预测的结果,即使他们有着丰富的临床经验。另外,就算多给他们额外的信息,他们还是打不过统计预测,再进一步,即使给他们统计预测的结果让他们去判断是否相信,得分也并没有增高,反而降低了,这和猜红灯蓝灯的游戏一样,临床医生往往试图根据自己的经验去进一步推测,但结果反而变差了。有实验证明,该实验用于医学心电图的识别上也是类似的结果。由此可以思考,互联网医疗,利用科学的力量来辅助诊断,是有其价值的。
上述所有的概念,都让读者感觉作者始终在阐述何为真正的“科学”,以及为什么心理学是一门这正的科学,而到了最后的第十二章,作者终于开始收束全文,先是提醒整个心理学界的专业学者们,心理学这门实际是科学的学科,正处于危机之中,这种危机既来自于外来的伪心理学对大众的误导,也来自于真正专业的心理学从业人员的自甘堕落。世事本就如此,群众喜欢什么,你就想要做什么去讨好群众,并从中获利,但是这种做法非常可能让心理学受到冲击,并渐渐真的成为一门“伪科学”,这无疑是自掘坟墓,也是对严肃的心理学的一种损毁。但作者依然抱有好的期望,因为已经有一批心理学家开始认识到并呼吁心理学的科学性和置信度的构建。这也让我思考,作者作为心理学的从业人员,对自身“行业”有着非常清醒的认识(科学的一面和危机的一面),同时站出来强烈呼吁从业人员们不要做有损该行业的事情,这既是勇气,也是一种精神。
作者对全文做了如下总结:
1.心理学的进步是通过研究可解的实证问题而取得的。这种进步是不均衡的,因为心理学由许多不同的子领域构成,某些领域的问题要比其他领域具有更高的难度。
2.心理学家提出可证伪的理论来解释他们的研究发现。
3.理论中的概念都具有操作性定义,这些定义将随着证据的积累而逐渐演变。
4.这些理论是通过系统实证的方法来检验的,用这种方法收集来的数据是公开的,也就是说,它允许其他科学家重复这些实验并提出批评。
5.心理学家的数据和理论,只有在那些经过同行评审程序的科学刊物上发表之后,才算是进入了科学领域。
6.实证主义之所以具有系统性,是因为它遵循控制和操纵的逻辑,这二者也是真实验的特性。
7.心理学家采用许多不同的方法来获得他们的结论,这些方法的优缺点各有不同。
8.在许多情况下,只有经过许多实验数据的缓慢积累才能得出结论。
9.最终被揭示的行为规律,通常情况下都是一种概率关系。
其实作者提出的很多观点,不单单的正统心理学应用的准则,也是一门研究能称之为“科学”的准则,作者在书中随处可见各种文献引用,书尾更是附上了大量的参考文献条目,也可见这本书确实属于一本很硬核的书,可惜中译名取得有点俗了。不管是想了解真正的心理学科(尤其是心理学专业的学生或者纠结于各种“伪心理学”的普通人),还是想了解何为科学,都推荐这本书。