看到本章的题目是不是很惊讶,很难理解“学习”一个泛泛平常的中性词,怎么会与心理学扯上关系呢?一个再普通不过的行为怎样用心理过程来解释呢?至少在我还没有学习本章知识前真是有点丈二和尚摸不着头脑。那接下来我就一边学习一边与大家分享吧。
为了让概念更容易理解,我先来介绍一个经典的实验。
这个实验的发起人是俄国生理学家伊凡·巴甫洛夫。他在一只狗的面颊上切开一个口,并置入一根导管,将其唾液腺中的唾液导出,进行测量。为了刺激唾液分泌,巴甫洛夫将肉粉或其他食物放入狗的口中。在重复实验的过程中,他和他的助手发现,一只狗被带到实验室几次后,在将食物放入它嘴里之前,它就会开始分泌唾液了。不论是看到食物或是闻到食物的气味,还是看到盛食物的盘子,甚至是看到喂食者的身影,参与实验的那只狗都会垂涎。这些新的唾液分泌反应显然并非与生俱来的,它们一定是通过经验习得的。
这种现象就是人类及其他动物大部分学习的基础。巴甫洛夫将这种现象称为条件反射,因为它依赖环境条件而产生,是一种基于联系的基本学习。
我们再回到这个实验。原始的唾液反射包括两个关键点,一个是无条件刺激(即嘴中的食物),一个是无条件反应(即唾液)。也就是说反射的出现是先有刺激才有了应对刺激的反应。无条件刺激是指无须学习即可触发特定反应的事件或事物,而无条件反应就是无条件刺激对应的反应。
当一些中性刺激,如铃铛,开始并不会引发狗流口水,但是在食物出现前有规律地出现在狗的视线中时,慢慢地狗就学会了把铃铛和食物联系起来,最后单独呈现铃铛时就能让狗流口水了。
当中性刺激(铃铛)和无条件刺激(食物)发生了联系,中性刺激就变成了条件刺激。条件刺激就能引起一个条件反应或是习得的反应,这种反应通常与原来的、未经学习的反应相似或相关(比如垂涎)。对于这个实验,所有物体均可变为唾液分泌的条件刺激。
像实验中看到的这样,中性刺激与已经引起反应的无条件刺激产生了联系,进而获得引起类似或相关反应的过程,我们称之为经典条件反射,也叫巴甫洛夫条件反射。
你们知道吗?所有的物种,从单细胞到人类,都存在经典条件反射。
条件反射可以持续几个月甚至几年之久。但是,如果条件刺激不和无条件刺激一起重复出现,条件反射就会越来越弱,直到消失,即发生了消退。我们还回到巴甫洛夫的条件反射实验,当铃铛已成为条件刺激的时候,接下来,你每5分钟只摇响铃铛而不给狗食物时,那只狗听到铃声后分泌的唾液就会越来越少,并且很快会停止分泌唾液。但消退并不等于未习得,第二天又摇响铃铛时,狗还是会分泌唾液的,这种现象称为自发恢复。所以有时候为了彻底消除某种条件反射往往需要不止一次的消退训练。
还有的时候,中性刺激可以通过与已形成的条件刺激进行配对联系而成为新的条件刺激,这个过程称为高级条件作用。比如,那只狗已经学会了听铃铛声就开始分泌唾液,那现在在摇铃之前先闪现一道亮光,这样重复几次,狗也可以在看到亮光时分泌唾液了。
当一个刺激成为一些反应的条件刺激后,其他类似的刺激也可能会引起类似的反应,这种现象称为刺激泛化。最形象的例子就是“一朝被蛇咬,十年怕井绳”。与刺激泛化相对的是刺激辨别,即对相似的条件刺激做出不同的反应。
想想我们是不是在上班的时间经常接到电话谈论有关工作的事情。在我们下班的时候电话突然响了,我们是不是也会以为是老板或者客户打来的电话呢?这个应该也是一种条件反射吧!
我们已经了解了经典条件反射的实验和概念。下面我们来举几个我们日常生中的经典条件反射的例子吧。
我们每天都会有意或无意接触的广告就是利用了经典条件反射。广告商利用我们大众都喜欢俊男靓女的特点来吸引我们对商品的注意力,他们会先让我们看到喜欢的人,然后再把商品与俊美的人物产生联系,我们就会自然而然地关注一下这些商品。现在很多广告商都会请来影视剧中大伙的明星来为商品代言,不正是一种典型的经典条件反射吗?而我们在没有了解条件反射之前喜欢称之为明星效应。
再比如说我吧,我特害怕虫子,所以我不太喜欢长时间待在有草或树的地方,我甚至有点讨厌夏天,夏天还没有来呢,此时的我就开始紧张发愁了。对于我来说虫子是无条件刺激,恐惧是无条件反射,而草、树还有夏天就是条件刺激,紧张就是条件反射。
其实有一种方法可以矫治人类所产生的某些恐惧。这种方法叫对抗条件作用,即将条件刺激与其他一些刺激配对,而后者所引发的反应与恐惧相矛盾。比如说有一个非常害怕兔子的小孩,每次治疗时都将兔子与小孩保持一个适当的距离,然后每当实验开始时,都会余外给小孩一些她喜欢吃的零食。然后慢慢地逐渐拉近兔子与小孩的距离,最终小孩不再害怕兔子了,甚至学会了喜欢兔子。与这个过程类似的一系列操作被称为系统脱敏法,后来被用于治疗成年人的恐惧症。
我想如果我试想着夏天可以吃冰淇淋,可以不用穿那么厚的衣服,那我又有点期待夏天的来临了呢!但是让我喜欢上虫子应该是绝不可能的事。这也正说明了书中提到的,对抗性条件作用可能不会消除先前学到的东西,而是通过产生新的学习来推翻旧的学习。
另外科学家们发现改变脑功能也可以帮助克服逐渐衰弱的条件性恐惧的方法。比如让患者服用一种叫D-环丝氨酸的药物,可以加快条件反射消退的速度。随后也证明了该药物针对恐惧症和其他焦虑症的治疗效果。
之前我们详细了解了经典条件反射。现在我们来学习第二类条件反射,即操作性条件反射。
书中讲了一个例子,我大概叙述一下,可以让大家更好地理解操作性条件反射。一个三岁左右的小孩,不喜欢在餐馆吃饭,只要在餐馆待上大约15分钟,她就会发脾气大声哭闹,由于不想打扰餐馆里的其他顾客,她的父母都会在行为出现后把她带回家。这个例子中的小女孩之所以会在餐馆里哭闹,因为她想回到让自己感到舒适的地方,比如说家。这种行为(发脾气)的结果就是回到家里。这就引出了操作性条件反射的核心原则,行为(发脾气)出现概率的提高或降低取决于行为的结果(回家)。
我们再来将经典条件反射与操作性条件反射做个比较,前者的核心特征是刺激之间的联系,而后者的核心特征是反应(行为)与结果之间的联系。两者的反应类型也存在差别,前者的反应具有典型的反射性,即在环境中产生了对某事的自动反应,如看到食物或听到铃声都是环境中的事件。而后者的反应更为复杂,如发脾。
下面我们再来了解一下两类结果对反应的影响。
1.强化,即增强了反应或者使反应更容易再次发生。例如当你的狗狗在饭桌边向你乞求食物时,你给了它一块羊排以后,它的乞求行为可能会增加。所以说强化物可以粗略地等同于奖赏,但千万别理解成他们完全相同。因为“奖赏”一词好像暗指了时通过努力获得某物后产生了愉悦感或满足感。无论一种刺激(结果)有多么让人愉悦,如果它没有增大反应出现的可能性,那它就不是一个强化物。比如说领到每个月的固定工资是一件今人愉悦的事,因为你努不努力工作都会得到工资,那么这些固定的钱就不会强化“努力工作”的行为,但是“每个月的奖金”就是很好的强化物。
2.征罚,会削弱对应的反应或降低该反应再发生的可能。任何不愉快(反感)的刺激或事件(结果)都可能成为惩罚物。比如你的狗狗向你乞求食物时,你不但没有给它食物还嘲它大吼,那它乞求的行为可能就会减少。想想,我们平时是不是总用“惩罚”来教育孩子的呢?别怕,我不会评论这种“惩罚”的对错,这只是一种操作性条件反射的例子而已。
书中还告诉我们,一种反应之后的结果出现得越及时,其强化或惩罚的效果就越明显。想想真是这个样子呢!
接下来我们再来学习几个有关强化和惩罚的概念。
1.初级强化物/初级惩罚物,食物、水、爱抚,以及舒适的气温都是自然自强化物,因为它们能够满足我们基本的生理需求,因此被认为是初级强化物。与之相似,疼痛、炽热、寒冷本身都具有惩罚性,因而被称为初级惩罚物。初级强化物和初级惩罚物也并不是常有效的,无论在现实生活中还是科学研究中,它们都存在一些缺陷。比如在你不渴的时候。水对于你而言就不是什么奖赏了。
2.次级强化物/次级惩罚物,它们是被习得的,可以有效地控制行为。金钱、赞扬、鼓励、好评为常用的次级强化物。批评、责骂、罚款以差评为常用的次级惩罚物。例如金钱对大多数人的行为有影响,因为它可以用来交换初级强化物,比如食物。次级强化物/惩罚物与初级强化物/惩罚物相联系,从而获得了影响行为的能力。所以初级强化物和初级惩罚物也被称为条件性强化物和条件性惩罚物。是不是脑子里有点乱,那你把强化物和惩罚物认为既是结果也是刺激原,他们会影响某些行为出现的次数。这样会不会容易理清楚一些呢?接下来还有更另人容易混淆的概念呢!如果想挑战一下的话,请继续看下去。
3.正面和负面强化物/惩罚物。像上面提到的狗狗乞求食物的例子,你给的羊排可以使它愉悦,那它的乞求反应就会增加。再比如你通过刻苦学习获得了好成绩,那么刻苦学习就会继续或是增加。像这种因愉悦的结果而使反应或行为更加频繁发生的过程被称为正强化。而另一种强化,移除某些让人不愉快的事情,结果也能使反应或行为更频繁地发生,即负强化。比如有人总是向你唠叨快去学习,你很烦,你就会立刻去学习,避免再听到唠叨,这样你学习的行为就会继续或增加。
同样上面的“正”、“负”也可运用到惩罚上。令人不愉快的事情可能会令一些行为减少就是正惩罚。一些令人愉快的事情被移除或减少也会降低行为出现的次数就是负惩罚。怎么样,是不是又“傻傻分不清楚了”,没关系,其实我刚开始看的时候也一样,脑子里像灌满了浆糊。我是在读了两遍后,又写了此小节的书评才慢慢地捋顺了一些,趁着我现在头脑还算清醒,我把我的理解分享给大家,希望对大家有所帮助。
以下为个人看法,仅供参考。
经典条件反射与操作性条件反射的直观区别:经典条件反射刺激在先,反应是结果,如狗先听到铃声再流口水。而操作性条件反射刺激在后,刺激是结果,反应是行为。如狗狗乞求食物,你给它羊排就是结果,它乞求的行为增加就是反应。
“正”、“负”与“好”、“坏”无关,“正”是增加某个愉悦的事情或是增加某些不愉快的事情,“负”是减少某些不愉快的事情或是减少某些愉快的事情。简单地说“正”就是增加,“负”就是减少。
强化是愉悦,目的是使行为增加。惩罚代表痛苦,目的使行为减少。
这回你有没有理解透彻一些呢?
现在我们知道了经典条件反射强调的是两种刺激之间的联系,而操作性条件反射侧重的是反应如何被刺激(强化或惩罚)。
与经典条件反射相似,在操作性条件反射中,消退是使之前学习到的反应终止的过程。当维持反应的强化物被移除或不再出现,消退才会发生。同样,刺激泛化也会在操作性条件反射中发生。如书中的举例,一只被训练看到圆形图案就用喙去啄的鸽子,在看到椭圆形时也可能去啄。但如果你在鸽子啄圆形时给它强化物,而在它啄椭圆形时不给强化物,最终刺激辨别就会产生。
书上说,有时,人类或动物只有在被称为辨别性刺激存在时,才能学会对某种特定刺激产生反应。比如说一盏灯亮了,鸽子啄圆形就会得到奖赏,灯灭了,啄圆形就会是一种徒劳。鸽子就学会了只在灯亮时去啄圆形(感觉又有些像经典条件反射)。我们人类也是在学会对这些刺激出现时做出正确的反应,来顺利地度过每一天,如看交通信号灯过马路,看其他的人的面部表情判断对方的喜怒哀乐等。
下面我们再来学习两个概念:连续性强化和间接性强化。
当习得一种反应,如果该反应每次发生时均得到了强化,学习速度最快,该过程被称为连续强化。但如果奖赏以一种间歇性强化程序来实施,该反应的消退就会变得更加困难。是不是又懵了?那再来看个例子,实验者每15分钟给鸽子发放一次食物,而当食物出现时,某些鸽子可能正在做某个动作,比如点头或张开翅膀,那么接下来,他们会不断地重复点头或张开翅膀的动作。虽然这些行为对强化物没有任何的关系,但鸽子依然“迷信”地认为自己的动作可以引发食物的“开关”。所以,要想让某种反应在习得后持续下去,就应该间歇性强化它,而非连续强化它。因为经过连续强化后,一旦没有了奖赏,那么反应很快就会消退了。但人们赏犯的错误,就是间歇性地奖赏他们想要消除的反应。比如孩子一哭闹,你就会马上或偶尔去关注他(她),那他将来为了引起你的关注,就会不断地哭闹,哪怕只是因为一点点的挫折。
通过操作性的手段,使你想要发生的反应得到强化的过程称为塑造。首先,你要强化某种反应倾向正确的方向发展,然后逐步产生与最终期待的反应越来越相似,这个过程就叫做连续接近。比如书上举的奶牛自己挤奶的训练过程。首先训练奶牛主动站到挤奶机器人操作的平台上(利用强化物奖赏),然后再训练它找到准确的位置,最终通过奶牛自己的一系列行动,使机器人为它挤奶。这个过程就是操作性条件反射中连续接近的过程。在我们的生活中,动物训练师就是利用塑造法和连续接近期望反应的过程使导盲犬成为了盲人的眼睛。
但我们还是要记住,所有操作性条件反射与经典条件反射一样,都受限于动物的基因特征和生理特征。比如你是无法训练一条鱼离开水而在岸上跳桑巴舞的。
通过对经典条件反射和操作性条件反射的学习,我们已经可以对人类(或动物)的某些行为做出合理的解释。
现在让我们对生活中的一些条件反射的例子来进行更深入的探讨吧。
我们知道通过惩罚可以减少一些行为的发生。但在现实生活中惩罚也会变成无效的无用功。比如要遏制社会上某些不良习惯和反社会行为,惩罚似乎是一种不错的,并且很明显的解决方案。但事实上并不是所有的惩罚都是效果的。当违法者偶尔侥幸脱罪时,他们的行为被间歇性地强化了,从而变得难以消退。所以这就解释了为什么很多人无视警告和惩罚而继续做一些不该做的事。
还有一种结果就是被惩罚者会以焦虑、恐惧或愤怒来回应所接受惩罚的事实。比如一些因犯错而受到惩罚的年轻人,会对惩罚他的人或是环境、地点产生憎恨,甚至会对惩罚他的人施以报复。另外惩罚有时也依赖于惩罚者是否在场。比如你刚刚教训了一下犯错误的孩子,但你一旦走开,孩子们可能会继续去做不正确的事情。所以有时候惩罚反而让行为更加频繁地发生了。不过阻止一种行为,尤其是孩子们的错误行为最好的办法就是通过忽略来使它消退。因为当孩子故意犯错时,你大喊大叫地批评他,也许是正中了他的下怀。
其实所有的事物都有它的两面性,世界上没有绝对的正确,也没有绝对的错误。上面我们讲了惩罚的两面性,其实奖赏也和惩罚一样,也不一定会达到预期的效果。比如说老师为了让学习“自我感觉良好”,对一些成绩平平的学生也经常过分地表扬,有时候虽然这些学生得到了自尊心的提升,但结果并没有提高他们的成绩。真正的鼓励与奖赏应该是为了强化学生通过努力或坚持而取得一种进步和成长,并不是“自尊心的增强剂”。奖励,包括成绩,只有当它们与一个人试图增加的行为联系在一起时,才是有效的强化物,而不是被不加区分地随意分发,比如出勤,坚持上完一堂课而不是认真听讲。
书中通过一项有关奖赏的研究实验来揭秘外在强化物对内在强化物的影响。首先研究者给幼儿园的孩子们提供一种特别的彩笔让它们自由创作。很明显,孩子们十分喜欢享受这个愉快的创作过程。随后,研究者告诉其中一些孩子,他们用这些彩笔画画是可以得到一些奖励的。很快,这些孩子就得到了奖励。一周后,再次观察这些孩子,结果,那些得到过奖励的孩子用笔的时间比实验初期少的多,而没有告之可以得到奖励的孩子依然表现出用彩笔自由创作的乐趣。由此可知,当孩子们由于做他们本就享受的事而得到奖励时,奖赏不会起作用。奖励就是外在强化物,愉快地享受就是内在强化物。如果专注于外在,就会因此抹杀了做某件事本身所带来的乐趣。
当然,外在强化物有时在我们生活中也会变成必需的,比如,如果不是因为工资报酬,谁还会一大早起床去上班呢?如果不给淘气的孩子奖励个小零食,他们怎么会乖乖地让你至少可以拥有片刻的安静呢?你还能举出一些我们生活中的一些有关奖赏和惩罚的操作性条件反射的例子吗?其实它们无处不在。
经典条件反射和操作性条件反射慢慢地教会了我们学习。学习这个行为既可以很简单,即学会了某种事物或行为;也可以很复杂,比如它涉及我们的认知变化,受我们的态度、信念和期望所影响。接下来我们就来探讨一下没有强化物的学习。
没有强化物、不以外显反应立即表现出来的学习形式,我们称之为潜在学习。人类的许多学习行为会在环境允许或要求他们表现出来之前一直潜伏着。比如孩子每天在我们的语言环境中长大,我们平时说的话他们也许不会跟着重复,但在未来的某一天,在相同或相似的情景下,他们却做出了准确的表达。通过潜在学习所真正学习到的东西,似乎不是某种特定的反应,而是关于做出某种反应及它所引发结果的知识。所以行为主义者的观点是:人类的行为都受操作性条件反射和经典条件反射法则的制约。同时人类的态度、信念和期望,也会影响他们获取信息、做出决策与推理以及解决问题的方式。
社会认知理论的出现更好地将行为原理与认知原理相结合来解释人类的各种行为。它强调信念、认知和观察他人行为对塑造学习和行为的重要性。所以信念和认知的差距很好地解释了为什么两个经历过同一事件的人可能会从中得到完全不同的信息或教训。
书中还提到一种学习方式,叫观察性学习。即通过观察他人(榜样)的行为而非通过直接经历而学习到新反应的过程。比如孩子通过观察父母对狗的靠近而产生的恐惧反应之后也学习到了对狗的恐惧。事实证明,你在被观察的人身上,越容易“看到自己”,你就越有可能被这个人的经验条件化。
还有另一种说法,如果没有观察性学习,我们都不会活得长久。比如,我们不得不走入车流来学会躲避迎面而来的汽车。
但观察性学习也有它的黑暗面。比如,孩子看到别的孩子抽烟,为了让自己看起来也一样酷,他就很可能也学着抽烟。
最终,还是我们所了解的那样,凡事都有它的两面性,对于不好的一面,还是需要我们想尽办法去努力克服的。
好了,这就是我们本章的学习——有关学习。你学习到了吗?