之前我们详细了解了经典条件反射。现在我们来学习第二类条件反射,即操作性条件反射。
书中讲了一个例子,我大概叙述一下,可以让大家更好地理解操作性条件反射。一个三岁左右的小孩,不喜欢在餐馆吃饭,只要在餐馆待上大约15分钟,她就会发脾气大声哭闹,由于不想打扰餐馆里的其他顾客,她的父母都会在行为出现后把她带回家。这个例子中的小女孩之所以会在餐馆里哭闹,因为她想回到让自己感到舒适的地方,比如说家。这种行为(发脾气)的结果就是回到家里。这就引出了操作性条件反射的核心原则,行为(发脾气)出现概率的提高或降低取决于行为的结果(回家)。
我们再来将经典条件反射与操作性条件反射做个比较,前者的核心特征是刺激之间的联系,而后者的核心特征是反应(行为)与结果之间的联系。两者的反应类型也存在差别,前者的反应具有典型的反射性,即在环境中产生了对某事的自动反应,如看到食物或听到铃声都是环境中的事件。而后者的反应更为复杂,如发脾。
下面我们再来了解一下两类结果对反应的影响。
1.强化,即增强了反应或者使反应更容易再次发生。例如当你的狗狗在饭桌边向你乞求食物时,你给了它一块羊排以后,它的乞求行为可能会增加。所以说强化物可以粗略地等同于奖赏,但千万别理解成他们完全相同。因为“奖赏”一词好像暗指了时通过努力获得某物后产生了愉悦感或满足感。无论一种刺激(结果)有多么让人愉悦,如果它没有增大反应出现的可能性,那它就不是一个强化物。比如说领到每个月的固定工资是一件今人愉悦的事,因为你努不努力工作都会得到工资,那么这些固定的钱就不会强化“努力工作”的行为,但是“每个月的奖金”就是很好的强化物。
2.征罚,会削弱对应的反应或降低该反应再发生的可能。任何不愉快(反感)的刺激或事件(结果)都可能成为惩罚物。比如你的狗狗向你乞求食物时,你不但没有给它食物还嘲它大吼,那它乞求的行为可能就会减少。想想,我们平时是不是总用“惩罚”来教育孩子的呢?别怕,我不会评论这种“惩罚”的对错,这只是一种操作性条件反射的例子而已。
书中还告诉我们,一种反应之后的结果出现得越及时,其强化或惩罚的效果就越明显。想想真是这个样子呢!
接下来我们再来学习几个有关强化和惩罚的概念。
1.初级强化物/初级惩罚物,食物、水、爱抚,以及舒适的气温都是自然自强化物,因为它们能够满足我们基本的生理需求,因此被认为是初级强化物。与之相似,疼痛、炽热、寒冷本身都具有惩罚性,因而被称为初级惩罚物。初级强化物和初级惩罚物也并不是常有效的,无论在现实生活中还是科学研究中,它们都存在一些缺陷。比如在你不渴的时候。水对于你而言就不是什么奖赏了。
2.次级强化物/次级惩罚物,它们是被习得的,可以有效地控制行为。金钱、赞扬、鼓励、好评为常用的次级强化物。批评、责骂、罚款以差评为常用的次级惩罚物。例如金钱对大多数人的行为有影响,因为它可以用来交换初级强化物,比如食物。次级强化物/惩罚物与初级强化物/惩罚物相联系,从而获得了影响行为的能力。所以初级强化物和初级惩罚物也被称为条件性强化物和条件性惩罚物。是不是脑子里有点乱,那你把强化物和惩罚物认为既是结果也是刺激原,他们会影响某些行为出现的次数。这样会不会容易理清楚一些呢?接下来还有更另人容易混淆的概念呢!如果想挑战一下的话,请继续看下去。
3.正面和负面强化物/惩罚物。像上面提到的狗狗乞求食物的例子,你给的羊排可以使它愉悦,那它的乞求反应就会增加。再比如你通过刻苦学习获得了好成绩,那么刻苦学习就会继续或是增加。像这种因愉悦的结果而使反应或行为更加频繁发生的过程被称为正强化。而另一种强化,移除某些让人不愉快的事情,结果也能使反应或行为更频繁地发生,即负强化。比如有人总是向你唠叨快去学习,你很烦,你就会立刻去学习,避免再听到唠叨,这样你学习的行为就会继续或增加。
同样上面的“正”、“负”也可运用到惩罚上。令人不愉快的事情可能会令一些行为减少就是正惩罚。一些令人愉快的事情被移除或减少也会降低行为出现的次数就是负惩罚。怎么样,是不是又“傻傻分不清楚了”,没关系,其实我刚开始看的时候也一样,脑子里像灌满了浆糊。我是在读了两遍后,又写了此小节的书评才慢慢地捋顺了一些,趁着我现在头脑还算清醒,我把我的理解分享给大家,希望对大家有所帮助。
以下为个人看法,仅供参考。
经典条件反射与操作性条件反射的直观区别:经典条件反射刺激在先,反应是结果,如狗先听到铃声再流口水。而操作性条件反射刺激在后,刺激是结果,反应是行为。如狗狗乞求食物,你给它羊排就是结果,它乞求的行为增加就是反应。
“正”、“负”与“好”、“坏”无关,“正”是增加某个愉悦的事情或是增加某些不愉快的事情,“负”是减少某些不愉快的事情或是减少某些愉快的事情。简单地说“正”就是增加,“负”就是减少。
强化是愉悦,目的是使行为增加。惩罚代表痛苦,目的使行为减少。
这回你有没有理解透彻一些呢?