我读《心理学》‖书评(七)学习(5)

现在我们知道了经典条件反射强调的是两种刺激之间的联系,而操作性条件反射侧重的是反应如何被刺激(强化或惩罚)。

与经典条件反射相似,在操作性条件反射中,消退是使之前学习到的反应终止的过程。当维持反应的强化物被移除或不再出现,消退才会发生。同样,刺激泛化也会在操作性条件反射中发生。如书中的举例,一只被训练看到圆形图案就用喙去啄的鸽子,在看到椭圆形时也可能去啄。但如果你在鸽子啄圆形时给它强化物,而在它啄椭圆形时不给强化物,最终刺激辨别就会产生。

书上说,有时,人类或动物只有在被称为辨别性刺激存在时,才能学会对某种特定刺激产生反应。比如说一盏灯亮了,鸽子啄圆形就会得到奖赏,灯灭了,啄圆形就会是一种徒劳。鸽子就学会了只在灯亮时去啄圆形(感觉又有些像经典条件反射)。我们人类也是在学会对这些刺激出现时做出正确的反应,来顺利地度过每一天,如看交通信号灯过马路,看其他的人的面部表情判断对方的喜怒哀乐等。

下面我们再来学习两个概念:连续性强化和间接性强化。

当习得一种反应,如果该反应每次发生时均得到了强化,学习速度最快,该过程被称为连续强化。但如果奖赏以一种间歇性强化程序来实施,该反应的消退就会变得更加困难。是不是又懵了?那再来看个例子,实验者每15分钟给鸽子发放一次食物,而当食物出现时,某些鸽子可能正在做某个动作,比如点头或张开翅膀,那么接下来,他们会不断地重复点头或张开翅膀的动作。虽然这些行为对强化物没有任何的关系,但鸽子依然“迷信”地认为自己的动作可以引发食物的“开关”。所以,要想让某种反应在习得后持续下去,就应该间歇性强化它,而非连续强化它。因为经过连续强化后,一旦没有了奖赏,那么反应很快就会消退了。但人们赏犯的错误,就是间歇性地奖赏他们想要消除的反应。比如孩子一哭闹,你就会马上或偶尔去关注他(她),那他将来为了引起你的关注,就会不断地哭闹,哪怕只是因为一点点的挫折。

通过操作性的手段,使你想要发生的反应得到强化的过程称为塑造。首先,你要强化某种反应倾向正确的方向发展,然后逐步产生与最终期待的反应越来越相似,这个过程就叫做连续接近。比如书上举的奶牛自己挤奶的训练过程。首先训练奶牛主动站到挤奶机器人操作的平台上(利用强化物奖赏),然后再训练它找到准确的位置,最终通过奶牛自己的一系列行动,使机器人为它挤奶。这个过程就是操作性条件反射中连续接近的过程。在我们的生活中,动物训练师就是利用塑造法和连续接近期望反应的过程使导盲犬成为了盲人的眼睛。

但我们还是要记住,所有操作性条件反射与经典条件反射一样,都受限于动物的基因特征和生理特征。比如你是无法训练一条鱼离开水而在岸上跳桑巴舞的。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容