2.14 vanishing intersections
福多(Fodor)和其他人认为,大多数分类学习既不能通过反复试验(监督学习,supervised learning)来习得,也不能通过逐渐改变的反复试验来发展(*即分类学习能力大程度上是先天的),重要的原因就是vanishing intersections问题 。如果回到字典里,挑一些实义词,会发现寻找不到那些词所指定事物的感官阴影区(sensory shadows)所共有的不变性,因为它们的“intersection”是空的。
[if !supportLists](A)[endif]向神经网络提供三组刺激:左边刺激的垂直臂比水平臂长得多;中间垂直和水平臂大约相等;右的水平臂比垂直臂长得多。(B)在无监督自动关联之后但在监督学习之前,这三类中的每一个类别的隐藏单元表示的位置(多维数据集表示具有长垂直臂的Ls;金字塔Ls具有几乎相等的臂;而球体Ls具有长的水平臂 )。 (C)类内压缩和类间分离时网已经学会了分离三类输入
2.15 DIRECT SENSORIMOTOR INVARIANTS
不变理论家们同意了福多等人的部分观点,他们认为在正确地分类字典指定的所有类别的成员时的确受到了能力的限制,但是他们否认“先天论”这种神秘的观点。他们假设,如果个体可以进行分类,那么该技能必须具有感觉运动基础,其来源必须是进化发展,学习或两者都有,这意味着shadows中必须有足够的空间来承担我们所有的分类能力。
2.16 ABSTRACTION AND HEARSAY
不仅仅是直接的感觉运动是否不变的问题,通过追溯抽象的源头,分类研究从直接的感官经验获得的范畴,进入到到那些通过语言传闻(linguistic hearsay)获得的范畴。人可以对事物做五种操作——看到它们,识别它们,操纵它们,给它们命名以及描述它们。但其中,识别(Recognizing)是较特殊的,当我们识别出某种事物时,我们将其视为一种我们以前见过的事物(或个体),即类别的成员。 从识别事物(作为一种事物或作为一个个体)到通过为其赋予名称来识别它只是一小步。 “看见”需要感觉运动基础,而“识别”则需要更多抽象的能力,不是简单的被动感知。
2.17 ABSTRACTION AND AMNESIA
2.16提出一个问题:“有非抽象的感觉运动吗?”为了回答,2.17利用小说的内容进行解释。一篇小说《记忆中的福内斯》中描述了一个无法进行抽象的人:他再也不能忘记任何事情,有超强的死记硬背能力。他的生活经历的每一个连续的瞬间都被永久地储存起来;之后,他可以在脑海中重放日常经历,而持续重新体验它们所花费的时间甚至比一开始就经历它们所花费的时间还要长。
无限的死记硬背因此成为障碍,而不是优势——他无法忘记。然而,为了识别和命名事物所需要的是选择性的忘记,或者至少是选择性的忽略。他只能是一个被动的感觉运动系统,受到周围环境的影响。作者将该角色描述为难以掌握抽象概念的人,然而如果他真的拥有无限的记忆和完全丧失选择性遗忘的能力,那么他根本就不会说话,因为我们的词汇都是基于抽象的分类。
2.18 INVARIANCE AND RECURRENCE
2.17描述的是一位小说中的角色,而神经心理学家亚历山大·卢里亚描述了一个真实的人:他有类似的残疾,但并没有延伸到拥有无限的死记硬背能力。在《记忆大师的头脑》(1968)中,罗瑞亚描述了一个舞台记忆艺术家S,他在S还是记者的时候就注意到了这个人,因为S从不做笔记。S不像小说中那样有无穷无尽的死记硬背,而是比普通人更强大更持久的记忆力;但是他强大的硬记能力也是一个障碍——他在阅读小说时遇到了麻烦,因为当描述一个场景时,他会形象地看到自己曾经实际看到过的场景,不久他迷失在依靠自己生动的思想记忆中,无法跟随小说的内容。对于抽象概念,比如数字,甚至是我们不难做出的普通概括,S也很难做到。
S等的故事表明,生活中人需要检测重复发生的能力,而这又需要忘记或至少忽略了什么使每个瞬间变得独特且无法准确重复。如前所述,吉布森的“负担”概念很好地体现了必需的能力:物体在我们的身体与人体之间提供一定的感觉运动相互作用。这些承受能力是感觉输入或感觉运动与输入的相互作用的所有不变特征,并且生物体必须能够选择性地检测这些不变变量,即抽象化它们并忽略其余的变化。如果所有感觉运动特征都可以相提并论,并且每个变化都是无限、独特的,那么就不可能有不变量的抽象来允许我们识别相同或相似之处或识别种类或个体。
2.19 FEATURE SELECTION AND WEIGHTING
丑小鸭定理”也有相同的见解。从逻辑上讲,没有理由说“丑小鸭”可以说与任何小鸭都比更像天鹅。丑小鸭看起来比其他鸭子更相似的唯一原因是我们的视觉系统对某些特征的重视程度高于其他特征,换句话说,它是选择性地将某些特征抽象为特权。当然,我们的感觉运动系统不能对所有功能给予同等的重视。 他们甚至没有检测到所有功能。 在它们检测到的特征中,某些特征(例如形状和颜色)比其他特征更显着(例如空间位置和羽毛数量)。 而且不仅检测到的特征是有限的和差分加权的,而且我们对它们的记忆甚至更加有限:当它们存在时,我们看到的特征远远超过我们以后所记得的——这被称为“降维,它可以通过进化选择产生于固有的不变性检测器,也可以通过无监督和监督产生的学习获得不变性。
2.20 DISCRIMINATION VERSUS CATEGORIZATION
一个来自心理物理学的经典例证是米勒强调的相对区分和绝对区分(relative and absolute discrimination)之间的区别—— The Magical Number 7 Plus or Minus 2。假设你给一个人看一个随机的,不熟悉的形状。紧接着,你再给他们看一遍同样的形状,或者另一个稍微不同的形状。这个人应该能够告诉你这两个连续的形状是相同的还是不同的。这是一种相对区分,基于同时的或快速连续的两两比较。JND(just noticeable-difference)被视作两两相对比较中能够检测到的最小差异。如果差异小于JND,则图形将被视为相同。
假设不是快速连续地展示它们以进行比较,而是单独展示两个图形中的一个,然后问它是两个图形中的哪一个。孤立地识别一个形状是要进行绝对区分的分类。米勒指出,我们进行绝对歧视的能力远比相对歧视的能力受到更大的限制。
米勒把相对区分称为描述(discrimination),把绝对区分称为分类(categorization)。两个刺激(或两个种类的刺激)需要有更多的差异,使我们能够确定两个刺激是独立显示的(分类)还是同时(或快速连续)看到的,我们要做的是判断是否相同。米勒指出,如果这两种刺激只在一个感觉维度上有差异,比如长度,那么我们可以辨别(相对区分)的最小差异JND的大小就可以很小,而我们可以辨别的JND差异的数量沿着维度增加可以是巨大的,我们可以区分的规模和数量取决于感官维度。
相比之下,如果每个刺激都是单独呈现的(绝对区分),米勒估计,对于任何一个感官维度,我们都可以用不同的名称将单个感官维度细分为7个类别,但如果我们试图将维度细分得更细,分类的错误就会随之增加。对分类能力的限制在存储容量上也有相应的要求——如果给我们要记住的一串数字,我们只能记住大约7个数字。 如果数字字符串较长,记忆的错误则会增加。之后科恩重新估计了米勒限制,将其限制为接近四个而不是七个。