熟悉面孔识别的神经动力学文献阅读

熟悉面孔识别的神经动力学

The neural dynamics of familiar face recognition

Holger Wiese a,*, Stefan R. Schweinberger b, Gyula Kovacs ´ b

期刊:neuroscience and biobehavioral reviews

IF:7.9 JCR:Q1 中科院:1区

https://doi.org/10.1016/j.neubiorev.2024.105943

一、摘要略

二、 引言

核心概念 ·图像独立性(Image-Independence): 强调熟悉面孔识别的关键在于其不依赖于特定视角、光照等条件,这是基于详细的长时记忆表征。而不熟悉面孔识别则依赖于特定图片的表征,容易出错。

· 熟悉性 (Familiarity): 在面孔识别中,指由已知面孔的视觉表征激活所引发的感觉,区别于情景记忆中的“熟悉性”。

· 识别 (Recognition): 定义为长时视觉表征的激活达到阈值,从而将面孔确认为特定个体。

· 面孔 vs. 人物识别 (Face vs. Person Recognition): 面孔识别是视觉上确认“认识这张脸”,而人物识别是成功访问该人的语义、情景和情感等知觉后信息。

· 文章目标:旨在讨论基于EEG的、针对上述核心特征的近期研究发现,并最终整合出一个修订的理论模型。


三、先前EEG/ERP 研究 (Previous EEG/ERP studies)


· 经典序列加工模型: 介绍了由Schweinberger等人提出的模型,该模型将面孔识别关联;到一系列ERP成分上,虽然允许重叠和反馈,但基本架构是序列式的。


Fig 1经典序列面孔识别模型  


· P100: 反映低水平视觉特征处理。

· N170: 反映面孔检测或结构编码,属于处理个体身份之前的知觉阶段,对熟悉性不敏感。

· P200: 反映当前刺激与原型面孔的“距常模距离”(DTN, Distance-to-Norm),涉及面孔空间配置,仍反映知觉处理阶段。

· N250r (重复启动): 反映对熟悉面孔视觉表征的图像依赖/独立的易化访问。

· N400 & 新旧效应: 反映语义和情景等人物知识的访问。

· 以往研究的局限性: 总结了传统ERP研究的六大局限:

1. 多使用单张图像,未考察图像独立性。

2. 采用熟悉/不熟悉二分法,未考虑熟悉度为一连续的状态。

3. 对自动性的考察基于图像重复,结论能否推广存疑。

4. 关于领域特异性的证据混杂不清。

5. ERP平均方法可能掩盖身份特定信号。

6. 受到“知觉和识别反映同一神经系统内神经证据的累计”(认为N170即存在熟悉性效应)的挑战。


四、新见解:熟悉面孔与人物识别的时间动态(New insights into the temporal dynamics...)


本章节总结了一系列实验,回应了第三部分提出的局限性。


· 4.1 图像独立的熟悉性识别 (Image-independent recognition of familiarity):

· 核心发现: 使用高度可变的“环境图像”(ambient images)和个体化刺激后,发现了两个关键的图像独立效应:

1. N250效应: 熟悉面孔比不熟悉面孔诱发更负的N250波幅。

2. 持续熟悉性效应 (SFE, Sustained Familiarity Effect): 一个在400-600 ms之间、头皮分布与N250相似的持续负性偏移。

· 关键证据: 重复同一图像会显著削弱N250和SFE,证明刺激可变性是引发真正熟悉性识别反应的关键。

· 4.2 熟悉度的水平与类型 (Levels and types of familiarity):

· 核心发现: N250和SFE的效应大小表现出梯度变化(自身面孔 > 高熟悉 personally familiar > 低熟悉 personally familiar > 高熟悉名人 > 低熟悉名人),表明差异主要是量化而非质化的。

· MVPA证据: 解码准确率与平均记忆熟悉度指数(MFI)显著相关,且神经表征在不同熟悉化方式(知觉、媒体、个人)间存在一定泛化性。

· 学习时间进程: 10分钟真实互动即可建立N250效应(24小时后仍存在),但SFE需要更长的熟悉时间(约1年)才能充分发展。


Fig 2 a)与完全(非名人)不熟悉面孔相比,不同类别面孔的效应大小 b)左:跨参与者的平均记忆熟悉度指数 右:面孔熟悉度的神经表征


· 4.3 对任务和自上而下过程的稳健性/自动性 (Robustness to task and top-down processes/automaticity):

· 核心发现: N250效应在内隐任务、高知觉负载任务和隐瞒指令下保持稳定,表明其处理是自动的。

· SFE则受到认知资源和意图的调制,在高负载下减弱,表明其反映了更需要认知资源的评估过程。


Fig 3 上:蝴蝶范式与XN范式示意图 下:差异波曲线(不熟悉条件减熟悉条件,±95%置信区间),显示不同任务和负载操纵下高度相似的N250效应,以及在XN任务中显著减弱的持续熟悉性效应(SFE),特别是在高负载条件下。


· 4.4 熟悉性效应的领域特异性 (Domain-specificity of familiarity effects):

· 核心发现: N250效应对面孔具有高度特异性(在房屋、宠物、物体中未发现)。SFE则表现出领域通用性,表明其反映了更通用的刺激加工过程。

ERP存在高度相似的右半球枕颞区熟悉性效应,MVPA分析显示面孔和场景熟悉性信息均可被解码,且模式相同


Fig 4 a) 右半球颞部电极TP10与枕部电极O10记录的面孔及其他视觉类别(宠物、场景和物体)的环境图像示例与ERP差异波(不熟悉条件减熟悉条件)。b) 时间分辨的熟悉性分类结果(采用留一被试交叉验证)。左面板:类别内分类——熟悉性判断的训练与测试在同一刺激类别内进行。右面板:跨类别分类——熟悉性判断的训练与测试在不同刺激类别间进行。


· 4.5 身份的图像独立表征 (Image-independent representation of identity):

· 核心发现: MVPA显示,100-200ms期间的身份信息相对独立于熟悉度水平。

· 该身份表征的强度在200-400 ms时间窗受到熟悉度水平的调制。


Fig 5 不同熟悉度面孔在不同时间维度上基于被试平均的时间解码准确率


· 4.6 知觉与识别是单一表征吗?(A single representation for perception and recognition?)

· 核心发现: 基于14个数据集(n=288)的mini meta-analysis表明,在环境图像范式下,N170成分不存在一致的熟悉性效应(TP9/TP10效应量~0.03 μV,且可能方向相反),而N250与SFE则揭示高度一致且显著的效应,有力反驳了“统一加工模型”,支持了序列加工观点。


Fig 6 14个数据集中陌生面孔与高个人熟悉度面孔对比的微型元分析


五、综合与整合:修订的面孔识别模型(Synthesis and integration: A revised model of face recognition) 概括


· 提出的三阶段模型:

1. 早期视觉处理 (Early Visual Processing): (~50-200 ms) 处理低阶特征,存在基于物理相似性的“身份”信号,但与真正熟悉性无关。

2. 领域敏感处理/核心系统 (Domain-Sensitive Processing/Core System): (~200-400 ms) 涉及多维面孔空间(MDFS) 中图像独立的长时表征的激活。更熟悉的面孔拥有更大的表征子空间,更容易被匹配。N250是该匹配过程的电生理标志。

3. 领域通用处理/扩展系统 (Domain-General Processing/Extended System): (>400 ms) 访问语义、情景、情感知识并评估行为相关性。SFE和晚期MVPA效应反映了此阶段的评价过程。

· 该模型如何解释核心问题:

· 图像独立性 & 熟悉度水平: 通过“表征子空间”概念整合。

· 自动性: 领域敏感阶段是自动的,领域通用阶段是受控的。

· 领域特异性: 领域敏感阶段是面孔特异的,领域通用阶段是领域通用的。


Fig 7 基于脑电的面孔识别修正模型


六、展望与开放问题(Outlook and Open Questions)


· 未来研究方向:

1. 表征内容: 长时记忆表征中具体存储了什么信息?(3D形状 vs. 表面纹理?基于范例 vs. 基于平均?)

2. 相似性与辨别: 如何在保证图像独立性的同时,防止错误识别?如何利用深度神经网络(DNNs)研究面孔空间中的相似性和不变性?

3. 个体差异: 在熟悉面孔识别能力上(如发展性面孔失认症和“超级识别者”),其神经相关物是什么?

4. 人物识别: 需要更多研究探索整合面孔、声音、姓名、语义信息的神经机制(涉及颞极、内侧颞叶等脑区)。


七、思考与启示


· 本综述总结的实验优势:

  1“环境图像”范式极大提升了效度。

  2结合ERP(高时间分辨率)和MVPA(单试次解码能力),优势互补。

  3多个实验交叉验证,样本量大,元分析结论有力。

· 启示:

· 1在高级认知处理研究中(如物体、场景识别),可采纳环境图像范式和MVPA方法,以提升严谨性。

· 2重视熟悉度/经验水平作为一个连续变量的重要性,而非简单二分。

· 3可探索其他认知任务中是否存在类似的早期自动化vs. 晚期受控的加工分离;可考察特殊人群在特定刺激识别上的神经动态差异。


TP10 O10:10-10系统的命名遵循一个清晰的逻辑:

字母部分:代表大脑的脑叶或区域。


T: 颞叶(Temporal lobe),负责听觉处理、语言和记忆。


P: 顶叶(Parietal lobe),负责躯体感觉、空间知觉和整合信息。


TP: 这是一个交界区,特指 颞叶和顶叶的交界处。


O: 枕叶(Occipital lobe),是视觉处理的核心区域。


数字部分:代表在特定区域上的左右和大致位置。


偶数(如 10): 表示电极位于右脑半球。


奇数:表示电极位于左脑半球。


数字大小:数字越小,越靠近中线(矢状面)。例如,T8 比 T10 更靠近耳朵上方,而 T10(即 TP10)更靠下、更靠后。

TP10是T10 电极的另一个常用名称。在标准的10-10系统中,TP10 和 T10 指的是同一个位置。对于记录听觉处理、语言相关(特别是右脑的非语言声音处理)以及某些类型的认知任务的脑电活动非常敏感。O10是记录视觉evoked potentials (诱发电位) 的关键电极。当受试者看到东西时,视觉信息在枕叶皮层进行处理,会在 O1、Oz、O2 以及 O9、O10 等电极上产生非常强烈的电信号(例如著名的 P1、N1、P300 等成分)。O10 特别有助于捕捉右半球枕叶的视觉活动。


突触后电位(Postsynaptic Potential, PSP) 指的是神经递质与突触后膜上的受体结合后,引起突触后神经元膜电位的局部、等级性变化。它是一种电信号,是神经元之间通信的基本单位。LFP和EEG的本质就是大脑中大量神经元同步产生的突触后电位的总和。当一大群锥体细胞同步兴奋时,它们产生的树突电流会在细胞外空间形成可被记录到的缓慢电压波动。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容