教材选用《计算精神医学》,季卫东等著;
定义:“计算精神医学(computational psychiatry”)是“计算神经科学(computational neuroscience)”应用到行为研究和精神病学的分支。什么是“计算神经科学”呢?就是用计算机科学的手段来研究神经系统。一般是根据数学物理的理论建立被研究系统的模型,进而做出改系统的解析和预测。本文的目的是概述计算神经科学在精神医学研究中的基本理念和应用。
一、计算精神医学概论
计算模型辅助诊断
通常情况下,从一个行为实验构建计算模型的过程有如下几个步骤:第一步,策略性地设计一个认知任务来探究某个特定的功能(例如,做选择时有奖赏的学习);第二部,选择适当的计算模型(例如强化学习模型)来模拟行为(例如,奖赏评估和抉择);第三步,模型拟合数据,得出模型参数估计。许多此类研究,都是在健康人组于符合特定精神病诊断(例如,根据DSM-V或国际基本分类标准)的病患组之间进行的。而健康人组与病患组之间某些计算模型参数(例如对奖赏的敏感性、学习速率等)的差异作为定义病患组“异常”的基线。然而,计算神经医学的应用并不限于辅助诊断。它的优越性在于可以i将认知过程和行为联系起来,从而有助于多种疾病共享机制的探索。例如,在双系统平衡中,偏离“基于模型的系统”倾向“无模型系统”的表象在许多疾病中都有,其中包括强迫症、暴食症、甲基苯丙胺嗜毒症等。
然而,临床诊断显然必须是为每一个人而下的,因而要实现真正的计算模型辅助诊断,以上的研究模式应该增加第四步。这布的关键是,实验前先不根据症状江受试者分为健康组和患者组,二十在从个体对象中提取模型参数值后,用辅助的统计分析算法如聚类分析(clustering analysis),根据个人的模型参数值将受试者分组(如下图)。这一步是计算模型辅助诊断的关键,如果这种基于个人模型参数值的分类符合受试者行为障碍的差别,则此方案可有望用来辅助争端,并解释障碍的脑机制。
图A:计算精神医学4个层次的图示:模型辅助诊断的步骤包括临床(患者组)和非临床(健康对照组)人群都进行认知任务测试,为认知任务建计算模型,通过你和数据为每个受试者定模型参数,根据得出的多为参数数据分析,发现临床和健康人群类和亚类,或者将模型参数和临床症状严重程度练习起来;
图B:脑功能成像(fMRI)数据的模型辅助聚类分析步骤。(1)提取数据(extraction):提取每个受试者相关功能区依赖血氧水平的BOLD(Blood-Ox-Level Dependent)信号。(2)建立计算模型(modeling):根据每个受试者不同的信号时间序列采样选取计算模型参数,建立受试者特异的模型。(3)模型参数空间表征(embedding in the parameter space):将受试者特异模型参数值在参数空间中表现出来。(4)聚类分析:(clustering analysis):将相近受试者特征类型聚入不同的组。(5)模型验证(validation):验证模型是否与行为实验的临床表现相符。(6)解释结果(interpretation):做出结论并提出新假设。
图C、D:将精神分裂症患组工作记忆实验脑功能成像数据用模拟分析聚类。图C:患者组的无监督聚类分析,采用高斯混合模型(Gaussian mixture model)与动态因果模型(dynamic casual modeling DCM)的参数估计,产生的的平均后验参数可以对模型中每个耦合和输入参数做出估计,在图中由相应箭头的粗细程度显示。图D:根据连接强度来聚类定义的3个亚类,其由阳性和阴性综合征量表(positive and negative syndrome scale , PANSS)量化的临床症状页有所不同。
二、计算神经科学的模型和方法
大脑决定或调控人类的所有认知、记忆、思想和行为。大脑的基本工作单元称为神经元,单个神经元的功能看似简单,但是海量神经元和突触以及树突连接组成了巨大的、极其复杂的信息处系统。基于此产生了计算神经科学这门交叉的学科。计算神经科学涉及动力系统模型、概率统计模及其二者结合,关于计算神经网络基础知识可看这里。
三、精神疾病遗传学统计方法
概念
染色体(chromosome):是细胞内具有遗传性质的遗传物质深度压缩形成的聚合体,其本质都是脱氧核糖核酸(DNA)和蛋白质不均匀地分布于细胞核中。DNA是组成基因的材料,由脱氧核糖及4中含氮碱基组成。
基因(gene):一般指某一特定性状的DNA功能单位,它是一段具有特定结构的连续DNA序列。在遗传学上,将具有一对相对性状的纯种杂交一代所显现出来的亲本性状,称为显性性状,控制显性性状的基因称为显性基因;反之为隐性基因。
减数分裂(meiosis):是指生物体在进行有性生殖的过程中,形成有性生殖细胞的方式。
基因突变(gene mutation):是指细胞中的遗传基因(通常指DNA)发生的改变。
基因重组(gene recombination):是指在生物体进行有性生殖的过程中,控制不同性状的基因重新组合。
连锁(linkage):是指位于同一条染色体上的基因连在一起的伴同遗传的现象。
微卫星(STR):一般指基因组中由短的重复单元(一般为1到6哥碱基)组成的DNA串联重复序列。由于微卫星具有数量多、在基因组内分布均匀、多态性信息丰富、易于监测等有点呗作为优良的遗传标志而得到广泛应用。
单核苷酸多态性(SNP):主要是指基因组水平上由核苷酸的变异所引起的DNA序列多态性。SNP易于基因分型,适于快速、规模化筛查,是最常见的遗传标志。
连锁分析在定位精神疾病致病基因实践中的应用
连锁分析是参照某些已明确位置的遗传标志(如微卫星)来推测某种表型的易感基因在染色体的位置。连锁分析通常采用家系分析的方法来估计两个基因的重组率,从而进行基因定位的方法。
"常见疾病常见突变(common-disease common-varinant CDCV)"模型是目前对于复杂疾病遗传研究最重要的学说,这个模型的关键特点是认为几个基因影响了疾病的易感性。
最常见的连锁不平衡分析的实验设计是基于群体的病例-对照研究,即选择人群、性别及年龄等流行病学指标匹配的病例组和健康的对照组,检查特定遗传多态性的等位基因、基因型或单倍型是否相比健康对照更富集于患病群体中,如果存在富集,则提示致病位点与该遗传多态性处于连锁不平衡,或者该遗传多态性直接参与了疾病的发生。
"全基因组关联分析(genome-wide association study,GWAS)"是指人类全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选处与疾病相关的SNP。GWAS作为一个重要的研究手段让我们找到了从前未曾发现的精神疾病相关的基因以及染色体区域。
基于单位点分析的GWAS是目前最为流行的研究手段,而在大部分情况下,复杂疾病的致病位点不止一个,上位效益(指基因-基因相互作用,epistasis)是常见疾病发病的普遍原因。
基因相互作用统计学算法
- 多因子降维法(multifactor-dimensionality redution, MDR)
- 惩罚logistic回归
- 贝叶斯网络(bayesian networks)法
- 集合关联法
- 随机森林法
在样本量较小的情况下,MDR算法依然有着较高的正确性,但对于高阶模型,其预测能力较差,MDR算法几乎无能为力;惩罚logistic回归在样本量低且阶数高时,具有一定优势,随着迭代次数上升,很难应用到全基因组范围的扫描上;贝叶斯网络法可以加入先验知识,避免数据过度拟合,但它的时间复杂度和空间复杂度都很高,需要一些启发式算法来减少分支,这样会丢失一些位点的组合,也不能用到全基因组的扫描。随机森林法虽然不需要任何假设,但是会导致数据的过度拟合。
四、精神疾病的脑影像计算分析
五、精神疾病与计算科学
精神分裂症的计算神经科学研究
目前,我们对于精神病的看法和其他疾病已经没什么太多的区别,对于精神疾病的基础研究已成为神经生物学领域的一个热点。而生物精神医学和神经科学在解释疾病方面仍然存在巨大的缺陷,主要表现在对于发病机制缺乏一个中间层次的合理解释,从而无法澄清分析水平上的理论假设和临床疾病(诸如精神分裂症、抑郁症和焦虑等)的实际临床表现间的因果关系。因而在精神疾病的分类上,经常招致疑问和争论,比较典型的例子发生在每一次的美国精神病医学协会《精神疾病诊断与统计手册》(DSM)的修订上。
现阶段,神经科学的进步已经可以部分弥补精神医学中对于疾病机制解释的缺陷。其中已经活的实质性进展的一个领域是决策(decision making)的研究。
精神分裂症是精神科比较常见的重型精神障碍之一,在中国人群患病率在1%左右,美国统计数字也为1%左右,约占精神病住院患者总人数一半以上。病人的中枢神经系统尚未发现明显的实质病变,而表现有幻觉(hallucination)、妄想(dellusion)、思维障碍、行为怪异等多种症状。可发生于任何年龄,大多数发病于青年期。
鉴于精神分裂症的理论研究现状和医学临床现状,迫切需求有能将病例现象与已知理论联系在一起的模型(就如了解一个大城市就该急需有张城市地图,哪怕是张不完善的也比没有强),以深入探索精神分裂症机制和改进临床治疗。
- 联想记忆神经网络伪吸引子模型
- 多巴胺门控的连接主义模型
- 精神分裂症的关联维度计算模型
- 精神分裂症的决策模型