参考
Rosetta基础3: Rosetta能量函数简介 - 知乎 (zhihu.com)
依旧是 吴炜坤 大神的介绍
由于我是初次接触这个,所以根据吴大神介绍,我补充了一些基础的概念性的内容。
Rosetta能量函数的分类
Rosetta从打分项的拟合方法上来区分,可分为物理
势能项和统计势能项:
1.物理势能项通常是从物理上定义的分子相互作用经典公式去计算得到的值,比如范德华力的LJ势函数,库仑力的静电势函数。
2.统计势能项,一般是从蛋白质结构数据库中统计得到。这里有个比较重要的前提假设就是,在数据集中, 出现概率越高的性质或则构象, 其能量越低,出现罕见的则能量越高(玻尔兹曼分布),因此可以通过测定频率直接取对数近似能量的大小值。比如,通过统计蛋白质主链上的phi, psi角的分布情况就可以统计得到Ramachandran图,其中点越富集说明这些主链构象的能量越低,在自然界中频繁被观测到。
在Rosetta中,氨基酸的模型有两种,一种是粗粒化模型,一种是全原子模型。
在Centroid模型下,氨基酸的侧链被一个有一定半径大小的粗粒化球所替代,而在full-atom模型下,所有的侧链原子被显式的表示出来。因此Rosetta的打分函数的项的组成也会根据选用的氨基酸模型不同而不同
能量函数每一项的具体解释
L-J势--范德华力
Van der Waals forces include attraction and repulsions between atoms, molecules, and surfaces, as well as other
intermolecular forces.这里产生相互作用的原因是 偶极-偶极的相互作用(一个极性分子带有部分正电荷的一端与
另一分子带有部分负电荷的一端之间的吸引作用)。
The Lennard-Jones potential is often used as an approximate model for the isotropic part of a total (repulsion
plus attraction) van der Waals force as a function of distance.—通常用于分子建模中表示范德华力
L-J势, 是用来模拟两个电中性的分子或原子间相互作用势能的一个比较简单的数学模型。 L-J势从物理意义上讲,12次幂项可认为是对应于两体在近距离时以互相排斥为主的作用, 6次幂项对应两体在远距离以互相吸引为主的作用。 其中 ε 是位能井的深度, σ 是有限距离内粒子间的位能为零的间距, d是粒子间的距离. (物体在万有引力(包括重力)、弹性力等势场中,因所在的位置不同而具有的能量。因势场的性质不同,称为引力势能、重力势能和弹性势能。静电场也是个势场,电荷因在静电场中位置不同而具有的能量称电势能。由于各物体间存在相互作用而具有的、由各物体间相对位置决定的能叫势能,又称作位能)。
fa_atr为Lennard-Jones LJ6-12势中的吸引项, fa_rep为排斥项。将范德华力拆分后, Roseta可以更加方便地进行模拟退火,如单独设置个调整fa_rep和fa_atr的权重。 fa_intra_rep与fa_rep类似,引入该项是氨基酸残基内部的原子的冲突。
静电势--库仑定律
库仑定律(Coulomb's law)是静止点电荷相互作用力的规律。 1785年法国科学家C,-A.de库仑由实验得出,真空中两个静止的点电荷之间的相互作用力同它们的电荷量的乘积成正比,与它们的距离的二次方成反比,作用力的方向在它们的连线上,同名电荷相斥,异名电荷相吸。
在Rosetta中的一个重要假设是库仑势中的介电常数ε是与两个电荷原子之间的距离决定的,如果两个原子的距离比较近,那么假设他们之间可能只有真空或则一些极性相互作用的原子,因此介电常数比较小,如果距离非常地远,那么他们之间可能填充了水或非极性的物质(如蛋白质的内核),那么介电常数假设为比较大。介电常数的值根据二者的距离发生变化,是通过一个sigmoidal function进行拟合而得ε_core=6, ε_solvent=80。
静电势项做了截断处理,只有dmax = 5.5埃范围内的静电势才会被计算。当距离小于1.4埃时,静电势曲线斜率为0。在1.45-4.5埃范围内使用三次函数拟合,进行曲线平滑处理,避免由于截断处理带来的不连续性。和范德华力一样引入了共价连接权重(connectivity weight)。
溶剂化能
溶剂化能是溶剂分子与溶解于其中的离子,在相互作用形成络合物的溶剂化作用过程中放出的能量。
天然的蛋白质折叠倾向于形成疏水内核,使得在外部的疏水残基数量尽可能的少(疏水力)。(原因: 当蛋白质中的疏水侧链聚集蛋白质内部,而不是被水溶剂化时,蛋白质在水中是很稳定的。疏水相互作用在维持蛋白质构象中起着主要的作用)。但是如果将分布在蛋白质表面的水分进行建模过于耗时,因此在Rosetta中,采用的是Lazaridis-Karplus (LK) implicit Gaussian exclusion模型计算(量子化学模型),该模型通过计算两个原子间的距离来近似计算能量。
在Rosetta中溶解模型由两项组成:
- fa_sol: 各向同性的溶解自由能, 假设一个原子周围的水分子是均匀分布状态,用于评估非极性原子(各向同性指物体的物理、化学等方面的性质不会因方向的不同而有所变化的特性,即某一物体在不同的方向所测得的性能数值完全相同)
-
lk_ball_wtd: 各向异性的溶解自由能, 假设水分子非均匀分布,用于评估能极性原子(各向异性是指物质的全部或部分化学、物理等性质随着方向的改变而有所变化,在不同的方向上呈现出差异的性质)
ps:没咋搞明白这个是啥:(
氢键
氢原子与电负性(电负性 是元素的原子在化合物中吸引电子的能力)大的原子X以共价键结合,若与电负性大、半径小的原子Y(O F N等)接近,在X与Y之间以氢为媒介,生成X-H…Y形式的一种特殊的分子间或分子内相互作用,称为氢键。
Rosetta使用hbond项与fa_elec一同计算氢键的能量。hbond项是根据Top8000高精度结构数据库中衍生得到的,首先通过将蛋白质内部的极性相互作用对的分离,并拟合了它们的二面角、键角、供体受体原子的距离等参数的能量分布。目前hbond项与这个4个自由度有关。
氢键项的能量同时与供体和受体的原子类型有关,不同原子权重有对应的设置,为了避免重复计算。 如果骨架与骨架之间已经产生了氢键,那么侧链与骨架原子之间的氢键计算被排除。
二硫键键能
二硫键(disulfide bond) 是连接不同肽链或同一肽链中,两个不同半胱氨酸(cys)残基的巯基的化学键。二硫键是比较稳定的共价键,在蛋白质分子中,起着稳定肽链空间结构的作用。二硫键数目越多,蛋白质分子对抗外界因素影响的稳定性就愈大。
Rosetta二硫键项也是与hbond类似,从数据库衍生得来,与具体二硫键的构象有关。二硫键有6个自由度: S-S硫原子间的距离、两个Cβ-S-S的键角、 Cβ-S-S-Cβ二面角以及两个Cα-Cβ-S-S二面角。
拉氏图-Ramachandran--主链二面角合理性
侧链构象
此项用于评估侧链构象的能量值大小,计算原理是从dunbrack rotamer数据库(记录了每一种rotamer的类型,出现的概率以及每个chi角的平均值和方差值)中查询该Rotamer类型出现的概率大小,并且与rotamer的平均构象的偏差值来评估能量大小。如果选择的Rotamer在phi/psi范围内出现的概率高,且构象与平均构象越接近时, Rotamer的内在能量越低。
Dunbrack rotamer库将氨基酸侧链的chi二面角分为两类: rotameric和non-rotameric。
- Rotameric: A torsion is rotameric when the third of the four atoms defining the torsion is sp3 hybridized
-
non-rotameric: A torsion is non-rotameric if its third atom is sp2 hybridized
左图为电子排布式,是表示原子核外电子排布的图式之一。有七个电子层, 分别用1、 2、 3、 4、 5、 6、7等数字表示K、 L、 M、 N、 O、P、 Q等电子层,用s、 p、 d、 f、g等符号分别表示各电子亚层,并在这些符号右上角用数字表示各亚层上电子的数目。用于解释电子杂化。
右图为蛋白质侧链的chi角。
公式
特殊氨基酸相关项
yhh_planarity: 与脯氨酸类似,酪氨酸的chi3角也需要特殊处理,因为羟基的氢通常与苯环在同一个平面内,因此当氢原子偏离时就会生成惩罚的能量。
参考
- 关于范德华力相关介绍_hdpai2018的博客-CSDN博客
- Alford RF, et. al, The Rosetta All-Atom Energy Function for Macromolecular Modeling and Design. Journal of Chemical Theory and Computation, 2017. 13 (6), 3031-3048
- 【3.2.2】肽键(phi/psi angle) - Sam' Note (qinqianshan.com)