作者,Evil Genius
这一篇我们继续分子动力学,关于配体分子的处理,那么分析之前,我们需要了解很多的背景知识,每一个组学想要学通都需要花费大量的时间。
问题一:分子动力学模拟为什么不能直接用autodock对接的结果进行模拟
简单来说,这是两套 “操作系统” ,底层逻辑截然不同:
AutoDock 的输出(如PDBQT格式):这是为快速筛选而设计的简化结构。它缺失了MD模拟所必需的力场参数,例如原子的电荷、键、键角等“专属说明书”,其原子类型也与MD力场不匹配。如果强行使用,常会导致模拟时配体从结合位点脱离这一经典问题,或者在
pdb2gmx等步骤直接报错终止。分子动力学模拟的输入:它需要一套能描绘整个分子物理运动的完整“说明书”(力场参数文件),涵盖了每个原子的电荷、质量,以及原子间的键、键角、二面角等所有信息。
问题2:配体分子文件用Gaussian处理的核心目的是什么
通过量子化学计算,从分子的三维坐标出发,获得其能量、稳定结构、电子性质等关键理化信息。
具体而言:
几何结构优化 (Opt)
找到分子在势能面上的最稳定构型(能量极小点)。
为什么重要? 实验测得的或建模软件(如Open Babel)给出的初始结构往往带有不合理的键长、键角,优化后才能代表真实分子。
单点能计算 (SP)
在给定结构下计算体系的总能量及其电子相关性质(如前线分子轨道、电子密度、原子电荷等)。
为什么重要? 能量是所有稳定性和反应趋势的根源,后续分析反应能垒、结合能等都依赖于它。
振动频率分析 (Freq)
验证优化得到的结构是否为真正的极小点(无虚频),同时获得红外光谱、拉曼光谱、热力学量(熵、焓、自由能)。
为什么重要? 没有频率分析,你无法确认“优化”是否成功,也无法预测分子的光谱特征。
预测反应路径与过渡态 (IRC, QST2等)
寻找反应物和产物之间的能垒(活化能)以及过渡态结构。
为什么重要? 解释化学反应如何发生,对比不同反应路径的快慢。
模拟外部环境影响
通过隐式溶剂模型(如 SMD、PCM)或更高级的显式溶剂模型,计算分子在溶液、蛋白质环境中的能量与性质。
为什么重要? 大多数实际化学反应发生在溶液或生物环境中,气相模拟往往不准确。
计算激发态性质 (TD-DFT等)
预测紫外-可见吸收光谱、荧光光谱、激发态能量等。
为什么重要? 解释光物理、光化学过程(如染料、发光材料、光催化剂)。
问题3、分子对接的时候我们已经添加了电荷,为什么分子动力学需要重新分配电荷?
分子对接时添加的电荷,确实不能直接用于Gaussian计算。
虽然都叫“电荷”,但两者在计算方法、物理意义和用途上有着本质的不同。理解这个区别,就能明白为什么需要Gaussian重新计算。
| 特性 | 分子对接软件 (AutoDock, etc.) | Gaussian 16 (量化计算) |
|---|---|---|
| 核心目的 | 快速筛选:在大量分子中快速找到潜在的结合模式,效率优先。 | 高精度分析:精确计算分子的电子结构、能量和性质,精度优先。 |
| 电荷来源 | 来源于经验力场(如Gasteiger、AM1-BCC等),依靠一套预设的规则和原子类型来估算。 | 基于量子力学计算,通过复杂的数学方程(如薛定谔方程)求解“最优”的电荷分布。 |
| 物理意义 | 经验参数:用于模拟分子间作用力的有效点电荷,已经平均化了极化效应,使计算更快。 | 静电势拟合:使其点电荷产生的电场,尽可能逼近真实分子的量子力学静电势分布。 |
| 核心命令/格式 | gasteiger (AutoDock), 能量函数中的静电项。 | #p ... Pop=MK iop(6/33=2) ... 或配合antechamber等工具进行RESP电荷计算。 |
| 在计算中的角色 | 力场参数:作为力场的一部分,用于计算分子间的非键相互作用能(打分函数)。 | 体系定义: .gjf输入文件中的“电荷”(净电荷)和“自旋多重度”用于确定体系的电子总数。 |
| 适用场景 分 | 子对接,常规分子动力学模拟。 | 高精度结构优化,频率分析,计算各种电子性质(ESP, 轨道, 能量等)。 |
为什么对接用的“电荷”不能用?
➡️ 目的不同:精准模型 vs. 快速筛选
分子对接的首要任务是速度,它需要在短时间内处理上万个小分子,因此采用了大量经验性近似,其电荷就是这些近似中的一环。而Gaussian的目标是精度,它通过求解量子力学方程来得到最准确的电子结构。
➡️ “电荷”的定义不同:净电荷 vs. 原子电荷
Gaussian需要的“电荷” (Net Charge):是指整个分子的净电荷数,比如是中性(0)、正一价(+1)还是负一价(-1)。它不关心电荷在原子间如何分布,只关注总和。
分子对接中的“电荷” (Partial Atomic Charge):是指电荷在各个原子上的具体分配,比如一个水分子中氧原子带负电,两个氢原子带正电,这就是“原子电荷”。分子对接时添加的正是这种。
同时,Gaussian的输入文件(.gjf)还需要你指定“自旋多重度”。例如稳定有机分子通常是“0 1”,即中性分子(0)且为单重态(1),这代表所有电子都已配对,没有未成对电子。
电荷 和 自旋多重度 在 .gjf 文件中是不可省略的核心信息,写在分子坐标部分的最前面。
➡️ 精度要求不同:粗略估算 vs. 高精度拟合
以AutoDock最常用的Gasteiger电荷为例,它是基于原子电负性粗略估算的。在一些研究中甚至发现,使用更精确的量子化学(QC)电荷,对AutoDock的打分函数没有带来明显的统计改进。这说明AutoDock的力场本身就不需要特别精确的电荷,够用就行。
但Gaussian的计算需要原子电荷能精确反映分子的真实静电势(Electrostatic Potential, ESP)分布。通常,在获得Gaussian的高精度计算结果后,会采用RESP(约束静电势拟合) 方法或CHELPG等方式,拟合出一套能与HF/6-31G*等高水平理论计算相匹配的原子电荷,用于后续更精确的分子动力学模拟(如使用AMBER或CHARMM力场)。
简而言之:对接用的电荷(如Gasteiger)是“经验估算”,而Gaussian计算出的电荷是基于量子力学的“高精度拟合”。因此,直接用在对接中算好的部分电荷,是无法作为Gaussian的输入文件进行计算的。
问题4、那么如何对分子对接的结果进行分子动力学模拟?
要把 AutoDock 的结果“翻译”成 MD 软件能懂的语言,主要是两个步骤:
1. 准备蛋白的拓扑文件
首先要用 PyMOL 或 AutoDock Tools (ADT) 等软件将蛋白从对接的 PDBQT 文件还原为标准的 PDB 格式。之后,利用 MD 软件自带的工具(如GROMACS的pdb2gmx)或通过 CHARMM-GUI 平台,为该蛋白指定一个力场(如Amber、CHARMM)并生成模拟所需的拓扑文件和结构文件。
2. 准备配体的拓扑文件
GROMACS 无法自动处理配体,这是最需要“手动”操作的步骤。我们需要借助第三方工具为配体生成拓扑文件:
* Sobtop (强烈推荐):这是由国内著名的计算化学家卢天(Sobereva)老师开发的免费工具。你只需将配体文件(mol2或pdb)拖入即可在交互式界面中完成操作,非常方便。
* ATB (Automated Topology Builder):一个免费的在线服务器,上传配体的PDB或SMILES,它会返回对应的ITP/GRO文件,可能需要手动注册。
* CGenFF (CHARMM General Force Field):服务于CHARMM力场的在线服务器,与CHARMM-GUI无缝衔接。
* PRODRG:一个免费的在线服务器,但准确性相对较低,生成的参数可能需要谨慎。
* ACPYPE (AnteChamber PYthon Parser interfacE):一个功能强大的免费命令行工具,它充当桥梁,调用 Ambertools 中的 antechamber 来生成GROMACS格式的拓扑文件。
💎 总结
最直接的核心信息就是:AutoDock的输出文件不能直接用。但只要能遵循“提取分子、生成拓扑、合并提交”这一核心准则,并把为配体创建准确的拓扑文件作为关键步骤来处理,你就可以顺利地将对接的优秀结果延续到更精确的分子动力学模拟中了。
在文章分子动力学--非标残基的处理一(配体)演示了在win系统下的Gaussian计算,那么接下来来到我们的重点,用linux系统计算,首先我们需要了解一下昨天设置的参数
首先第一点:在GaussView的Calculate -> Gaussian Calculation Setup窗口中,这部分定义了Gaussian程序要对你的分子执行什么计算任务。这是所有计算的起点。
| 选项 (Option) | 意义 (Meaning) | 适用场景与备注 |
|---|---|---|
| Energy (单点能) | 对当前的分子几何结构进行单点能计算,不改变原子位置。 | 用于评估一个已有结构的能量、进行布居分析或获取分子轨道信息。必须在已有合理结构后使用。 |
| Optimization (结构优化) | 在势能面上寻找分子的局部最小结构(能量最低点)。 | 用于寻找分子的稳定构型。这是绝大多数计算的第一步。 |
| Frequency (频率计算) | 计算分子的振动频率,并获取热化学数据(如熵、焓)。 | 用于确认优化后的结构是稳定点(无虚频),或分析红外/拉曼光谱。应在优化后的结构上进行。 |
| Opt+Freq (联合计算) | 将优化和频率计算合并为一步。 | 这是最常用的高效组合,一步完成结构确认与验证。适用于稳定的基态分子。 |
| Scan (势能面扫描) | 沿特定自由度(如一个键长或二面角)扫描分子势能的变化。 | 用于研究反应路径、旋转能垒等。比较耗时,适合小体系。 |
| Stability (波函数稳定性) | 检查当前计算所用的波函数是否是基态能量的极小点。 | 用于确保计算结果的可靠性,通常在发现非直观行为或者你指定stable=opt关键词时使用。 |
| NMR (核磁共振) | 计算核磁共振屏蔽张量,用于模拟NMR谱图。 | 用于理论预测化学位移,帮助归属实验谱峰。 |
参数二、方法 (Method Tab) – 选择理论方法
这部分定义了如何近似求解描述你分子体系的薛定谔方程。
| 方法名称 | 电子态 | 方法类型 | 精度 | 计算成本 | 主要用途 | 备注 |
|---|---|---|---|---|---|---|
| Ground State | 基态 | 泛指所有基态方法(HF、DFT、MP2等) | 取决于具体方法 | 取决于具体方法 | 基态结构优化、能量计算、频率分析、NMR等 | 不是单一方法,而是一个选项分类,下方可选择HF、DFT、半经验等 |
| ZINDO | 激发态 | 半经验(Zerner’s INDO) | 低(半经验 | ) 很低 | 快速预测较大分子(>100原子)的UV-Vis吸收光谱、CD谱 | 专门为光谱参数化,仅适用于含有限元素(C, H, N, O等)的体系 |
| CIS | 激发态 | 单激发组态相互作用 | 低 | 较低(比TD-DFT略低) | 定性激发态能量、激发态结构优化(通常不准确) | 忽略电子关联,结果不可靠,已被TD-DFT取代 |
| SAC-CI | 激发态 / 电离 / 电子附着 | 对称性匹配团簇-组态相互作用 | 高(可达到CCSD级别) | 很高 | 精确计算激发态、电离能、电子亲和能;适合中等大小分子的高精度光谱 | 可处理基态、激发态、电离态,适用于闭壳层分子 |
| TD-SCF | 激发态 | 含时自洽场(通常指TD-DFT) | 中等~高(取决于泛函) | 中等(对常规分子可行) | 计算吸收/发射光谱、激发态结构优化、激发态性质 | Gaussian中默认的激发态方法,平衡精度与成本,适用于绝大多数分子 |
| TDA | 激发态 | Tamm-Dancoff近似(常与TD-DFT联用) | 略低于TD-DFT(但更稳定) | 略低于TD-DFT | 当TD-DFT出现数值不稳定或虚激发时使用,例如电荷转移激发或双激发体系 | 去除了TD-DFT中的“去激发”项,避免一些棘手的收敛问题 |
| EOM-CCSD | 激发态 / 电离 / 电子亲和 | 运动方程耦合簇方法 | 非常高(金标准之一) | 极高 | 基准计算:高精度激发能、电离能、电子亲和能,验证DFT结果 | 仅适合小分子(<20个重原子),计算资源需求非常大 |
如何选择?(快速决策指南)
常规基态计算(优化、频率、能量) → 选择 Ground State + DFT(如 B3LYP)+ 适当基组(如 6-31G(d))。
预测中小分子(<50 原子)的紫外-可见光谱 → TD-SCF (TD-DFT),泛函推荐 ωB97X-D 或 CAM-B3LYP(含长程校正)。
预测大分子(>100 原子)的紫外-可见光谱 → ZINDO,快速定性。
TD-DFT 计算遇到严重问题(如大量虚激发或收敛失败) → 尝试 TDA。
需要接近实验精度(如高精度光谱归属) → 小分子用 EOM-CCSD,中等分子用 SAC-CI。
极早期方法(如 CIS) → 已过时,不推荐常规使用。
参数3、基组 (Basis Set Tab) – 定义计算精度
| 基组类别 | 描述 (Description) | 常用场景 |
|---|---|---|
| Pople型基组 (如 6-31G(d)) | 分裂价键基组,6-31G(d)表示对重原子(C, N, O)和氢原子分别使用不同的函数集。 | 对小到中型体系的优化和频率计算是很好的起点。 |
| 增弥散 (如 + / ++) | +(对重原子加弥散函数)/++(对重原子和H均加)弥散函数。 | 适合描述有负电荷、弱相互作用的体系。 |
| 加极化 (如 d / p) | (d)表示对重原子添加极化函数,(d,p)表示对重原子和H都添加极化函数(即6-31G(d,p))。 | 多数常规DFT计算应至少使用6-31G(d)。 |
| Dunning相关一致基组 (如 cc-pVDZ) | 更现代的分裂基组,精度高。 | 对精度要求高的场景,但计算成本也更高。 |
| Ahlrichs基组 (如 def2-SVP, def2-TZVP) | 另一类现代基组,平衡精度与效率,def2-TZVP适用于高精度。 | 在材料化学和金属有机化学领域非常流行。 |
| 混合/自定义基组 | 可以对不同原子指定不同的基组。 | 高级用法,通常用于需要高精度处理金属中心的结构优化。 |
| Basis Set (泛函加基组) | 在Method标签页选择合适的基组。例如,常用的组合是B3LYP/6-31G(d,p)。 | 优化有机小分子的黄金起点。 |
实战选择指南
常规初筛、大体系估算:STO-3G, 3-21G, 6-31G。速度最快,但精度有限。
高精度计算:6-311+G(d,p) / cc-pVTZ / def2-TZVP。对能量和结构精度要求高的体系,计算量适中。
过渡金属、镧系锕系元素:必须使用赝势基组,如 LANL2DZ, SDD, def2-TZVP+ECP。有效处理内层电子相关性和相对论效应。
激发态计算:aug-cc-pVTZ / 6-31+G(d,p)。弥散函数对描述激发态电子云扩张至关重要。
参数4、溶剂模型 (Solvation Model) – 模拟真实环境
Solvation标签页设置,这部分内容让计算考虑溶剂环境的影响,通常在与溶液反应或生物体系模拟相关时是必须打开的。
| 选项 (Option) | 意义 (Meaning) | 适用场景 |
|---|---|---|
| PCM / IEFPCM | 可极化连续介质模型,将溶剂视为均匀连续介质,在溶质周围形成穴。 | 结构优化、振动分析、NMR等常规溶剂效应计算的首选。 |
| SMD | 溶剂模型,基于溶质-溶剂之间的静电作用和空穴作用产生溶解自由能。 | 计算溶剂对反应自由能的影响,适用于结构优化。 |
| Solvent | 用于选择具体的溶剂种类(如水、甲醇等)。 | 描述需要匹配你实验条件的特定溶剂类型。 |
| Cavity (孔洞) | 展示溶质在溶剂中占用的空穴。 | 通过Results -> PCM Solvation Cavity分析空穴几何,仅用于可视化。 |
参数5、附加计算与属性 (Additional Calculation & Properties)
这部分在Gaussian Calculation Setup窗口的Properties标签页中,用于控制程序输出除基础信息(如能量和轨道)外的更多分子属性。
| 属性类别 (Property Category) | 主要选项与描述 | 何时有用 |
|---|---|---|
| Population (布居分析) | Population (NBO, QTAIM, ESP) 分析电荷分布。 | 用于研究分子中电子分布、化学键特性、预测反应位点时必备。 |
| Checkpoint (检查点文件) | Link 0命令定义%chk文件名,用于保存中间结果和计算成果。 | 所有需要保留轨道的长期计算都应包括。 |
| Molecular Orbitals (分子轨道) | Output MOs 和 Generate MO surfaces 打印或保存分子轨道系数。 | 用于可视化HOMO/LUMO等轨道。 |
| Electrostatic Potential (静电势) | Generate ESP from CHK 在Results -> Surfaces中可生成静电势图。 | 可视化分子表面静电势,识别亲电/亲核区域。 |
| Vibrations (振动分析) | 可视化频率(Results -> Vibrations)动画,并生成红外光谱。 | 用于确认最小点无虚频,或归属实验振动峰位。 |
| Other Properties | NMR、极化率、超极化率、非线性光学特性、四极矩等高级响应 | 分子间相互作用、NMR归属、非线性光学材料设计。 |
参数6、资源命令 (Link 0 Tab) – 提交资源与系统控制
这部分在Gaussian Calculation Setup窗口的Link 0标签页中,定义了计算所需的硬件资源。
| Link 0 命令 | 描述与建议 |
|---|---|
| %chk=jobname.chk | 指定检查点文件名。务必使用,用于保存中间结果。 |
| %mem=XXGB | 分配给程序的内存大小。通常设置为总内存的70%-80%。 |
| %nprocshared=XX | 使用的CPU核心数。根据集群设置和分子大小调整。 |
| %nprocshared | 老版本曾用%nproc,但建议在新Gaussian中使用%nprocshared。 |
总结与关键建议
| 需求 | 推荐配置 | 备注 |
|---|---|---|
| 快速测试/调试 | #p B3LYP/6-31G(d) SP | 不耗时,可快速获取能量和基础电子结构信息。 |
| 有机小分子优化 | #p opt freq B3LYP/6-31G(d) | "一键优化+频率",验证结构可靠性的黄金搭档。 |
| 溶液环境计算 | + Scrf=(PCM, solvent=Water) | 在优化或单点能计算中加上溶剂模型。 |
| 弱相互作用体系(如二聚体) | #p opt M06-2X/6-31G(d) EmpiricalDispersion=GD3BJ | 兼顾精度与范德华作用,适合氢键、π-π堆积等。 |
| 可视化属性 | 勾选 Population,并在 Link 0 中设置 %chk | 用于后续通过 Results 菜单绘制分子轨道和静电势图。 |