ALISE: Docking + MD + FEP 自动化工作流程

                                       


导读

自动化配体搜索器 ALISE 运用三阶段工作流程,高效地筛选出 HIV 蛋白酶的活性配体。

  • : 第二阶段,进一步评估配体稳定性。
  • ️ 自用能微扰: 第三阶段,准确计算配体与受体的结合自由能。

今天给大家介绍一篇 2023 年发表在 Journal of Chemical Information and Modeling 上的文章, 标题为:《Introducing the Automated Ligand Searcher》。

ALISE 是一种自动化的计算药物发现工具,旨在模拟配体与受体的结合自由能。它的工作流程分为三个阶段:首先进行分子对接,快速筛选潜在配体;其次是分子动力学,用于评估配体的稳定性;最后是自用能微扰方法,准确计算配体与受体的结合自由能。每个阶段都会淘汰表现不佳的配体,缩小潜在配体的范围。

                                       

方法

ALISE 在三个阶段采用越来越复杂的建模方法:分子对接、分子动力学(MD)和自能微扰(FEP)。这种系统方法通过逐步筛选掉不那么有前途的候选物,确保了计算资源的有效使用。

第一阶段:分子对接

  • 目标:确定配体与受体的最佳结合构象。
  • 过程:利用像 VinaMPI 这样的软件在服务器上执行此任务。
  • 关键组成
    • 搜索算法:在构象空间内搜索配体。
    • 评分函数:基于自由能估算对配置进行排名。
  • 结果:识别最佳结合构象及相应的对接得分。

第二阶段:分子动力学

  • 目标:提供配体-受体结合的详情和现实描述。
  • 方法论:涉及平衡全原子 MD 模拟。
  • 关键方面
    • 力场:源自实验和量子力学(QM)研究。
    • 能量计算:使用分子力学-广义 Born 和表面积连续溶剂化方法。
    • 熵计算:采用准谐分析进行详细熵估算。

第三阶段:自用能微扰

  • 目标:估算最有前途的配体的结合自由能。
  • 过程:模拟配体的结合与非结合形式之间的多个状态。
  • 关键特征
    • Lambda 参数:定义从结合状态到非结合状态的渐变转换。
    • 能量计算:通过对每个状态间所有能量差异求和来计算总自由能变化。

ALISE 的价值

  1. 高效资源利用:通过在每个阶段筛选配体,ALISE 确保只有最有前途的候选物进入下一阶段,节省了计算时间和资源。
  2. 提高精确度:ALISE 的每个阶段都提供了对配体-受体相互作用详细情况。
  3. 全面分析:从分子对接到 FEP,ALISE 提供了潜在药物和靶标互动的全面视角。

使用

VIKING16 开发的 ALISE 软件极大地简化了药物虚拟筛选流程。

  • 目标受体:用户可以上传受体的分子结构文件,或者提供 Protein Data Bank ID 以自动在数据库中检索。
  • li>
  • 搜索空间:用户可以手动设定,或利用 AutoLigand 软件自动确定。

使用 ALISE 软件时,用户首先设定目标受体。接下来,选择配体,用户可以上传配体的分子结构文件,或利用 PubChem 数据库进行化学相似性搜索。系统通过 Tanimoto 评分评估化学相似性,并可进行潜在毒性筛选。最后,用户设定搜索空间的尺寸和位置,可以手动操作,或让 ALISE 软件通过 AutoLigand 自动完成。

用户完成初步设置后,将进入总结页面,可检查和调整包括三个虚拟筛选阶段的所有设置。专家用户可以调整对接穷尽性和模拟参数等设置。在 VIKING 平台上,用户从任务总结页面启动药物分子搜索。平台自动处理步骤间的过渡,用户可以监控实验进度,并访问中间结果和文件。

对于从对接阶段获得的最佳配体,ALISE 自动生成一组 MM 力场参数,并基于确定的结合姿势启动 MD 模拟。MD 和 FEP 阶段的模拟文件通过 VMD 中的 psfgen 插件准备,模拟使用 NAMD 执行。MD 模拟完成后,将计算每个模拟系统的自由能贡献,并在结果页面提供自由能贡献的差异和总结。FEP 模拟从 MD 阶段获得的最佳配体的最后配置开始,使用显式溶剂模型进行。在所有模拟中,蛋白质、溶剂和离子均由 Chemistry at Harvard Macromolecular Mechanics 力场建模。

图表二:FEP 循环示意图

图示展现计算受体(大形状)与配体(小形状)间结合自由能 ΔG0 的 FEP 循环。配体上虚线框标示约束。配体实心黑色时,与环境相互作用,条纹图案则表配体不与环境互动。FEP 计算沿箭头方向执行正向扰动。

                                       

图表三:ALISE 用户界面

  • (A, B) 可从在线数据库上传或获取受体和配体分子结构。
  • (C) 对接阶段搜索空间可手动或根据 AutoLigand 软件自动定义。
  • (D) 摘要页面显示并允许修改虚拟筛选期间对接和模拟设置。
  • (E) 点击“运行任务”后,在概览页面监控任务当前状态。
  • (F) 每阶段结束后,结果页面提供按结合自由能排名的配体列表和模拟结合模式图示。
                                       

图表四:ALISE 执行的自动化工作流程

可选步骤和必需步骤分别用黄色和蓝色框表示,绿色框显示各阶段后的结果。结果在结果页面显示,见图表三步骤 F。

                                       

图表五:ALISE 在三个计算阶段发现活性配体与随机选择的比较

横轴表示全部配体(活性和诱饵)进度百分比,纵轴显示该部分中发现的活性配体百分比(第一行)。第二行纵轴显示两曲线差异。ALISE 排名(红线)高于随机选择(蓝线)意味各阶段表现更佳。

  • (A) 对接阶段 ALISE 排序(红线)始终超过随机选择(蓝线),成功对接 1395 个活性配体(最后一点)。灰色区域代表进入 MD 阶段的 100 个配体。
  • (B) MD 阶段,ALISE 在发现活性配体方面效率高于随机选择。灰色区域代表进入 FEP 阶段的 15 个配体。
  • (C) FEP 阶段提升 MD 阶段结果,ALISE 排名活性配体优于随机选择。
  • (D-F) 展示 ALISE 性能与随机选择方法差异。积分 I(灰色区域)是 ALISE 优于随机选择的指标。正值表性能优势。对接阶段值为 0.00235;MD 阶段为 0.0931;FEP 阶段为 0.15835。
                                       

图表六:最佳结合自由能估算配体

面板 A 和 B 展示 ALISE 框架获得最佳结合自由能估算配体。A 显示结合在蛋白质结构表面的配体,B 展现蛋白质的二级结构。

                                       

图表七:由 ALISE 发现的三个排名最高的抑制 HIV 蛋白酶的配体结构

面板 A−C 展示 ALISE 发现的三个排名最高用于抑制 HIV 蛋白酶的配体结构。这些结构来源于 ChemSpider 网站。

                                       

讨论 ALISE 算法在 HIV 蛋白酶筛选中的效果

ALISE 算法在筛选 HIV 蛋白酶方面表现卓越,其性能优于随机选择方法。

HIV 蛋白酶是近年来人类医学的一个关注焦点,由于 HIV 的药物耐受性,研究者们面临着挑战。寻找能结合到蛋白酶并阻碍 HIV 复制的活性配体成为一项关键任务。在这个过程中,对接算法的运用至关重要。

DUD-E 数据库是评估对接算法性能的一个可靠基准库,其中包含活性配体和作为对照组的非活性配体。通过使用 DUD-E 数据库的数据集,研究者可以评估对接算法在识别活性配体方面的有效性。

研究者利用 DUD-E 数据库中的 HIV1 蛋白酶数据集,对 ALISE 程序的性能进行了基准测试,以确定该程序在识别蛋白酶的活性配体方面是否优于随机选择。此外,还比较并讨论了三个不同的步骤:对接、分子动力学(MD)和自用能微扰(FEP)。

在每个步骤中,ALISE 均生成了基于评分的配体排序列表,得分最高的配体进入下一步骤。无法对接或模拟的配体则排名最低。ALISE 在每个步骤的性能均经过评估,并与数据集中随机选择的配体进行了比较。

ALISE 在对接步骤中表现出显著的优势。然而,在 MD 和 FEP 步骤中,这种优势较为微妙。整个 ALISE 工作流程在每个步骤都显示出与随机选择配体相比的量化优势。研究者详细讨论了每个步骤:在对接步骤中,成功对接了 16,329 个配体,包括所有 1395 个活性配体。MD 步骤中有 39 个模拟失败,包括三个活性配体。在 FEP 步骤中,与随机选择相比,更迅速地发现了活性配体。

总的来说,ALISE 在整个工作流程的最后阶段生成了有序列表,并在 VIKING 可视化框架中呈现了相应的受体-配体复合物。在这一阶段,测试的 3.90%配体为活性配体,而最终阶段测试的 40.00%配体为活性配体。所有计算均在单节点上进行,该节点配备 48 个 CPU,频率为 2.9 GHz。选择 100 个配体进入 MD 步骤,15 个配体进入 FEP 步骤,确保所有工作在两周内在可用资源上完成。对接步骤平均每个对接位置耗时 0.5 秒。MD 和 FEP 步骤的性能分别为 2.08 和 4.01 小时/纳秒。

通过 ALISE 实现的工作流程将结合到 HIV 蛋白酶的假定配体数量从 35,750 减少到仅 15 个。下一环节节将对 FEP 步骤中排名最高的三个

配体进行更详细的检查。

缺点:

  • 方法限制
    • 研究可能未充分讨论每个计算阶段的限制,特别是关于分子对接和自由能计算的准确性。
    • 基准测试案例研究虽相关,但可能不足以展示该工具在广泛应用范围内的有效性。
  • 数据和结果解释
    • 研究可能未能清楚地说明数据的处理和分析方法,导致结果可能被误解或误读。
    • 在配体选择过程中对假阳性或假阴性的批判性讨论可能不足。

改进建议

  • 增强方法论描述
    • 提供更详细的计算方法说明,特别是针对每个阶段的限制和潜在错误源。
    • 包括使用不同目标蛋白或配体集的额外案例研究,以展示该工具的普适性。
  • 扩展数据分析
    • 包括更全面的数据分析,特别是关注假阳性和假阴性的处理。
    • 实施对基准测试过程及其对工具有效性影响的更详细讨论。

参考资料:
  • Jacobsen, L., Hungerland, J., Bačić, V., Gerhards, L., Schuhmann, F., & Solov’yov, I. A. (2023). Introducing the Automated Ligand Searcher. Journal of Chemical Information and Modeling. https://doi.org/10.1021/acs.jcim.3c01317

  • PDF Download: https://is.gd/CB9k56


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容