导读
研究者开发的几何深度学习框架 FRAME,在基于结构的药物设计中能有效提升配体的亲和力和选择性。
药物设计面临的一大挑战是如何优化配体——与目标生物分子结合的小分子——以改善其多种性质。在先导化合物优化任务中添加单一化学片段,以及在基于片段的药物设计中添加多个片段,都至关重要。研究者开发了一个综合框架,运用机器学习和三维蛋白质-配体结构来应对这一挑战。
FRAME 通过迭代过程确定在配体上添加片段的位置,选择要添加的片段,并预测添加的片段的几何形态。在综合基准测试中,与起始配体相比,FRAME 改善了预测的亲和力和选择性,同时生成了比当前广泛使用的基于对接方法的分子具有更多药物化学特性的分子。FRAME 学会了准确描述分子相互作用,即使它没有接收到关于这些相互作用的先验信息。这一生成高质量分子假设的框架可以轻松融入药物化学家的工作流程中,适用于多种任务,包括先导化合物优化、基于片段的药物发现和从头开始的全新药物分子设计。
方法
FRAME 核心机制
FRAME 通过逐个添加单键连接的片段到配体中来运作。这个过程涉及两个关键步骤:
- 选择附加位置: 确定在配体上附加片段的位置。
- 片段选择和几何结构: 决定添加哪个片段并确定其附加几何结构。
神经网络的应用
两个独立的 SE(3)-等变神经网络被训练用于预测这些步骤。片段从用户定义的库中选择,FRAME 能够评估在训练数据中未见过的新片段。
训练 FRAME 的神经网络
参考配体和轨迹
FRAME 的神经网络使用来自蛋白质数据库的蛋白质-配体结构进行训练。这些结构被分解成参考轨迹,有助于理解配体构建过程。
监督学习方法
- 附件位置预测: 配体上的氢原子被视为新片段的潜在附加点。为每个氢原子计算二进制标签,指示其在最终结构中的作用。
- 片段评分模型: 一个被训练用于根据参考配体轨迹得出的分数,对片段的适用性进行排名的网络。
分子优化
FRAME 可以通过选择每个步骤中得分最高的操作来产生单个配体,或用于选择更复杂的搜索策略,以获得多样化的配体集合。
数据集组成和定制
训练和测试数据集是从高分辨率 3D 结构中获取的,包含具有高亲和力的药物样配体。数据集包括 4200 个配体,并创建了一个自定义片段库以支持多样化应用。
FRAME 的训练
FRAME 使用 SE(3)-等变神经网络来准确捕捉配体与蛋白质口袋的几何关系。这些网络被设计为旋转和平移不变,确保输出分数不受输入结构空间定位的影响。
主要结果及图表
FRAME 模型在选择适当的附着点和片段排列这两方面表现尤为突出。该模型通过观察蛋白质口袋内未被填充的区域,能够高效地识别出可用的附着位置。量化分析表明,FRAME 模型挑选的附着点中有 95% 是参考配体的附着点(精确度),且 92% 的参考附着点被模型覆盖(召回率)。
在片段排列方面,FRAME 模型展现了其独到的优势,能够选择能够形成关键相互作用的片段,即使之前对这些相互作用或化学特性(如供体和受体)并无了解。例如,在一项案例研究中,FRAME 选取了能形成 π−π 相互作用和多重氢键的环状片段,这些都是参考配体中的关键相互作用。此外,FRAME 还展示了其片段选择的多样性,例如在另一案例中,排名前三的片段在大小和化学特性上各异,但均能与口袋形成关键的氢键。
FRAME 模型在多片段药物设计领域的应用更显其复杂性。该模型在包括肝炎 C 病毒蛋白酶抑制剂和蛋白激酶 A 抑制剂设计等案例中都有出色的表现。FRAME 生成的配体不仅能形成关键的相互作用,还能充分填充蛋白质口袋,与参考配体相似。
图表 1:FRAME 模型详解
- 概述:图表 1 展示了基于片段的分子优化方法 FRAME。该方法以一个起始分子(紫色棒模型)为基础,在蛋白质口袋(灰色表面)中逐渐添加片段,直至分子达到既定目标(如分子量或预测的终点)。
- 步骤:每次优化包含两个步骤:选定位置和选择片段。首先,利用 SE(3)等变的神经网络——即附着位置模型(紫色),对潜在附着点进行评分。选中得分最高的位置(红色箭头)后,通过采样片段和几何形态生成候选结构集。这些候选结构由另一 SE(3)等变神经网络训练的片段评分模型(绿松石色)进行评分。选定得分最高的结构后,重复此过程。
图表 2:FRAME 模型在附着点选择上的应用
- 功能:图表 2 描述了 FRAME 如何在蛋白质口袋的三维环境中选择片段附着点。通过训练神经网络,FRAME 评估配体氢原子,以确定最佳附着点。
- 展示:图中,红色箭头指示得分较高的附着点(得分 ≥0.5),白色箭头标出得分较低的附着点。与参考配体相比较,FRAME 通常选择与这些配体中实际使用的附着点相同。图 a 展示的是 HIV1 蛋白酶(2Q5K),图 b 展示的是 FFAR1 的变构口袋(5TZY)。
- 评估:作者绘制了精确度-召回率曲线,评估 FRAME 识别参考配体中实际使用附着点的能力。曲线显示了不同得分阈值下的精确度和召回率。FRAME(实线蓝色)的性能显著优于随机基线(虚线)。研究者还训练了一个不包含口袋信息的模型(“FRAME no pocket”,实线橙色),发现其性能略有下降。数据源自测试集的 700 个实例。
图表 3:FRAME 评分模型在片段选择中的作用
功能:图表 3 展示了 FRAME 如何利用评分模型对候选结构进行排名,从而选择能与口袋形成关键相互作用的片段,这对配体优化至关重要。
展示:例子展示了左侧排名前三的片段(及其最佳评分的几何形态),右侧为排名较低的片段。参考片段来自数据集中的参考配体。氢键以红色虚线表示,π-π 相互作用以蓝色虚线表示。两个例子均源自 PAR 聚合酶(3C49)。
评估:作者通过评分模型将参考片段排在第一位(实心条形图)或前 10 位(带边框的条形图)的频率来评估模型效果。模型与随机基线(Random)、微调后的模型(FRAME + tuning)和对接分数(Docking)进行比较。分析基于测试集的 100 个配体-蛋白质复合物,误差条代表 95%置信区间。
互动频率:研究者还评估了排名最高的片段形成的相互作用频率。频率值对应于添加片段形成的平均相互作用数。条形图颜色对应于(c)中的方法,以及参考片段(灰色)。分析基于测试集的 100 个配体-蛋白质复合物,误差条代表 95%置信区间。
图表 4:FRAME 在基于片段的药物设计中的应用
- 功能:图表 4 展示了 FRAME 如何成功优化小型起始配体,通过添加多个片段,这是基于片段的药物设计所需的过程。
- 展示:左列展示了测试集中三种样本蛋白的参考配体(绿色棒模型)和口袋(灰色表面)。从参考配体中随机选择一个小起始分子,开始优化过程;起始分子在中间和右列以绿色显示。FRAME 用于选择附着点和片段,以优化起始分子;中间列展示了最终分子(添加的片段以紫色显示)。作者将这些分子与使用迭代对接法(Glide)生成的分子进行了比较。右列显示每个口袋为每种方法生成的一个优化分子。关键相互作用通过圆圈和虚线突出显示:氢键用红色,π-π 相互作用用蓝色,盐桥用绿色。
- 细节:详细图片展示了蛋白质口袋上的关键残基(灰色棒模型)及其与配体的相互作用。
图 5:FRAME 方法在改善预测亲和力方面的表现
FRAME 方法在提升起始分子的预测亲和力方面表现优异,同时相比其他方法,保持了更多药物化学特性。使用 FRAME 对 100 个配体进行了优化,这些配体来自测试集中的 100 个独特结构。从参考配体中随机选择一个小分子作为优化的起点,并添加了多个片段。优化配体的属性分布与使用迭代对接法(通过物理基础对接软件 Glide)优化的配体进行了对比。同时包括参考配体的属性分布。参考配体的重原子数量用于确定何时停止为特定例子添加片段。分布使用核密度估计绘制。
- (a) 对接分数是在配体进行限制最小化后,获得的针对目标蛋白的 Glide 分数(分数越低越好)。起始分子的分布也展示在图中(灰色)。
- (b) 非靶标对接分数是配体对接至测试集中其他 99 个口袋时的分数(分数越高越好)。
- (c) 合成可及性分数,使用 RDKit 的标准实现计算,是合成配体难易程度的相对度量,分数越低表示合成越容易。
- (d) 配体上不与蛋白质口袋形成氢键的氢键供体数量;通常越低越好,以避免高解离惩罚。
- (e-h) 所有其他属性是使用 RDKit 计算的标准分子描述符。
图 6:FRAME 片段评分模型准确描述特定分子相互作用
FRAME 片段评分模型在未预先了解这些相互作用的情况下,学会了准确描述特定的分子相互作用。
- (a) 使用 FRAME 模型对仅在一个附加甲基片段的二面角上有所不同的配体-口袋结构进行评分。点代表测量得分,实线是平滑的样条曲线。最低的模型得分(最有利)对应于能量上最有利的交错构象。最高分对应于能量上最不利的重叠构象。
- (b) 为了测试氢键的识别,作者改变了一个供体(主链胺)和一个受体(羰基)原子之间的距离,并计算了每个结构的 FRAME 模型得分。最低分对应于合理的氢键距离(约 3 埃)。观察到的距离与此例子来源的实验结构中的距离一致。作为对照,我们用甲基替换了受体(羰基),并没有观察到相同的行为。
- (c) 为了测试 π−π 相互作用的识别,研究者改变了两个垂直苯环的质心之间的距离。最小得分接近于此例子来源的实验结构中观察到的 π−π 相互作用距离(3.9 埃)。作为对照,作者用甲基替换了一个环,没有观察到相互作用。
- (d) 为了测试与金属离子的相互作用,作者改变了一个羧酸盐和一个配位钙离子之间的距离。最低分对应于该特定实验结构中观察到的金属配位距离(2.6 埃)。图中所有结构均来自测试集。
总结
FRAME 模型通过神经网络训练,提高了药物分子设计的效率和准确性。这一模型的特点包括:
- 使用神经网络,摒弃传统的硬编码规则。
- 能快速探索更广阔的化学空间。
- 不依赖传统虚拟筛选的评分或规则。
- 生成的配体与参考配体在关键相互作用上具有相似性。
- 在某些情况下,模型存在局限性,比如偶然的错误可能导致增长轨迹受阻。
FRAME 模型通过训练神经网络,而非依赖硬编码的合成规则或亲和力评估,能够识别与蛋白质结合的高亲和力、类药配体的模式。这种策略优于传统的虚拟筛选方法,例如基于物理评分函数的配体对接。FRAME 能在短时间内高效探索化学空间中的有潜力区域,无需对每个候选分子进行系统评估,也不依赖对接评分或专家制定的规则,后者可能包含偏见和局限。
首先,通过将生成过程分解为一系列步骤,由训练有素的模型指导,增加了在不同优化任务上的灵活性,无论是添加官能团还是构建新的分子骨架。尽管分子生成是复杂的多步骤过程,研究者通过监督学习有效地训练了神经网络。其次,FRAME 的评分网络考虑到了 3D 结构和几何形状,自然地捕捉蛋白质口袋中的配体。第三,将神经网络训练成评分函数,避免了在网络中编码片段库,使得模型能够应用于新片段并轻松变换每个应用的片段。
然而,这些成果也存在一些局限性。在某些情况下,FRAME 未能产生理想的配体,其对接分数和合成复杂性不及参考配体。自回归方法在处理偶发错误时并不稳健,例如阻碍生长轨迹或错过关键互动。这些问题或可通过更有效的搜索策略或将 FRAME 与全局结构生成方法(如去噪扩散概率模型)结合来解决。此外,用于基准测试的许多属性本身是计算估算或预测的,例如 log P、合成可及性和对接分数。为充分验证 FRAME 及其他计算方法生成的分子的有效性,这些分子需要被合成,并通过实验测量其属性。实际上,未来的工作将需要将 FRAME 和相关方法应用于特定的、真实世界的药物设计项目中,以应对这些挑战。
缺点:
- 模型鲁棒性和错误分析:
- 缺乏针对扰动或噪声数据的鲁棒性测试,这对于实际应用至关重要。
- 对模型如何处理错误及其对预测可靠性的影响讨论不足。
- 缺乏实验验证:
- 缺乏对预测配体的实验验证,这对于确立现实世界适用性至关重要。
- 依赖计算预测(如对接分数)而没有实验相关性,引发对设计配体实际效果的疑问。
改进建议
- 鲁棒性和错误处理:
- 加入更多的鲁棒性测试,例如对输入扰动的敏感性或处理噪声数据。
- 提供更详细的错误传播分析,及其对最终预测的影响。
- 实验验证:
- 计划对 FRAME 设计的部分配体进行实验合成和测试,以验证计算预测。
- 与实验小组合作,建立计算预测与现实世界配体性能之间的相关性。
参考资料:
Powers, A. S., Yu, H. H., Suriana, P., Koodli, R. V., Lu, T., Paggi, J. M., & Dror, R. O. (2023). Geometric Deep Learning for Structure-Based Ligand Design. ACS Central Science. https://doi.org/10.1021/acscentsci.3c00572
文献下载(复制链接到外部浏览器打开): https://is.gd/aBk19G