AI 设计大环分子新药:从代码到活体,全程跑通


榴莲忘返-AIDD


CycleGPT 模型成功实现了从 AI 设计、合成到动物模型验证的全流程,证明了生成式 AI 在攻克大环分子这类高难度化学空间方面的巨大潜力。

  1. CycleGPT 通过迁移学习和创新的采样策略,有效解决了大环分子数据稀缺的难题,能生成新颖、有效的分子结构。
  2. AI 从头设计的 JAK2 抑制剂(化合物 2)不仅活性超强(nM 级别)、选择性优于上市药物,并且在动物模型中展现出卓越药效。

药物化学家能搞定那些传统小分子却啃不动“不可成药”靶点,大分子设计是噩梦,合成难度也高得吓人。一方面大环分子数据库小得可怜,化学空间基本就是一片漆黑,全靠化学家的直觉和试错在里面摸索。

现在,有人想用 AI 来点亮这片黑暗森林。

研究者们搞了个叫 CycleGPT 的模型,他们没让模型一开始就啃大环这种硬骨头,而是先用三十多万个普通生物活性小分子数据喂饱它,让它先学会化学世界的“通用语法”。然后,再用那不到两万个珍贵的大环分子数据进行“专业精修”,最后针对 JAK2 这种具体靶点进行冲刺训练。这套“从通识到专精”的渐进式学习策略,绕开了大环分子数据稀缺这个核心障碍。

更精彩的操作是他们搞了个叫 HyperTemp 的采样策略。常规的生成模型,总是倾向于选择概率最高的化学片段,结果就是生成一堆看起来很“安全”但平平无奇的分子。HyperTemp 就像给 AI 松了松缰绳,不让它总选那个最保险、最常见的选项,而是鼓励它偶尔走走野路子,探索一下那些概率稍低但可能藏着惊喜的组合。

结果呢?

生成的分子不仅化学结构“合法”,而且新颖性爆棚,比之前那些模型强了一大截。

当然,光会画漂亮的环没用,研究者们把枪口对准了 JAK2 这个老牌靶点。他们从几个已知的大环骨架出发,让 CycleGPT 在它们周围的化学空间里“自由创作”,一口气生成了 5000 多个候选分子。

经过一系列计算筛选和对接模拟,他们最终挑了 6 个“天选之子”去合成验证。

结果 6 个分子里有 3 个对 JAK2 的抑制活性达到了个位数纳摩尔级别。最猛的“化合物 2”,IC50 干到了 1.17 nM,比上市药物 Fedratinib 还强。

更关键的是选择性。在 100 nM 浓度下,“化合物 2”只“误伤”了 17 个野生型激酶。相比之下,Pacritinib 放倒了 55 个,Fedratinib 也干掉了 34 个。这简直就是狙击手和霰弹枪的区别,对控制药物的脱靶毒性来说,意义非凡。

最硬核的是,他们把这个分子推进了小鼠模型里,在红细胞增多症模型中,它的药效甚至优于更高剂量的对照药物。

从 AI 生成全新结构,到化学家合成出来,再到生物学家验证其活性和选择性,最后在动物身上看到实实在在的药效——这篇工作给出了一个完整的、前瞻性的 AI 辅助大环药物发现的范例。它告诉我们,生成式 AI 不再只是个玩具,它已经可以成为一线研发人员探索化学“无人区”(比如大环分子)的得力工具了。

📜Title: Exploring the macrocyclic chemical space for heuristic drug design with deep learning models 📜Paper: https://doi.org/10.26434/chemrxiv-2025-0vczh


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容