代谢工程的目标是从活的生物体中产生令人感兴趣的化学物质,从而向更绿色的化学方向发展。尽管付出了努力,但研究和开发过程仍然漫长而昂贵,而且需要高效的计算设计工具来探索化学生物合成空间。在此,我们提出一种基于人工智能的方法,依靠蒙特卡罗树搜索增强学习方法,以化学相似性为指导来探索生物逆应合成空间。RetroPathRL(https://github.com/brsynth/RetroPathRL)实现了这个方法,它是一个开源的模块化命令行工具。该软件在20个人工策划的实验途径的黄金数据集和152个成功的代谢工程项目的更大数据集上验证了它。此外,作者还提供了一个新的特征,提示潜在的培养基补充,以补充酶合成计划。
逆合成算法的核心是简单的:将目标分子分解成更简单的分子,再通过化学或酶的方式合成,然后反复循环,直到所有需要的化合物都可以在市场上买到,或者出现在所选的微生物菌株中。目前的生物反应合成工具存在一些限制。首先,它们通常可以通过Web服务器访问,而不是开源的,这限制了专业用户在本地安装和调优它们的能力。其次,路径搜索中通常会包含一些参数,这些参数是由软件设计师决定的,用户利用自己的知识进行反演合成和参数优化的能力有限。一些例子包括酶的性能,预测产量,热力学或辅助因子的使用。此外,这些工具不包括人工智能领域首创的组合搜索空间探索的最新进展。
解决这些局限性,作者建议利用蒙特卡洛树的搜索(mct)强化学习算法,已经彻底改变了人工智能领域,以惊人的胜利谷歌 AI (AlphaGo)战胜人类。一个有趣的应用程序这个算法与神经网络相结合用于化retrosynthesis,但承认自然化合物合成是超出了他们的范围。为了让更多人可以使用这个算法,作者将其实现为RetroPath RL,这是一个在GitHub上免费提供的开源python包。RetroPath RL提供了使用MCTS发现生物合成途径的编程访问,同时允许专家用户使用或开发大量的增强和特性,以调整它以满足他们的需求。目前,缺乏开源的计算机辅助路径设计工具是代谢工程项目面临的主要限制之一。因此,RetroPath RL是一个及时的软件,有望有助于代谢工程实现其真正的绿色化学潜力。
参考文献:
Koch, M., Duigou, T., and Faulon, J.-L. (2020). Reinforcement Learning for Bioretrosynthesis. ACS Synth. Biol. 9, 157–168.