Nature | AI幻化出全新设计的蛋白质结构
原创 图灵基因 图灵基因 2021-12-12 14:34
收录于话题#前沿生物大数据分析
蛋白质自发地折叠成复杂的三维形状,这几乎是每个生物过程的关键。但是,蛋白质形状的复杂性使其难以研究。最近,使用深度神经网络在蛋白质结构预测方面取得了一些进展。现在,一个研究小组调查了这种网络捕获的信息是否能产生新的折叠蛋白质,其新序列与用于训练模型的天然蛋白质序列无关。这项工作描述了一种神经网络的发展,这种网络可以使蛋白质产生新的、稳定的结构。
这项研究发表在《Nature》杂志上的一篇题为“De novo protein design by deep network hallucination”的论文中。
“在这个项目中,我们制造了完全随机的蛋白质序列,并将突变引入其中,直到我们的神经网络预测它们将折叠成稳定的结构。”华盛顿大学医学院蛋白质设计研究所生物化学教授David Baker博士实验室的生物化学讲师Ivan Anishchenko博士说。
“我们从未将软件引导至特定的结果。”研究人员说,“这些新的蛋白质正是计算机梦寐以求的。”
研究小组生成了两千个预计会折叠的新的蛋白质序列。然后他们获得了编码129个网络“幻觉”序列的合成基因,并在大肠杆菌中表达和纯化了这些蛋白质;其中27种蛋白质产生的物种具有与幻觉结构一致的圆二色谱光谱等特性。作者指出,对三种幻化产生的蛋白质的三维结构的详细分析——两种是通过X射线晶体学,一种是通过核磁共振——与幻觉模型非常吻合。
未来,研究小组相信应该有可能引导人工智能,使其产生具有有用功能的新蛋白质。“我们希望利用深度学习来设计具有功能的蛋白质,包括基于蛋白质的药物、酶等等。”Baker实验室的博士后学者Sam Pellock博士说。
“我们的NMR研究,以及由华盛顿大学团队确定的X射线晶体结构,证明了幻觉法所产生的蛋白质设计的显著准确性。”位于纽约州特洛伊的Rensselaer理工学院(RPI)结构生物信息学实验室高级研究科学家Theresa Ramelot博士说。
RPI化学和化学生物学教授Gaetano Montelione博士指出:“幻觉方法建立在我们与Baker实验室共同进行的观察基础之上,结果表明,即使对于没有天然亲缘关系的单一蛋白质序列,通过深度学习进行蛋白质结构预测也可以相当准确。产生结合特定生物分子或形成所需酶活性位点的全新蛋白质的可能性非常令人兴奋。”
“这种方法极大地简化了蛋白质设计。”研究人员说,“以前,为了创造一种具有特定形状的新蛋白质,人们首先仔细研究自然界中的相关结构,提出一套规则,然后应用到设计过程中。每一种新的折叠类型都需要一套新的规则。在这里,通过使用一个已经掌握了蛋白质结构一般原理的深入学习网络,我们消除了对特定折叠规则的需要,并开辟了直接关注蛋白质功能部分的可能性。”
“探索如何在具体应用中最好地利用这一策略现在是一个活跃的研究领域,这也是我期待下一个突破的地方。”研究人员说。