论文图鉴22:蛋白质设计

 Robust deep learning–based protein sequence design using ProteinMPNN”和“Hallucinating symmetric protein assemblies

虽然深度学习使蛋白质结构预测发生了革命性的变化,但几乎所有实验表征的从头蛋白质设计都是使用基于物理的方法(如 Rosetta)生成的。在这里,我们描述了一种基于深度学习的蛋白质序列设计方法,ProteinMPNN,它在计算机和实验测试中都有优异的性能。在天然蛋白质骨架上,蛋白质 MPNN 的序列回收率为52.4% ,而 Rosetta 的序列回收率为32.9% 。不同位置的氨基酸序列可以在单链或多链之间偶联,使其能够应用于当前蛋白质设计的广泛挑战。我们利用 X光散射技术、冷冻电镜和功能研究,通过挽救以前失败的蛋白质单体、环状高聚物、四面体纳米颗粒和靶结合蛋白的设计(使用 Rosetta 或 AlphaFold) ,展示了蛋白质 MPNN 的广泛实用性和高准确性。

结果显示,ProteinMPNN的序列回收率为52.4%,具有广泛的实用性和高准确性。

Hallucinating symmetric protein assemblies

环状蛋白低聚物在几乎所有的生物过程中都起着关键作用,占蛋白质数据库(PDB)中所有沉积结构的近30% (1-4)。由于环状蛋白低聚物的许多应用,从小分子结合和催化到纳米笼装配的构建块(5) ,这种结构的从头设计从蛋白质设计领域开始就引起了相当大的兴趣(6,7)。虽然已经取得了一些成功(8-10) ,目前的方法通常需要提前说明原体的结构。除了参数化设计的结构(11,12)之外,设计策略涉及将特征单体的刚体对接成高阶对称结构,然后进行界面优化以产生低能量组装状态(13-17)。提前指定原体结构的要求限制了对低聚物结构的全部空间的探索,例如具有更多交织链的组装。对于单体蛋白质设计来说,深度网络幻觉使得对可能结构空间的广泛探索成为可能: 从一个随机的氨基酸序列开始,有利于折叠到一个明确定义状态的马尔科夫蒙特卡洛(MCMC)优化收敛于新的序列,折叠到新的结构(18-21)。通过推广,我们推断深度网络幻觉可以在一步中设计高阶蛋白质组装,而不需要预先规范或实验证实原体的结构,只要可以制定适当的损失函数,指定原体折叠和组装(18-20,22-25)。

两项研究成果表明,机器学习可以用于创建蛋白质分子,且更加准确快速。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Science | 人工设计蛋白质纳米马达 原创huacishu图灵基因2022-05-06 07:03 收录于合...
    图灵基因阅读 1,769评论 0 0
  • 网上有许多蛋白质pI预测的工具,本文主要介绍一种提高预测准确性的方法,就以(鸡)溶菌酶为例,演示一下计算过程: 溶...
    临窗听风雨阅读 10,937评论 0 3
  • Science | 深度学习构建蛋白质功能位点 原创huacishu图灵基因2022-08-05 09:11发表于...
    图灵基因阅读 1,756评论 0 0
  • 基因组组装完成后,或者是完成了草图,就不可避免遇到一个问题,需要对基因组序列进行注释。注释之前首先得构建基因模型,...
    xuzhougeng阅读 52,675评论 14 185
  • 大家好, 本周给大家分享的是几篇关于蛋白结构预测的文章。最近蛋白结构预测是相当火爆啊,从七月中旬至今,已经有三篇文...
    杨博士聊生信阅读 5,688评论 0 16

友情链接更多精彩内容