每周文献 2021-07-26

大家好, 本周给大家分享的是几篇关于蛋白结构预测的文章。
最近蛋白结构预测是相当火爆啊,从七月中旬至今,已经有三篇文献报到了关于蛋白结构预测文章,其中在今年7月15日,两个团队在Nature和Science上分别发表了一篇利用AlphaFold2和RoseTTAFold对蛋白结构进行精确预测的文章。紧接着,在7月22日,Nature 再次发布了一篇关于人类蛋白质组高精度蛋白结构预测的文章。


图1.jpg

下面我们对这三篇文献逐一做一个简单了解。

第一篇
文章题目:Highly accurate protein structure prediction with AlphaFold (使用AlphaFold高精度预测蛋白结构)
期刊:Nature
影响因子:2020_IF = 49.962; 中科大类: 综合性期刊 1区; 中科小类: 综合性期刊 1区; JCR分区: Q1
发文单位:Google旗下的DeepMind公司和国立首尔大学
文章作者:John Jumper为第一作者, John JumperDemis Hassabis为共同通讯作者。
内容简介:蛋白质是生命所必需的,了解它们的结构有助于增强对蛋白功能的理解。科学家通过大量的实验工作,已经确定了大约10万种独特蛋白质的结构,但这只是数十亿种已知蛋白质序列的一小部分,确定一个蛋白质结构需要科学家数月到数年的艰苦努力,这使得蛋白质结构的确定受到极大限制。研究者急需一种精确的计算方法来解决这一问题。50多年来,仅根据蛋白质的氨基酸序列预测蛋白质三维结构一直是一个重要的研究问题。尽管目前取得了一些进展,但现有的方法远远达不到原子的准确度,尤其是在没有同源结构的情况下。DeepMind最近更新的AlphaFold2在去年的系统基础上进行了优化,在解析蛋白结构的速度上有了进一步的提高,同时将蛋白质3D结构预测精确到原子水平。AlphaFold最新版本的基础是一种新的机器学习方法,它将蛋白质结构的物理和生物学知识,利用多序列比对,整合到深度学习算法的设计中。

图2.jpg

图2. AlphaFold产生高精度结构。 a. 在CASP14中AlphaFold相对于其他方法的精度。b.预测的CASP14靶T1049(蓝色)与真实(实验)结构(绿色)比较。c. 一个很好预测的锌结合位点的例子。d. CASP靶点T1044,一个2180残基的单链,用正确的结构域预测。e.模型结构。箭头显示了本文描述的各个组件之间的信息流。数组形状用括号表示,s:序列数,r:剩余数,c:通道数

同时,为了方便学术应用,AlphaFold代码开源于Github:https://github.com/deepmind/alphafold 。每个人都可以自行下载安装运行。

图3.jpg

图3.AlfaFold的获取

提醒,安装的小伙伴,安装之前可以先看看硬件要求。

第二篇
文章题目:Accurate prediction of protein structures and interactions using a three-track neural network (利用三轨道神经网络精确预测蛋白质结构和相互作用)
期刊:Science
影响因子:2020_IF = 47.728; 中科大类: 综合性期刊 1区; 中科小类: 综合性期刊 1区; JCR分区: Q1
发文单位:华盛顿大学蛋白设计研究所、哈佛大学等总计23家研究单位
文章作者:华盛顿大学Minkyung Baek 为第一作者,David Baker教授为通讯作者。
内容简介:作者借鉴AlphaFold2的经验,通过探索融合相关思想的网络体系结构,在一个三轨网络中获得了最佳的性能,在该网络中,一维序列级、二维距离图级和三维坐标级的信息被依次转换和集成。从结构上来看,RoseTTAFold 是一个三轨神经网络,它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中,一维、二维、三维信息来回流动,使得网络能够集中推理蛋白质的化学部分与它的折叠结构。三轨网络产生的结构预测精度接近CASP14中DeepMind的精度,能够快速解决具有挑战性的X射线晶体学和冷冻电镜结构建模问题,并提供对目前未知结构的蛋白质功能的见解。该网络还可以仅仅通过序列信息快速生成精确的蛋白质-蛋白质复合物模型,而传统的方法需要对单个子单元进行建模,然后进行对接。同时,研究团队也对外分享了开源代码,以帮助科研工作者加速生物学研究。

图4.jpg

图4. 网络构造和性能。A. 具有1维、2维和3维轨迹的RoseTTAFold架构。B. 14个目标预测方法的平均TM得分。C. CAMEO中硬性指标的盲基准测试结果;模型精度是来自CAMEO网站的TM评分值(https://cameo3d.org/).

RoseTTAFold拥有可以媲美AlphaFold2的蛋白质结构预测超高准确度,而且RoseTTAFold计算速度更快、所需计算机处理能力更低。相对于AlphaFold2只能解决了单个蛋白质的结构,RoseTTaFold不但能适用于简单的蛋白质,也适用于蛋白质复合物。RoseTTaFold利用深度学习技术,根据有限信息准确、快速地预测蛋白质结构。


图5.jpg

图5.利用RoseTTAFold预测复杂结构。(A和B)利用序列信息预测大肠杆菌蛋白质复合物的结构。实验确定的结构在左边,RoseTTAFold模型预测的在右边;下面的TM分数表示结构相似的程度。(C)RoseTTAFold产生的IL-12R/IL-12复合物结构符合先前公布的冷冻电镜三维密度(EMD-21645)。

RoseTTAFold可以在https://github.com/RosettaCommons/RoseTTAFold获取,安装需要依赖于Conda环境。

图6.png

图6. RoseTTAFold的获取

第三篇
文章题目: Highly accurate protein structure prediction for the human proteome (人类蛋白组的高精度蛋白质结构预测)
期刊:Nature
影响因子:2020_IF = 49.962; 中科大类: 综合性期刊 1区; 中科小类: 综合性期刊 1区; JCR分区: Q1
发文单位:Google旗下的DeepMind公司和欧洲生物信息研究所
文章作者:DeepMind公司Kathryn Tunyasuvunakool博士为第一作者, John Jumper和 Demis Hassabis为共同通讯作者。
内容简介:蛋白质结构可以为生物过程的推理和基于结构的药物开发或靶向突变等干预措施提供宝贵的信息。经过几十年的努力人类蛋白质序列中的残基被实验确定的结构所覆盖。在这里,作者通过将最先进的机器学习方法AlphaFold2大规模应用于人类,覆盖几乎整个人类蛋白质组(98.5%的所有人类蛋白)的蛋白质的结构。同时作者发现,AlphaFold能对人类蛋白质组58%的氨基酸的结构位置给出可信预测。作者介绍了几个基于AlphaFold模型上的指标,并使用它们来解释数据集,识别较强的多域预测以及可能无序的区域。另外,作者提供了一些案例研究,说明如何使用高质量的预测来生成生物学假设,并建成人工智能系统AlphaFold预测的蛋白结构数据库(AlphaFold Protein Structure Database),预测信息将通过欧洲生物信息研究所(EMBL-EBI)托管的公用数据库免费向公众开放。作者认为,在未来大规模的准确结构预测将成为一种重要工具,让我们能从结构的角度解答新的科学问题,而AlphaFold的预测结果将帮助进一步阐明蛋白质的作用。

图7.jpg

图7. 突出显示预测结构。

接下来,我准备使用该数据库做个简单的蛋白结构预测。

Step1:输入网址https://www.alphafold.ebi.ac.uk/

图8.png

Step2:搜索栏中输入拟南芥基因ID:At1g58602,等待几秒,点击对应的蛋白即可

图9.jpg

本文中部分图片来自于3篇文献,文中有描述不合适的地方是我的问题,欢迎批评指正。

参考文献:

  1. Jumper, J., Evans, R., Pritzel, A. et al. Highly accurate protein structure prediction with AlphaFold. Nature (2021). https://doi.org/10.1038/s41586-021-03819-2
  2. Baek, et al., (2021) Accurate prediction of protein structures and interactions using a three-track neural network. Science, https://doi.org/10.1126/science.abj8754.
  3. Tunyasuvunakool, K., Adler, J., Wu, Z. et al. Highly accurate protein structure prediction for the human proteome. Nature (2021). https://doi.org/10.1038/s41586-021-03828-1
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容