DeepMind 和 Meta 联手推动 AI 在生物学的应用

原文: Scientists at DeepMind and Meta Press Fusion of AI, Biology

Members of the AlphaFold team in front of the European Molecular Biology Laboratory in Heidelberg, Germany. AlphaFold was trained on public data resources, including those managed by the EMBL’s European Bioinformatics Institute.

Meta Platforms Inc. 预测数亿蛋白质结构的新工具是 Alphabet Inc. 子公司几年前在计算生物学领域取得突破的最新例子。

一些科学家期望新型人工智能系统能够加速生命科学领域的工作,尤其是药物开发。

谷歌母公司 Alphabet 位于伦敦的子公司 DeepMind Technologies 首先解决了一个困扰科学家 50 年的问题,它使用人工智能替代速度更慢、成本更高的实验室技术来确定蛋白质的三维结构。这些结构对于药物和疫苗开发、气候变化研究等至关重要。

DeepMind 在 7 月表示,其 AlphaFold2 AI 系统于 2021 年 7 月首次发布,已被用于预测科学界已知的几乎所有蛋白质的结构。 Meta 在 3 月 16 日表示,其 ESMFold 系统已被用于揭示更多蛋白质的结构,包括最不为人所知的蛋白质:在土壤微生物、海洋深处和人体内的一些蛋白质中发现的蛋白质。

Facebook 母公司 Meta 的 ESMFold 采用了一种大型语言模型,可以根据 OpenAI 的 ChatGPT 底层相同的技术从几个字母或单词中预测文本。 DeepMind 设计了一种不同的方法,使用一对神经网络。 Meta 表示,它的方法比 DeepMind 的方法快 60 倍,但准确性较低。

“这些蛋白质非常多样化,人们对它们知之甚少。为了达到这个规模并超越它,可能还有数十亿个序列,在预测速度上取得突破至关重要,”Meta AI 研究科学家 Alexander Rives 说。他说,使用大型语言模型,Meta 能够在两周内对超过 6 亿种蛋白质进行预测。

“有了人工智能,现在可以在分子尺度上深入了解蛋白质结构和自然界令人难以置信的复杂性,”他说。

自从 DeepMind 取得突破以来,人们对人工智能在生物学中的应用产生了浓厚的兴趣。

“AlphaFold 是蛋白质结构预测方面的巨大进步。我们受到他们取得的进步的启发,这引发了使用深度学习的全新浪潮,”华盛顿大学的生物化学家和计算生物学家大卫贝克教授说。

“ESMFold 的优势在于它非常快,因此可用于预测比 AlphaFold 更大的一组蛋白质的结构,尽管准确度略低,类似于 RoseTTAFold,”Baker 博士说,他指的是2021 年从他的实验室中出现的一种工具。

DeepMind 开源了 AlphaFold2 的代码,使其免费提供给社区。几乎所有科学已知的蛋白质——大约 2.14 亿种——都可以在公共的 AlphaFold 蛋白质结构数据库中查找。 Meta 的 ESM 宏基因组图谱包括 6.17 亿种蛋白质。

投资生命科学技术的成长型股权公司 Biospring Partners 的联合创始人 Jennifer Lum 说,过去,研究人员要花费数月或数年的时间才能确信自己了解蛋白质的结构。 “这个过程被 AlphaFold 缩短了,并允许这些团队将时间转移到更下游的研究和产品开发,进入其他增值领域,”她说。

AlphaFold 系统在两个不同的阶段走到了一起,反映了 DeepMind 将学术研究的严谨性与科技初创公司的文化相结合以处理世界上一些最大的科学问题的不同寻常的方法。

转折点发生在 2018 年,当时 DeepMind 联合创始人兼首席执行官 Demis Hassabis 在 AlphaFold 会议上询问团队是否可以解决寻找更好的方法来预测蛋白质结构的问题,或者他们是否应该解决其他问题,约翰说Jumper,DeepMind 的 AlphaFold 团队的首席科学家。

“这是我在 DeepMind 参加过的最不舒服的会议之一,”38 岁的 Jumper 博士说,他在芝加哥大学获得理论化学博士学位后于 2017 年加入实验室。

2018 年,AlphaFold1 在一项名为 CASP 的两年一度的实验中取得了最好的成绩,科学家们在该实验中测试了预测蛋白质结构的各种方法。但这对 DeepMind 来说还不够好。

AlphaFold 团队在 2018 年花时间跟踪 CASP,尝试不同的方法来改进 AlphaFold1,测试它们是否能与使用实验室方法确定的蛋白质结构的准确性相匹配。

15 到 18 名成员的跨学科团队中的大多数人都来自机器学习背景。其他人有生物学背景。 “但他们都……在项目过程中成为了有效的生物学家,”Jumper 博士说。 AlphaFold 接受了公共数据资源的培训,包括由欧洲分子生物学实验室的欧洲生物信息学研究所管理的数据资源。

Jumper 博士说,在他真正相信该团队能够完成其任务之前,该小组一直工作到 2019 年。

Jumper 博士表示,传统上,生物学家使用基于 X 射线和其他技术的实验室技术来了解单一蛋白质的结构,这一过程至今可能需要数年时间并耗资 100,000 美元。

虽然计算方法在理解蛋白质结构方面取得了进展,但它们的准确性不足以取代实验室方法。

最初的 AlphaFold 模型使用 AI 来预测氨基酸对之间的距离,然后在第二步中使用这些距离分布来得出蛋白质的预测结构。第二步涉及 AlphaFold 使用这些信息来提出蛋白质应该是什么样子的共识模型,并且没有调用人工智能。

根据 Jumper 博士的说法,在 AlphaFold2 中,蛋白质的结构是由神经网络本身预测的。据这位科学家称,该神经网络与所谓的基于注意力的神经网络配对,后者同时处理结构的各个部分以将它们连接起来,就像一个人可能会尝试解决拼图游戏一样。 “这与时间无关……一切都与准确性有关,”Jumper 博士说。

“在某些情况下,AlphaFold 可以在不到 20 秒的时间内非常准确地预测蛋白质结构,”DeepMind 说。 DeepMind 说,在 AlphaFold 之前,没有任何一种计算方法可以与实验精度相提并论。马里兰大学生物科学与生物技术研究所的 John Moult 教授说,虽然这种方法有一些局限性,但它解决了一个大问题,他于 1994 年共同创立了 CASP 实验。

“该团队现在正将注意力转向蛋白质创新方面的新挑战,”Jumper 博士说。

它正在寻求了解突变与有助于治疗疾病的蛋白质功能变化之间的联系。目前正在使用 AlphaFold 开发疟疾疫苗,此前牛津大学的一个团队在尝试其他方法多年后使用它来识别重要蛋白质的结构。 “当我们将我们的模型与 AlphaFold 的预测结构结合起来时,我们可以突然看到整个系统是如何工作的,”分子寄生虫学教授马修希金斯说。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354

推荐阅读更多精彩内容