Nature | 多尺度集成高分辨率蛋白空间图谱系统分析亚细胞结构定位和相互作用
原创 存在一棵树 图灵基因 2022-02-11 10:30
收录于话题#前沿生物大数据分析
撰文:存在一棵树
IF= 49.963
推荐度:⭐⭐⭐⭐⭐
亮点:
开发了一种结合显微镜、生物化学和人工智能(AI)的技术——尺度集成细胞(MuSIC)技术,实现了直接从细胞显微镜图像绘制细胞图谱,从而发现了大量未知的胞内蛋白。
2021年11月24日,美国加州大学圣地亚哥分校Trey Ideker课题组(第一作者为博士生秦越)与瑞典皇家理工学院以及斯坦福大学Emma Lundberg课题组联合在在《Nature》上发表了一篇名为“A multi-scale map of cell structure fusing protein images and interactions”的文章。将来自于人类蛋白质图谱(Human Protein Atlas)的免疫荧光图像与BioPlex数据库中亲和纯化结果进行整合,构建了多维度细胞整合图谱MuSIC1.0(Multi-scale integrated cell),对人类细胞中的结构层次进行了统一化的分析,从而解析出69个亚细胞系统,为整合各种各样不同类型的数据来创建全蛋白细胞模型铺平了道路。
真核细胞由多种大的组分组成,比如细胞器、凝聚体或者蛋白质复合体,从而形成一个多维度的结构。人类蛋白图谱系统性地对人类细胞中蛋白质在亚细胞结构中定位进行了全面解析,同时质谱与亲和纯化(AP-MS)技术将临近标记引入蛋白质组学探究之中,从而能够快速检测蛋白和蛋白之间的相互作用。因此,如果能将蛋白质成像与生物物理之间的关联结合起来,便可以对细胞结果进行更进一步地解析。
如图1所示,这里作者展示了一种机器学习方法。通过分析蛋白质图像和交互数据以生成每种蛋白质的神经网络嵌入;随后基于成像或生物物理联系将蛋白质投影到少数维度;确定了每个平台的蛋白质坐标后,则会校准蛋白质之间的成对距离,并将其组合以显示不同尺度的组件。
该团队组装了来自 HPA的 AP-MS 数据的匹配数据集,两个数据库资源都基于人类胚胎肾(HEK293)细胞,产生 661 种具有兼容成像的蛋白质。如图2所示,该团队通过分析这661种蛋白质之间的所有距离,确定相互邻近的蛋白质群落,从而显示出不同的成分。其中大约有46% 与 Gene Ontology 中记录的细胞成分量重叠,而剩余的 54% 注释则被推定为新颖的。
MuSIC 系统的物理尺寸是根据它们的成对蛋白质距离估计的,并与早期未在校准中使用的九个特征良好的细胞成分的已知直径进行比较,其中之一是预催化剪接体。如图3所示,免疫荧光和 AP-MS 数据预测预催化剪接体的直径约为48 nm,而其已公布的直径为42 nm;这里对于所有九个组件,估计的直径都非常接近文献中的实际测量值,验证了MuSIC 捕获亚细胞成分和预测直径的准确性。
在建立起该整合图谱后,该团队希望对MuSIC系统进行一个全局性的评估。MuSIC图谱中有370个蛋白以前未在AP-MS实验中用于亲和标记进行相互作用因子的钓取。因此,作者们对134个猎物蛋白进行标记进行AP-MS实验,从而检测到339个相互作用配对,进而对该整合图谱的准确性进行了全面的验证。如图5所示,该团队利用44 个 MuSIC系统对新的相互作用进行了丰富,选定了共23 个候选者。通在过附加 AP-MS 数据验证的候选者中,有一个估计直径为 81 nm的七种蛋白质组装体,作者们将此系统命名为前体核糖体RNA加工组装复合体(Pre-ribosomal RNA processing assembly,PRRPA)。为了对PRRPA复合体在前体rRNA加工中的作用进行确认,作者们使用siRNA对每个蛋白进行了敲低,发现所有的敲低都会在一定程度上破坏核糖体RNA的成熟;除此之外还使用RNA免疫共沉淀定量qPCR对这些蛋白结合45S前体rRNA的能力进行检测,再次证明了这些蛋白质在前体rRNA加工过程中的作用。以上表明该团队建立的MuSIC系统可以对一些蛋白质的功能进行更为全面的认识,包括发现已知蛋白的全新功能和未知蛋白的潜在功能。
综上所述,该工作通过联合蛋白质荧光成像与蛋白质生物物理特性两方面的优点构建了多尺度细胞整合图谱MuSIC 1.0,进一步地提高了现有蛋白质荧光图像中信息的分辨率,也为蛋白质相互作用提供了空间维度的信息,为人类细胞中蛋白质组研究提供了更为全面的认识。
教授介绍
Trey Ideker,博士,现任加州大学圣地亚哥分校医学、生物工程和计算机科学教授,也是前遗传学主任。目前指导或联合指导国家网络生物学资源以及癌细胞图谱和精神病学细胞图谱计划。Trey在麻省理工学院获得计算机科学学士和硕士学位,在华盛顿大学获得基因组科学博士学位,师从 Lee Hood和 Dick Karp 博士。Trey是基因组学,转录组学和蛋白质组学分析以及系统生物学理论和实践的先驱,曾创立并继续开发广泛使用的Cytoscape网络分析平台;其实验室还创建了Hannum表观遗传时钟,这是第一个使用DNA甲基化测量人类衰老率的时钟;曾被《技术评论》评为十大创新者,获得了2009年ICSB奥弗顿奖,并且是AAAS和AIMBE研究员。其实验室的研究重点是使用基因组规模的测量(基因组,蛋白质组学和代谢组学)来构建细胞过程和疾病的计算机辅助模型,这些模型有可能通过提供正常和患病细胞功能的全面蓝图,并允许研究人员在人类测试之前很久就模拟药物对细胞的影响,从而彻底改变生物学和医学。
参考文献
1、Qin, Y., Huttlin, E.L., Winsnes,C.F. et al. A multi-scale map of cell structure fusing protein images andinteractions. Nature 600, 536–542 (2021).