急性髓性白血病(AML)是一种临床和遗传异质性疾病,其特征是骨髓浸润与未成熟白血病原始细胞导致骨髓衰竭。尽管基因组学已经帮助解决了AML的一些临床异质性,并揭示了特定的药物靶点,但仍然存在许多挑战。蛋白质组学一直被认为是一种很有前途的技术,可以补充基因组学来阐明癌症生物学并识别诊断和预测生物标记物。本文中,研究者利用多组学技术分析蛋白质和基因的表达、细胞遗传学和体细胞突变特征,从蛋白质水平对AML患者分型,并为确认致病机制和预测性生物标志物的研究奠定基础。
研究思路
文章详情
文章题目:The proteogenomic subtypes of acute myeloid leukemia
中文题目:急性髓系白血病的蛋白基因组亚型
发表时间:2022.03
期刊名称:Cancer Cell
影响因子:31.743
实验平台:LC-MS/MS DDA+DIA、全转录组测序、基因组靶向测序等
DOI:10.1016/j.ccell.2022.02.006
研究内容
· 蛋白质组AML亚型的发现及其生物学特性
研究者的急性髓系白血病(AML)多组学研究主要包括四个部分,即蛋白质表达、基因表达、基因突变和细胞遗传学分析。首先,利用蛋白质组数据,使用无监督分级聚类方法鉴定到了6个不同的蛋白质组亚群(图1B)。由于C1和C2都具有线粒体蛋白和线粒体相关过程的高水平表达,与其他四个cluster不同,因此研究者将这2个cluster合并为一个新cluster,命名为C-Mito,并利用GSVA确认了这个合并cluster的独特线粒体谱和所有5个cluster差异调节的通路富集图谱(图1C)。接下来,研究者探索了转录因子和激酶的表达模式,发现STAT家族的转录因子在 C-Mito 中的表达强度较低和C-Mito 中丙酮酸脱氢酶激酶 (PDHKs) 的显著上调(图1D和E)。
在蛋白质组聚类分型后,研究者使用RNA测序技术分析AML的转录组特征,发现转录组和蛋白质组中5702个基因-蛋白质对中的1588个存在显著相关性,证实了AML原始细胞中RNA和蛋白质之间的相关性在基因之间存在很大的异质性。然而,对转录组数据进行GSVA分析并与蛋白质组GSVA结果比较发现大多数通路和cluster中,除了与抗菌和抗微生物防御机制有关的少数过程外,二者的富集分数没有显著相关性,说明在AML中,RNA和蛋白质的表达在很大程度上是不耦合的(图1C)。
· 多组学联合揭示AML的蛋白基因组学特征
接下来,研究者使用MOFA方法来整合并分析多组学数据结果。MOFA在一个可解释的线性模型中将不同组学数据联合分解成不同的变异源。这些变异源由广义主成分意义下的潜在因子(LFs)表示,共确认了28个LFs(图2A)。其中,LF1在所有数据集中都是活跃的,代表了与NPM1突变和HOX基因相关的AML异质性的特征维度,从而说明大多数病例中共同出现NPM1突变和HOX依赖基因的强表达,因此将这个因素称为LF1-NPM1/HOX。值得注意的是,LF1-NPM1/HOX还检测到与蛋白质组和转录组中的主要组织相容性复合体相关的协调变异,且NPM1突变与特异的HLA相关的RNA和蛋白质谱之间可能存在分子联系。(图2B和C)。使用MOFA来关注仅反映在蛋白质组中的患者之间的变异性。在这里,最主要的因素是LF6;它揭示了与线粒体相关的基因驱动LF6-Mito的变异(图2D)。而LF6-Mito主要检测到分配给C-mito的患者(图2E)。通过量化LF6-Mito和线粒体主成分(PC1-Mito)之间的关联进一步证实了LF6的线粒体特征,该关联是基于注释到线粒体的蛋白质计算得出的,显示出显著的相关性(图2F)。为了进一步证实不能通过转录组检测到具有蛋白质组C-Mito特征的患者,研究者基于蛋白质组和转录组的线粒体基因进行了独立的主成分分析(PCA)。C-Mito患者再次仅通过蛋白质组数据被检测到(图2G)。综上所述,分配给C-Mito的患者亚群仅反映在蛋白质组中,突显了蛋白质组学作为发现工具的重要性。
· 蛋白质组AML亚型的临床和基因组特征
临床相关性分析显示,已确定的五种蛋白质组AML亚型中有两种与预后相关。C-Mito组的患者总体生存时间较短(OS)(图3A)。Mito组和非Mito组的基本患者特征相似,因为在年龄、性别分布或同种异体干细胞移植比率方面,两组之间没有显著差异。然而,在细胞遗传学风险组和突变特征方面存在差异(图3C)。令人惊讶的是,尽管C-Mito的特点是OS较短,但根据ELN风险分类,C-Mito在有利的风险疾病特征中富集,而非Mito AML富集于不利风险特征,包括继发性AML。C5组的OS比非C5组患者更长,且多因素分析表明C5是一个独立的有利危险因素(图3D和E)。C5组患者DNMT3A突变频率增加,可能会影响该组患者蛋白质组和疾病预后情况(图3F)。
· Mito-AML亚型在独立患者队列中的验证
在75名具有遗传特征的独立队列中验证了上述发现结果,该队列与发现队列相同,均接受了强化诱导治疗。在验证队列中,聚类分析获得了3个亚型。其中一个cluster预测可能是C-Mito,并且富集了NPM1的突变(图4A和B)。在对C-Mito预测贡献最大的五个蛋白质中,两个与线粒体和MRPL19有关,两个与核孔复合体有关,代表了C-Mito的重要预测特征,也是建立诊断标志物panel的第一步(图4D)。此外,验证队列中无论是用预测方法或是通过无监督聚类确定为C-Mito的患者,其OS均显著短于非Mito患者(图4E-G)。
· Mito-AML定义的蛋白质组网络
为了进一步了解C-Mito的生物学特性,研究者提取了与其他cluster相比具有显著表达差异的前100个基因蛋白质。这些蛋白质中大多数属于线粒体、核膜和染色质调节器这三个生物学类别之一(图5A)。通过附加前人发表的蛋白质相互作用来获得具有C-Mito特征蛋白质的相互作用网络,揭示了这些蛋白质强大的相互连接性。C-mito的特点是几乎所有线粒体蛋白(包括呼吸复合物I-V)的高表达,根据MOFA分析结果,这种现象仅能在蛋白质水平上检测到,而RNA水平不行(图5B-E)。这些结果说明存在一种转录后机制导致线粒体蛋白在C-mito中积累,同样,核孔成分也只在蛋白质水平上调。基于通路表达水平对患者进行无监督聚类分析发现主要包含C-mito的cluster特征是几乎所有线粒体通路的显著上调。然而,与其他cluster相比,有丝分裂吞噬和自噬相关的蛋白质表达下调。由于这些是线粒体动力学调控和监测的关键过程,这一发现表明,失调的线粒体蛋白质量控制可能有助于解释C-Mito表型。
· MITO-AML对线粒体复合体I的依赖性
上述研究已将Mito-AML鉴定为高危AML亚型,研究者进一步探究该亚型是否具有特殊的病理机制特征。对25个急性白血病细胞系进行蛋白质组检测,共鉴定出8573个蛋白质,将14个细胞系鉴定为Mito-high,11个为Mito-low(图6A)。DepMap CRISPR数据库中的10个AML系与研究者细胞系蛋白质组数据整合分析发现其中6个是Mito-high,4个是Mito-low,Mito-High系比Mito-low系对线粒体复合体I基因的依赖性更强,而属于复合体II-V的基因没有差异(图6B和C)。除了复合体I,参与DNA修复、组蛋白乙酰化和MTOR信号通路的基因在Mito-High细胞系中具有更强的依赖性。体外实验部分,研究者验证了两个Mito组别对复合体I抑制药物(以线粒体呼吸为靶点)治疗的敏感性,发现Mito-high对这些药物具有显著的超敏反应(图6D)。此外,Seashore代谢分析表明Mito-high AML细胞系表现出更强的依赖复合体I的呼吸(图6E)。与 Mito-low 细胞相比,venetoclax 治疗导致 Mito-high 细胞耗氧率降低程度更高(图6F),这种更强的依赖复合体I的呼吸也在发现队列的原始样品中进行了验证(图6G)。治疗24h后通过流式细胞术比较膜联蛋白V-/7AAD-细胞的比例,证实了Mito-AML患者离体的原始细胞对venetoclax的敏感性增加(图6H)。总之,这些结果表明 Mito-AML 细胞与线粒体呼吸具有特异的联系,这使得它们更容易受到靶向该代谢途径的药物的影响。
主要结论
本研究对252例接受统一治疗的AML患者的骨髓活检组织进行的全面的蛋白质基因组分析,以阐明AML的分子病理生理学,从而为未来的诊断和治疗方法提供信息。除了深入的定量蛋白质组学研究,分析内容还包括细胞遗传学图谱和DNA/RNA测序,并鉴定到5种蛋白质组亚型,每种亚型都反映了跨越基因组边界的特定生物学特征。这些蛋白质亚型中有两种与患者预后相关,但没有一种与特定的基因组异常有关。值得注意的是,一种亚型(Mito-AML)仅在蛋白质组中被捕获到,其以线粒体蛋白高表达为特征,预后较差,在强化诱导化疗治疗中缓解率降低,总生存期缩短。功能分析表明,Mito-AML在代谢上倾向于更强的依赖复合体I的呼吸,并且对BCL2抑制剂ventoclax的治疗更敏感。
参考文献
Jayavelu, Ashok Kumar et al. “The proteogenomic subtypes of acute myeloid leukemia.” Cancer cell vol. 40,3 (2022): 301-317.e12.