Basic Information
- 英文标题: Pan-cancer analysis of post-translational modifications reveals shared patterns of protein regulation
- 中文标题:泛癌分析揭示蛋白质调控中的共有翻译后修饰模式
- 发表日期:NA
- 文章类型:Article
- 所属期刊:Cell
- 文章作者:Yifat Geffen | Daniel Cui Zhou
- 文章链接:https://www.sciencedirect.com/science/article/pii/S009286742300781X
Highlights
Para_01
- 无监督聚类揭示了33种全癌种多组学特征
- PTM异常调控与特定的DNA损伤修复机制相关联
- 代谢蛋白的乙酰化变化与肿瘤免疫状态相关
- Thr/Ser激酶的磷酸化受到邻近乙酰化的影響
Summary
Para_01
- 翻译后修饰(PTMs)在调控正常细胞和癌细胞中的信号传导和生理机能方面发挥着关键作用。
- 质谱技术的进步使得能够进行高通量、精确且灵敏地测量PTM水平,从而更好地理解它们的作用、普遍性和相互作用。
- 在此,我们分析了来自1,110名患者的最大规模的蛋白质基因组学数据集,这些数据覆盖了11种癌症类型(其中10种来自国家癌症研究所临床蛋白质肿瘤分析联盟[CPTAC])的PTM概况。
- 我们的研究揭示了涉及标志性的癌症过程中的蛋白质乙酰化和磷酸化变化的泛癌症模式。
- 这些模式揭示了来自不同癌症类型的肿瘤亚群,包括由磷酸化驱动的DNA修复失调、与免疫反应相关的代谢调节改变以及由乙酰化导致的激酶特异性受到影响,同时还有经由乙酰化和磷酸化之间的相互作用而被修改的组蛋白调控。
- 总体而言,这一资源突显了由PTMs调控的丰富生物学机制,并揭示了潜在的新治疗途径。
Graphical abstract
Keywords
- post-translational modifications; pan-cancer; genomics; transcriptomics; mass spectrometry; proteomics; DNA damage response; metabolism; CPTAC
Introduction
Para_01
- 基于基因组的系统性肿瘤研究已经彻底改变了我们对肿瘤生物学的理解,并且对患者的治疗产生了重大影响。
- 然而,许多癌症仍然缺乏有效的治疗方法或是特征描述不足,这突显了它们复杂的生物学特性以及分子和表型的异质性。
- 近期,在样本处理和液相色谱串联质谱(LC-MS/MS)方面的进展使得大规模量化蛋白质水平和翻译后修饰(PTMs)成为可能。
Para_02
- 临床蛋白质组肿瘤分析联盟(CPTAC)的共同努力已经为各种癌症类型生成了庞大的蛋白质基因组数据集。
- 这些研究均包含了蛋白质翻译后修饰(PTMs),并开始弥合分子特征与表型后果之间的差距,识别出具有潜在治疗脆弱性的新癌症亚型。
- 尽管取得了这些进展,并且PTMs在调节和微调细胞信号传导中发挥着关键作用,但它们的共同模式、不同PTMs之间的交叉作用(例如磷酸化、乙酰化等),以及多种PTMs如何形成调控网络仍然知之甚少,特别是在不同癌症类型之间更是如此。
Para_03
- 先前的泛癌症基因组研究已证明,调查不同癌症类型中的重复基因和通路改变有助于加深我们对驱动癌症的基本分子事件的理解。
- 在此,我们旨在识别跨癌症类型的共同和差异化的PTM模式,以探究在多种癌症中改变的共同的翻译后调控机制,以此来扩展和补充基因组学研究。
- 为此,我们利用来自11项研究的数据构建了一个统一的泛癌症队列,涵盖了1,110名未经治疗的患者的完整基因组、转录组、蛋白质组以及PTM(磷酸化和乙酰化)数据(图1A)。
- 这使我们能够寻找在单个队列中由于样本量有限(39至140名患者)而无法识别的模式。
-
为了专注于跨癌症的共同且与组织无关的模式,在数据类型的标准化过程中,我们将特定于组织的影响进行了回归分析(STAR方法)。
- 图1. 泛癌症数据集概览 (A) 泛癌症分析工作流程:(左侧) 可用队列的数据协调;(中间顶部) 可用的数据类型及基于RNA、蛋白质和磷酸化位点的多组学特征的发现,(中间底部) 基于特征活性的样本聚类;(右侧顶部) 用于研究肿瘤簇和途径的实验和计算工具;(右侧底部) 突出显示带有改变的翻译后修饰的癌症途径。
- (B) 队列中的肿瘤突变负担(TMB)— CPTAC中位数,红色;TCGA中位数,橙色虚线。
- (C) 展示共享表达基因(RNA)分布及不同RNA生物类型的贡献的不交集图。
- (D) 展示不同队列间共享蛋白质(左侧)、位点水平磷酸化(中间)和乙酰化(右侧)分布的不交集图(为了清晰可见,条形图代表约85%的数据)。参见补充图S1。
Para_03
- 我们的分析重点放在了(1)已知在癌症中失调且受到PTM紧密调控的经典途径,包括DNA损伤和修复途径、细胞免疫代谢以及基因表达的组蛋白水平调控;(2)不同类型的PTM之间可能存在的交互作用。
- PTM具有从快速到持续再到长期的一系列潜在调控效应。
- 在免疫和代谢反应中,PTM的瞬时性和可逆性使得细胞能够快速响应以适应微环境的变化。
- 另一方面,PTM对组蛋白修饰的影响可以影响细胞程序的长期调控;事实上,在癌症中,异常的组蛋白乙酰化可以失活肿瘤抑制因子或激活致癌基因。
- 在DNA修复过程中,磷酸化在调节DNA修复蛋白活性方面发挥关键作用,而聚焦于PTM的分析可能有助于更好地描绘DNA修复的全貌,特别是在DNA修复缺陷型癌症中。
- 最后,丝氨酸/苏氨酸磷酸化和赖氨酸乙酰化是在真核生物中最广泛分布且保守的PTM之一。
- 尽管迄今为止大多数研究集中在单一类型的PTM如何调控细胞过程上,但蛋白质携带多种PTM类型的认识表明它们可能共同作用以联合体现复杂的调控效应,其中许多效应尚未得到充分探索。
Para_04
- 总体而言,这是首个针对泛癌症研究,详细阐述了乙酰化和磷酸化的广泛调控及其在不同癌症类型中的共有模式。
- 综合来看,我们的研究成果构成了一项丰富的资源库,可用于探索和提出关于癌症中由蛋白质翻译后修饰调控过程的假设,经过进一步的实验验证后,可能有助于发现新的药物靶点或提示影响癌症生物学的新方法。
Results
Pan-cancer dataset overview
泛癌症数据集概览
Para_01
- 先前的CPTAC蛋白质基因组研究揭示了基于蛋白质的分子肿瘤亚型,并利用蛋白质翻译后修饰识别了癌症特异性途径。
- 在本研究中,我们将CPTAC队列的数据整合起来,以实现跨癌症类型的基因、蛋白质和蛋白质翻译后修饰模式的泛癌症分析。
- 为了实现这一目标,CPTAC泛癌症工作组使用标准化流程对体细胞突变、体细胞拷贝数改变(SCNAs)、mRNA表达、蛋白质丰度、磷酸化、乙酰化以及临床数据进行了统一处理(图S1)。
- 最终合并的数据集包括来自11个队列的1,110名患者(图1A)。
- 十个肿瘤类型是CPTAC的一部分,包括胶质母细胞瘤(GBM)、头颈部鳞状细胞癌(HNSCC)、肺腺癌(LUAD)、肺鳞状细胞癌(LSCC)、乳腺癌(BRCA)、胰腺导管腺癌(PDAC)、透明细胞肾细胞癌(ccRCC)、高级别浆液性卵巢癌(HGSC)、子宫内膜癌(UCEC)和结直肠腺癌(COAD)。
- 还纳入了一个外部髓母细胞瘤(MB)数据集,该数据集遵循与CPTAC数据集相同的所有可用数据类型的协议生成,但缺乏全外显子DNA测序。
- 对于每位患者,我们鉴定了胚系和体细胞变异,并量化了基因表达、蛋白质丰度及蛋白质翻译后修饰水平(星号方法)。
- 我们检测到每位患者平均约有25,000个外显子胚系变异和约320个外显子体细胞突变,体细胞突变负担的中位数与癌症基因组图谱队列相符(图1B)。
- 正如预期,一部分UCEC和COAD患者的肿瘤突变负荷(TMB)异常高,这反映了微卫星不稳定性(MSI)和聚合酶校读缺陷(POLE和POLD1核酸外切酶域突变)。
- 此外,我们发现平均约有24,000个基因(包括编码基因和非编码基因)在任何队列中都有表达(每百万转录本[TPM]≥0.1且至少在20%的患者中有≥6个读取)。
-
我们检测到每位患者平均约有10,000种蛋白质、约22,000个磷酸化位点和约6,000个乙酰化位点(6个队列可用)(星号方法;图1C和1D)
- 图S1. 泛癌症数据的协调,与图1相关 (A) 密度图显示了蛋白质修饰水平及其对应的蛋白质水平。对于每一对蛋白质修饰-蛋白质,使用普通最小二乘法(OLS)进行拟合,并将拟合得到的残差作为校正了蛋白质丰度的蛋白质修饰水平。原始磷酸化组丰度(左),推算的磷酸化组丰度(用于聚类,中),以及原始乙酰化组丰度(右)。 (B) 在应用批效应校正(使用COMBAT)前后,对10个CPTAC队列和髓母细胞瘤队列的转录组TPM进行主成分分析(PCA)投影。顶部的PCA图按测序协议着色(poly-腺苷化的mRNA富集[红色]和总RNA[蓝色]),底部的PCA图按队列着色。 (C) 特征分布展示了最终归一化的RNA数据、蛋白质组学数据、校正了蛋白质丰度的磷酸化数据以及经过队列校正后的最终多组学特征空间。分布图按队列着色。 (D) 在所有1,110个样本的PCA上,输入到非负矩阵分解(NMF)中的多组学特征的投影,按队列着色;(顶行)结合所有特征——mRNA、蛋白质和磷酸化,(中行)mRNA,(底行)蛋白质和磷酸化。(左+中列)回归去除队列特异性效应前后的特征,(右列)回归后的特征分为正值和负值用于NMF。
Para_01
- 接下来,因为我们旨在寻找泛癌症模式,我们分析了基因、蛋白质和蛋白质翻译后修饰位点之间的重叠。
- 我们发现大约21,000个基因在所有队列中都有表达(约14,500个编码蛋白质和约6,500个非编码;图1C);此外,在所有队列中检测到了6,333种蛋白质,占数据的大部分。
- 重要的是,蛋白质翻译后修饰在每种肿瘤类型中显示出更离散的模式,相对较少的修饰在队列间共享(图1D,中间和右侧面板;补充表S1)。
- 这可能反映了它们在细胞和组织水平上超越基因或蛋白质表达的作用,用于精细调节响应。
Pan-cancer PTM landscape
泛癌症蛋白质翻译后修饰全景
Para_01
- 为了探索跨癌症的共有PTM模式,我们首先整合了所有11个队列中可用的数据类型——具体来说,包括基因表达、蛋白质丰度和磷酸化蛋白水平数据——同时消除了组织特异性效应以去除肿瘤类型间的明显差异(图S1A至S1D;STAR方法)。
- 我们应用了SignatureAnalyzer,这是一种非负矩阵分解(NMF)的贝叶斯变体,在由14,057个特征组成的综合集合所代表的1,110个肿瘤上进行分析(参见STAR方法中的SignatureAnalyzer部分),从而获得了33个泛癌多组学特征。
- 值得注意的是,大多数特征都有来自这3种类型的贡献(图2A;STAR方法)。
- 除了定义这些特征外,SignatureAnalyzer还估计了每个特征在每个肿瘤中的活性水平。
-
通过将每个肿瘤分配给其最活跃的特征,我们发现大多数特征跨越多种肿瘤类型(图S2A),这表明这些特征总体上反映了泛癌生物学过程。
- 图2. 泛癌蛋白质翻译后修饰景观 (A) 基于其特征活动的样本相似性矩阵的层次聚类(中间热图)。轨迹:(顶部)聚类和队列注释,(中间)全外显子突变特征,以及(下方)ESTIMATE分配。树状图第一次分割左右两侧差异表达途径中的RNA、蛋白质及磷酸化位点显示在下部热图中。 (B) 基于树状图第一次分割时各激酶差异表达底物的激酶库富集情况以气泡图表示。富集(红色),耗竭(蓝色)。 (C) CLUMPS-PTM对第一次分割的结果显示差异乙酰化(左侧,三角形)或磷酸化(右侧,方框)位点具有显著的三维空间聚集。圆圈代表基于两者联合的显著性。DDR标志基因集(蓝色)。红色,显著结果,FDR < 0.1;黄色,接近显著的结果,FDR < 0.25。 (D) SRSF2磷酸化位点群在三维晶体结构上的分布(青色,PDB: 2LEA),RRM-1域(琥珀色,RNA识别模体),磷酸化位点(紫色)。 (E) ARID1A乙酰化位点群在三维晶体结构上的分布(青色,PDB: 6LTH),乙酰化位点(粉色)。 (F) 违约提琴图展示ARID1A(左侧)及糖皮质激素靶标(右侧)蛋白丰度在树状图第一次分割时的变化。参见补充图S2。
- 图S2. 患者聚类及CLUMPS-PTM方法,与图2相关 (A) 根据队列划分的患者分配的最大加权特征的堆叠条形图(左侧)。堆叠条形图显示了归一化后,每个特征下最大分配的患者数量的分布(右侧)。
- (B) 基于多组学NMF特征权重的肿瘤多组学层次聚类。热图表示肿瘤之间的成对余弦相似度。非重叠簇用黄色框标出。顶部轨迹显示簇的分配情况。树状图根据树的第二级进行着色。
- (C) 由贡献最大的特征所占样本NMF特征权重的比例分布(左上);解释至少90%样本特征权重所需的特征数的分布(右上);由贡献最大的特征所占样本NMF特征权重的比例与第二大特征所占比例之差的分布(底部)。
- (D) 新开发的CLUMPS-PTM算法的工作流程图。
- (E) 显示从蛋白质序列到PDB结构映射的Sankey图。蛋白质序列通过BLASTP+比对至UniProtKB数据库,然后筛选出那些使用结构、功能、分类和序列集成方法(SIFTS)识别出的注释良好的匹配蛋白质。这些蛋白质随后映射到在整个CPTAC数据集中至少包含3个修改过的PTM位点的可用晶体结构(左上角)。Sankey图展示了CPTAC数据集中的所有PTM位点,分为那些具有映射至可用UniProt输入蛋白质的访问号,然后是那些经SIFTS数据库验证的具有可用PDB结构的蛋白质(左下角)。小提琴图显示了映射或未映射至PDB结构的蛋白质和PTM位点与UniProt数据库的BLASTP+相对同一性得分(右侧)。
- (F) 堆叠条形图总结了CLUMPS-PTM的结果,显示了基于特定组差异表达测试和方向而检测的蛋白质总数(顶部)。堆叠显示了名义上显著的结构数量(p < 0.1;黄色)以及通过多重假设检验(FDR < 0.1;红色)的乙酰化组、磷酸化组和组合采样器的数量。CLUMPS-PTM磷酸化和乙酰化命中(q值 < 0.1)针对泛癌树状图顶部左右两部分的对比(底部)。第一个热图(左侧)指示了每个队列中对差异PTM簇有所贡献的不同肽段的数量。x轴代表队列。第二个热图(右侧)扩展了每个CLUMPS-PTM命中,并显示了树状图顶部左右分支间每个代表性肽段的对数倍变化。蓝色表示磷酸化的簇位点。
Para_01
- 为了表征具有共享和分歧生物学特性的肿瘤亚组,我们根据样本在33个特征上的活性进行了层次聚类分析,这些特征更能稳健地反映每个样本中的泛癌症生物学过程(表S2;STAR方法)。
- 此外,为了定义一组共享最显著生物学特性的样本(用于某些下游分析),我们遍历了系统发育树,并基于最常见的主导特征来确定聚类,识别出了26个不重叠的终端聚类(图S2B和S2C)。
- 为了进一步探索每组中的生物学特性,我们在RNA、蛋白质和蛋白质翻译后修饰(PTM)水平上进行了途径富集分析(表S2),并应用了多种专门设计来识别PTM差异的方法:(1) CLUMPS-PTM(图S2D至S2F;STAR方法),(2) 激酶库,(3) CausalPath,(4) 蛋白质翻译后修饰特征富集分析(PTM-SEA),以及(5) 预测组蛋白调控因子差异活性的方法(在STAR方法中提到的PTM专用工具)。
- 汇总这些结果使我们能够全面描述我们泛癌症队列中肿瘤生物学的差异。
Para_02
- 我们通过关注谱系树顶部的分裂开始分析,该分裂左侧显著富集了DNA损伤响应(DDR)和增殖途径(MYC和E2F),右侧则是肌细胞生成和上皮间充质转化(EMT)途径(图2A)。
- 我们应用了位点特异性途径富集分析—PTM-SEA以及基于底物特异性预测修饰调节因子的激酶库(在STAR方法中属于PTM专用工具)。
- 这两种工具均显示,在第一次分裂的左侧,周期依赖性激酶(CDK)活性显著富集,而p21激活的激酶(PAKs)下调(图2B;补充表S2)。
- 这些结果与途径激活差异一致,因为CDK介导的磷酸化与快速细胞增殖相关,而PAKs则与肌动蛋白细胞骨架重塑及伴随EMT过程中的迁移表型增强相关。
Para_03
- 使用CLUMPS-PTM来识别蛋白质3D结构中相关联的磷酸化位点群集(在STAR方法中的PTM专用工具),我们发现了22种蛋白质具有显著的磷酸化位点群集(错误发现率小于0.1),这些位点在分层图的左侧与右侧比较时,在首次分裂时上调。
- 显著磷酸化群集的顶级命中之一是SRSF2(错误发现率为0.044),这是一种富含丝氨酸和精氨酸的剪接因子。
- 该群集位于RRM-1域内,其磷酸化形式已显示能与E2F1相互作用,从而促进细胞周期靶基因如cyclin E的转录调控(图2D和补充图S2F),进而促进肺癌细胞系中的细胞增殖。
Para_04
- 对于乙酰化位点,我们仅发现一个蛋白质ARID1A具有显著的聚集(FDR = 0.085)。
- ARID1A是一种SWI/SNF染色质重塑因子,在癌症中通常发生突变,并在肿瘤发生中发挥复杂作用。
- 该聚集位于ARID1A的C末端尾巴内,处于糖皮质激素受体(GR)结合域(图2E和S2F)。
- GR调节许多基因的产物,这些产物增加分解代谢,减少炎症,并增加细胞存活。
- 在这个聚集中的乙酰化增强可能阻止了蛋白质C末端的一个泛素化位点,这将减少ARID1A的降解,并可能增加GR信号传导。
- 实际上,我们在树状图左侧观察到ARID1A和GR靶标的蛋白丰度更高(图2F)。
Mechanisms of PTM dysregulation in DNA repair-deficient tumors
DNA修复缺陷肿瘤中PTM失调的机制
Para_01
- 接下来,我们利用我们的蛋白质基因组数据集来研究那些在基因组和转录组水平上无法检测到的DNA修复缺陷的影响。
- 首先,我们通过应用SignatureAnalyzer对我们的数据集的五个不同部分进行了突变特征提取,这些部分分别代表了不同的环境和细胞内源性突变机制:POLE/POLD1外切核酸酶结构域突变体、错配修复缺陷(MMRD)、吸烟相关、同源重组缺陷(HRD)相关以及非HRD相关(图S3A;STAR方法)。
- 我们总共提取了22种突变特征,代表了11种不同的突变过程,包括MMRD和HRD(图3A;表S3;STAR方法)。
- 使用这些特征,我们确定了57例MMRD肿瘤和88例HRD肿瘤(图S3B;STAR方法)。
-
与之前的泛癌症研究一致,大多数MMRD肿瘤来自COAD和UCEC队列(分别为21例和28例肿瘤),而HRD组则包括54例HGSC、30例BRCA和4例PDAC肿瘤。
- 图S3. 突变特征提取及DNA修复缺陷分析,与图3相关 (A) 突变特征提取工作流程的示意图以及所得突变特征的条形图表示。
- (B)散点图展示了归因于同源重组缺陷(HRD)相关的突变特征的突变数量和突变比例的分布(顶部)。HRD分类阈值为45个突变,用虚线表示。已知BRCA1、BRCA2或PALB2基因中有致病性或高影响种系变异的肿瘤用黑色轮廓突出;散点图展示了结直肠癌(COAD)和子宫内膜癌(UCEC)肿瘤中归因于错配修复缺陷(MMRD)相关的突变特征的突变数量和突变比例的分布(底部)。MMRD分类阈值分别为72个突变和19%的突变比例,分别由水平和垂直虚线表示。已知MSH6、MSH2、MLH1和PMS2基因中有致病性或高影响变异的肿瘤用黑色轮廓突出。
- (C)HRD和同源重组功能正常(HRP)肿瘤之间差异表达的DNA损伤反应(DDR)基因(RNA[r圈]、蛋白质[方框]和磷酸化位点[p圆圈]水平)的途径及其推断出的对其他途径成员的影响。HRD肿瘤中的上调用红色表示,下调用蓝色表示。激酶与其底物之间的虚线边缘表示该相互作用位于特定激酶所有顶级评分底物的第90百分位(激酶库)。
- (D)结直肠癌(UCEC)和结直肠癌(COAD)MMRD肿瘤的多组学特征权重的主成分分析(PCA)。点按肿瘤类型着色(COAD,橙色;UCEC,紫色)。
- (E)MRN复合体蛋白(MRE11、RAD50和NBN)相对蛋白质丰度(顶部)和DepMap数据集中来自CCLE COAD及UCEC癌症细胞系的RNA表达分布。各组按错配修复能力分开并着色(MMRD,紫色;MMR功能正常,黄色)。形状指示肿瘤类型(UCEC,圆形;COAD,三角形)。
- 图3. DNA修复缺陷的蛋白质翻译后修饰分析 (A) 与每个队列相关的突变特征。圆圈大小代表肿瘤的比例。圆圈颜色表示每兆碱基的中位突变数。 (B) 火山图展示了HRD和HRP肿瘤之间的差异磷酸化情况。标记了MMEJ基因。 (C) 基于多组学特征活性的第一主成分投影的小提琴图,针对HRD肿瘤。点的颜色根据癌症类型着色,并按HRD聚类分开。 ∗p值 < 0.05, ∗∗p值 < 0.01, ∗∗∗p值 < 0.001, 和 ∗∗∗∗p值 < 0.0001。 (D) 急性和慢性缺氧HRD聚类的示意图(顶部)。箭头长度代表缺氧持续时间。气泡图展示了急性和慢性缺氧HRD亚组之间的GSEA结果(底部)。 (E) 急性和慢性缺氧HRD肿瘤之间差异表达的DDR基因的CausalPath结果。急性缺氧上调(红色),下调(蓝色)。黑色虚线,基于激酶库结果的第90百分位评分底物。 (F) 展示MMRD和MMRP肿瘤之间GSEA结果的气泡图。MMRD途径上调(红色),下调(蓝色)。框表示DSB途径在RNA和蛋白质水平上的相反效应。 (G) 显示MMRD和MMRP肿瘤之间MRN复合体蛋白的蛋白质丰度(顶部)和RNA(底部)水平的小提琴图(COAD [圆形] 和UCEC [三角形])。RAD50微卫星移码插入/缺失样本用红色标出。 (H) 如(E)所示,MMRD和MMRP肿瘤之间差异表达的DDR基因的CausalPath结果。另见图S3。
Para_01
- HRD癌症依赖替代修复途径来缓解双链断裂(DSB)损伤。
- 为了探究HRD癌症中PTM指导的修复蛋白活性,我们对DNA修复基因进行了HRD与同源重组功能正常(HRP)肿瘤之间的差异表达分析(涵盖所有特征类型),随后通过CausalPath分析来识别PTM与其调节因子之间的因果关系(PTM专用工具见STAR方法部分)。
- 这些比较揭示了在112种被测量的DNA修复蛋白中的268个位点(共1,596个位点)显著不同的磷酸化水平。
- 特别是,我们发现了微同源末端连接(MMEJ)途径中8种蛋白质(共12种)的差异,该途径是主要的HRD补偿途径(FDR ≤ 0.1,图3B;补充表S3)。
- 值得注意的是,我们发现PARP1三种磷酸化位点的磷酸化水平增加,包括PKA介导的S782位点(FDR = 0.05)和ATR介导的S179位点(FDR = 0.05),这些位点已知可调控PARP1活性。
- HRD肿瘤还表现出POLQ S1587位点的显著磷酸化增加(FDR = 0.05)。
- POLQ通过抑制RAD51介导的同源重组促进MMEJ,其缺失已被证明会在HRD肿瘤中引起合成致死效应,包括对PARP抑制剂耐药的细胞系(补充图S3C);然而,S1587位点磷酸化的功能效应尚未得到充分研究。
- 我们还发现EXO1 S714位点的磷酸化水平增加(FDR = 0.04),这是一个由ATM介导的位点,据推测可减弱EXO1活性并阻碍同源重组(HR)的发生。
- 因此,差异磷酸化分析揭示了可能调节因HR缺失而产生的补偿机制的特定位点修饰。
Para_02
- 我们观察到88个HRD肿瘤分布在系统发育树的四个主要分支上(集群A至D,图2A)。
- 因此,我们探讨了这种划分是否反映了不同的DNA修复活性,这可能与不同的治疗脆弱性相关。
- 首先,我们对HRD肿瘤中的多组学特征权重进行了主成分分析(PCA),以验证当仅关注这些肿瘤时,它们在泛癌症系统发育树中的划分得以保持。
- 我们发现即使是第一主成分(PC1)也能区分这些HRD集群(图3C)。
- 为了表征与每个集群相关的生物过程,我们在A、B和C之间(由于D样本量小,n=7,未包括D)进行了多组学差异表达分析。
- 基因集富集分析(GSEA)显示,与A相比,B显著上调了与缺氧相关的蛋白,而与C相比则显著下调(假发现率FDR分别为0.08和0.03;附表S3)。
- 先前的细胞系研究表明,缺氧程度与DNA损伤修复(DDR)之间的关系表明,急性缺氧伴随周期性再氧化激活了DNA修复途径以减轻与活性氧(ROS)相关的DNA损伤,而慢性缺氧则停滞复制并抑制DDR。
- 我们假设B代表一个急性缺氧群组,而C代表一个慢性缺氧群组。
- 事实上,GSEA也突出显示,在mRNA水平上ROS途径上调(FDR=0.04);在蛋白质水平上DNA修复上调(FDR=0.02);以及在B与C相比时,在mRNA和蛋白质水平上DNA复制均上调(FDR分别为0.01和0.02)(图3D;附表S3)。
- 类似地,PTM-SEA检测到在急性缺氧HRD集群B中DNA损伤信号激酶ATM、CHEK1和CHEK2的活性增加(FDR分别为0.09、0.02和0.06),以及CDK1/2/4/6活性的富集(所有FDR=0.018;附表S3),正如预期的那样。
Para_03
- 为了识别急性缺氧和慢性缺氧HRD肿瘤之间DDR蛋白调控因子的具体差异,我们对所有差异表达特征应用了CausalPath。
- CausalPath通过PARP1蛋白的增加(FDR = 0.09)检测到急性缺氧HRD组中PARP1和XRCC1相互作用的增强,并且XRCC1位点S475、S485和T488的磷酸化减少(FDR = 0.102,图3E)。
- 这种相互作用促进了XRCC1向ROS诱导的碱基损伤和单链断裂位点的招募,表明在碱基切除修复(BER)途径中PARP1活性增加。
- 这对于PARP抑制剂的PARP捕获机制是必要的。
- 进一步支持PARP活性增加的是,GSEA显示氧化磷酸化途径在蛋白质水平上的富集以及糖酵解途径下调(FDR分别为0.0007和0.08),这与由于PARP消耗NAD+而引起的已知促进生存的代谢从糖酵解向氧化磷酸化的转变一致。
- 此外,CausalPath突出了CDK2对WRN S1133的磷酸化,这一点得到了激酶库的支持(CDK2底物中的第97.5百分位),并且这是一种对复制叉崩溃的已知反应。
- 总体而言,专注于磷酸化的分析突显了急性缺氧和慢性缺氧HRD肿瘤之间DDR蛋白的主要PTM活性差异,这些差异在突变特征水平上无法区分。
Para_04
- 与将HRD肿瘤分为四组不同,MMRD肿瘤仅显示出基于组织的分离(图S3D),这促使我们对所有MMRD肿瘤进行综合分析。
- 类似于HRD分析,我们在与DNA修复基因相关的所有特征类型中进行了MMRD肿瘤与错配修复功能正常(MMRP)肿瘤之间的差异表达分析(表S3)。
- 正如预期,由于MMRD肿瘤中MLH1启动子普遍发生高甲基化,MLH1 RNA表达和蛋白质丰度的减少(FDR分别为1×10-33和5×10-30)是显著差异中最突出的。
- 为了描述通路级别的差异,我们对所有差异表达特征进行了基因集富集分析(GSEA)(图3F;表S3)。
- 有趣的是,在mRNA水平上,MMRD肿瘤表现出双链断裂(DSB)修复途径的上调而在蛋白质水平上则下调(FDR分别为0.09和0.01;图3F中的框)。
- 这种差异可能是因为不同的基因驱动了mRNA与蛋白质通路激活水平(分别是14个与4个不同的核心基因)。
- 这4个核心蛋白质是MRE11、RAD50、NBN(它们共同形成DSB感知和信号传递的MRN复合体),以及ATM(FDR分别为2×10-17、2×10-18、2×10-7和2×10-3;图3G)。
- 我们探究了是否微卫星截断突变可以解释这些基因mRNA和蛋白质水平的下降,之前的研究发现这些突变在RAD50、MRE11和ATM中富集。
- 我们发现了16位患者在RAD50中有截断变异(10例K722fs和4例N934fs移码插入缺失),所有这些患者均属于MMRD组(16/49对比0/142,FDR=1×10^-10,表S3;STAR方法)。
- 由于仅有少数几个截断事件(MRE11和NBN分别有三个和一个),因此对MRE11和NBN变异的分析不够充分。
- 有趣的是,在MMRD与MMRP细胞系中,MRE11、RAD50和NBN蛋白质丰度相似地下降,但MRE11的mRNA仅轻微下降,而RAD50和NBN的mRNA没有变化甚至增加(图S3E),这提示减少复合体中的一个蛋白质可能会使复合体不稳定并导致其他复合体蛋白质的降解。
- 需要进一步研究来探索MMRD肿瘤中MRN复合体表达减少的机制。
Para_05
- 与先前报告一致,我们也发现了ATM微卫星插入缺失变异在MMRD肿瘤中的显著富集(16/49对比3/142,FDR = 5 × 10^-8;表S3)。
- 将差异表达结果应用于CausalPath分析揭示了由于ATM丢失导致的DSB感知和信号传导缺陷的证据(图3H)。
- MMRD肿瘤显示PRKDC(DNA-PKcs)在S3205位点由ATM介导的磷酸化水平下降(FDR = 0.1),这会诱导DSB修复信号。
- 我们还发现PNKP在S114和T118位点由ATM和PRKDC介导的磷酸化水平下降(FDR = 0.09,表S3)。
- 这些位点的磷酸化对于PNKP在DSB位点的保留以及后续NHEJ途径中DSB末端处理前的加工至关重要。
- 这些结果突出表明,蛋白质基因组学分析可以揭示在MMRD肿瘤中仅凭mRNA水平无法观察到的体细胞有害变异的影响。
PTM regulation of metabolic pathways affects tumor-associated immune responses
PTM对代谢途径的调控影响肿瘤相关的免疫反应
Para_01
- 细胞代谢与免疫反应之间的相互作用先前已被确立;在此基础上,我们的目标是表征PTM调控对不同肿瘤类型间这种相互作用的影响。
- 首先,我们应用了多种推断免疫浸润和活性的方法:(1) ESTIMATE,它根据精心挑选的基因集的表达水平来估计免疫浸润的丰度;(2) ImmuneSubtypeClassifier,它使用分类器方法提供更细致层次的免疫表型;以及(3) 基于CIBERSORT精心挑选的基因集富集情况的无监督聚类。
- 我们的无监督聚类方法揭示了不同癌症类型中的四种主要免疫亚型:免疫冷型、免疫凉型、免疫温型和免疫热型。
- 这些亚型与ESTIMATE和ImmuneSubtypeClassifier的结果一致。
- 我们在亚型中观察到了混合的肿瘤分布,除了"免疫冷型",它主要由脑瘤组成(130个样本中有93个),这与脑瘤通常呈现免疫冷型的情况相一致,部分原因是血脑屏障的存在。
- 接下来,我们通过移除免疫细胞的贡献来估算肿瘤内在表达,并在这些免疫亚型中进行了差异表达和途径分析。
- 与之前的研究所示相似,我们的免疫热亚型显示免疫相关途径增加,以及包括IDO1、CD163、ENTPD1和PD-L1 (CD274)在内的免疫抑制标志物显著增加。
- 中位数倍数变化低于LUAD中先前报道的数据,可能是因为跨癌症类型的异质性较大。
- 我们还在免疫凉亚型中发现多个代谢途径中的乙酰化水平存在显著差异,包括丙酸代谢、氧化磷酸化和脂肪酸(FA)代谢途径。
- 在这些途径中,已知乙酰化发挥重要的抑制作用。
- 我们在免疫热组的脂质代谢途径中观察到高水平的乙酰化,在免疫凉亚型中则观察到低水平的乙酰化(FDR < 0.01),即使校正了蛋白质丰度(图中标注为acetylome_res),表明低水平的乙酰化可能促进了免疫凉肿瘤中这些途径的高度激活。
- 实际上,FA酶已知能控制特定基因的表达,而这种效应主要在蛋白质和PTM水平上进行调控。
-
值得注意的是,免疫冷型肿瘤显示出与免疫热型肿瘤类似的代谢途径激活,这可能是由于大脑主要依赖葡萄糖作为能量来源,因为它在产生ATP时需要较少的氧气(尽管这一解释并不能解释为何少数非脑瘤被聚类到免疫冷型中,这一点仍有待确定)。
- 图4. 跨癌症免疫代谢中的蛋白质翻译后修饰调控 (A) 免疫相关基因集的ssGSEA分层聚类(热图),显示四种免疫聚类:从热到冷。轨迹代表ESTIMATE和ImmuneSubtypeClassifier注释。标准化富集评分 (NES)。 (B) 泡状图表示四种免疫亚型中MSigDB(分子标志数据库)标志和KEGG(京都基因与基因组百科全书)途径的富集情况。 (C) 在免疫热群组中ALDOA(顶部;PDB: 6XMH-A)上乙酰化和磷酸化位点基于CLUMPS-PTM的显著聚类,以及在免疫冷聚类中HADH上减少的乙酰化位点的聚类(下部;PDB: 3RQS-A)。磷酸化位点(紫色)、乙酰化位点(粉色)和乙酰辅酶A结合位点(绿色)。 (D) 火山图显示免疫冷亚型与其他免疫聚类之间差异乙酰化的结果。突出显示脂肪酸代谢蛋白上的乙酰化位点。 (E) 泡状图表示脂肪酸β-氧化酶乙酰化位点与IFNγ途径中蛋白质水平之间的显著相关性。 (F) 免疫冷与免疫热肿瘤中基于PTM的代谢变化示意图,展示糖酵解和脂肪酸β-氧化途径中的关键酶及其对T细胞的预期影响。参见补充图S4。
- 补充图 S4. 免疫聚类、活性及与之相关的代谢标志物,与主图 4 相关。(A)小提琴图显示了基于 ImmuneSubtypeClassifier 和来自 ESTIMATE 的纯度估计的不同免疫特征水平,涵盖了所有肿瘤中的 4 种识别出的免疫聚类。
- (B)小提琴图显示了来自 CIBERSORT 的前 6 种免疫细胞丰度,这些细胞被用作差异表达分析中的协变量,以估算 4 种免疫聚类中的肿瘤内在基因表达。
- (C)堆叠条形图显示了每个队列中 4 种免疫聚类的分布。
- (D)小提琴图显示了 4 种识别出的免疫聚类间免疫抑制标志物 PD-L1、IDO1、CD163、ENTPD1 的显著性差异(显示 q 值 < 0.1 的两两比较)。
- (E)小提琴图显示了当免疫冷型分为脑部和非脑部肿瘤时,不同免疫亚型中脂肪酸相关蛋白的乙酰化水平。
- (F)BCKDK(PDB:1DTW)展示了通过 CLUMPS-PTM 显示的免疫冷型聚类中调控位点的显著空间聚集的磷酸化位点。蛋白质三维晶体结构的空间填充模型(青色)和高亮的簇状磷酸化位点(紫色)以及胸苷-5′-三磷酸(TTP)位点用绿色标记。
- (G)气泡图表示 4 种免疫聚类中各激酶的差异表达底物的激酶库富集分数和显著性。颜色代表富集(红色)和贫化(蓝色)。激酶根据其系统发育群组着色。117
- (H)小提琴图显示了 4 种识别出的免疫聚类间脂肪酸转运体——CPT1A、FABP、ABCA3、CD36 的显著性差异(仅显示 q 值 < 0.1 的两两比较)。
- (I)MSigDB 标志基因集的单样本 GSEA 值与从 CIBERSORT 估算的 CD8+ T 细胞丰度之间的斯皮尔曼相关性。
Para_01
- 接下来,我们使用CLUMPS-PTM对这些免疫亚型中差异调控的位点进行分析,以识别三维蛋白质结构上的功能区域。
- 在免疫热亚型中发现了ALDOA酶的糖酵解域上一个显著的簇集,该酶在癌症中丰富,簇集中包含4个增加的乙酰化位点(K147、K153、K200和K230;FDR < 0.12,限定于糖酵解蛋白),其中三个位点也是已知的泛素化位点,可能导致蛋白质降解。
- 同一域在免疫温亚型中拥有显著的磷酸化位点簇集(FDR = 0.06,限定于糖酵解蛋白)(图4C顶部;补充表S4)。
- 相反,在免疫冷亚型中,多个脂肪酸代谢相关蛋白(例如HIBCH、FASN和HADH)显示出乙酰化减少的位点簇集(FDR < 0.12,限定于脂肪酸途径)。
- 例如,HADH在脂肪酸β-氧化中起关键作用,八个显著减少的乙酰化位点集中在蛋白的3-羟基酰辅酶A(CoA)脱氢酶NAD结合域上;该域还包含乙酰CoA结合位点,允许酶与底物结合并随后进行氧化反应。
- 此外,我们在催化α-酮酸总体分解为乙酰CoA的BCKDH的脱氢酶E1域上检测到显著增加的磷酸化位点簇集(S337、T338和S339,FDR = 0.0026)。
- 这种磷酸化被证实由BCKDK介导,并抑制BCKDH活性,进一步限制了乙酰CoA水平,增加了脂肪酸氧化以支持细胞的能量需求(补充图S4F)。
Para_02
- 然后我们进行了PTM-SEA分析来确定PTM的主要调控因子(例如,激酶或磷酸酶;表S4)。
- 这一分析揭示了(1)免疫冷亚型中的CDK活性高度富集,这与该亚型的高增殖特性一致(此外还得到了激酶库富集结果的支持;图S4G),以及(2)mTOR活性的高度富集,mTOR是脂肪酸代谢和氧化磷酸化的直接调控因子,并且通过SREBP1间接调控脂质稳态。
- 此外,免疫冷亚型显示出了脂肪酸摄取的增加,这既包括细胞内的转运蛋白,如CPT1A(FDR小于7×10-7),也包括细胞表面的转运蛋白,包括(1)FABP4,(2)ABCA,和(3)CD36(FDR小于1.3×10-4,在免疫冷与免疫热亚型之间的比较)(图S4H)。
Para_03
- 最近的研究表明,富含脂质的肿瘤微环境会降低效应T细胞的细胞毒性21,87,因为这些细胞无法代谢长链脂肪酸(FAs),从而导致脂毒性及耗竭23。
- 因此,我们检测了脂肪酸乙酰化水平与免疫相关效应蛋白水平之间的关联(图4D)。
- 我们观察到下调的脂肪酸乙酰化位点与干扰素伽马(IFNγ)和细胞细胞毒性途径中的免疫反应标志蛋白之间存在显著正相关(图4E)。
- 其中一些最显著的相关性出现在GZMA与HADHA K214和K759之间(rho -0.3,p < 1 × 10-13)以及CD38与HADHB K277和K253之间(rho 0.35,p < 1 × 10-13)。
- 此外,使用来自CIBERSORT估计的CD8+ T细胞丰度的单样本基因集富集分析(ssGSEA)进行的斯皮尔曼相关分析显示,FA是继干扰素途径之后第四大显著相关的关联(rho 0.23,FDR = 2 × 10-13,补充图S4I)。
- 癌症细胞及其邻近免疫细胞中受PTM调控的生物过程之间的观察到的关联总结在图4F中。
Alterations in histone regulation by PTMs in cancer-associated genes
癌症相关基因中组蛋白通过PTMs调控的改变
Para_01
- 这里,我们利用了最大的泛癌症乙酰化数据集,全面研究了六种具有可用乙酰化数据的癌症类型的组蛋白乙酰化和磷酸化模式(详见方法部分)。
- 为了识别特定的组蛋白乙酰化模式,我们将组蛋白相关的基因分为以下五类:(1) 连接组蛋白 H1,(2) 四种核心组蛋白 H2A(包括 MACROH2A1、MACROH2A2、H2A.X 和 H2AZ1),(3) H2B,(4) H3,以及 (5) H4(图 5A)。
- 我们发现组蛋白乙酰化被划分为两个结构群组,群组 1(H3、H4 和 H1)和群组 2(H2A 和 H2B),群组内的每一对之间的平均乙酰化谱之间存在显著的相关性(所有相关系数 rho 大于 0.4,p 值小于 2.2 × 10^-16),而两个群组之间的对则显示出较弱或无相关性(-0.15 < rho < 0.17)(补充图 S5A)。
-
这与乙酰化状态协调导致核小体开放增强及随后的基因激活相一致。
- 图5. 泛癌症组蛋白调控 (A) 热图显示了6个队列中各种组蛋白底物的位点特异性乙酰化水平。上方的轨道显示了队列、聚类分配、性别和吸烟评分。(B) 散点图展示了特定位点组蛋白翻译后修饰水平与烟草吸烟引起的突变特征活性之间的排序。通过自助法确定的斯皮尔曼相关系数的95%置信区间。(C) 泡状图展示了泛癌症中组蛋白乙酰化关键调控因子与组蛋白乙酰化位点之间的关联。(D) 散点图展示了组蛋白调控因子与所有肿瘤及树状图中特定聚类中的H2B乙酰化水平之间的套索回归关联。β代表套索回归系数。(E) 热图显示了免疫冷亚型与其他所有免疫亚型相比的差异性乙酰化组蛋白位点。(F) 组蛋白乙酰化位点与其邻近磷酸化位点之间的相关性。参见补充图S5。
- 图S5. 组蛋白分析,与图5相关 (A) 相关矩阵显示H1、H2A、H2B、H3和H4平均乙酰化之间的相关性。星号表示p < 0.05的相关性。 (B) 小提琴图显示男性和女性鳞状细胞肺癌(LSCC)及肺腺癌(LUAD)中烟草吸烟突变特征贡献(对数10尺度)的分布。形状表示癌症类型—LUAD(圆形)和LSCC(三角形)。Wilcoxon秩和检验得到的p值(1 × 10-4)。 (C) 散点图显示男性LUAD患者(n = 71)中组蛋白乙酰化水平与烟草吸烟突变特征贡献之间显著的斯皮尔曼相关性(q ≤ 0.1)。 (D) 散点图显示男性LUAD患者(n = 71)中脱乙酰酶磷酸化水平与烟草吸烟突变特征贡献之间显著的斯皮尔曼相关性(q ≤ 0.1)。 (E) 散点图说明了男性LSCC和男性LUAD患者(n = 157)中烟草吸烟突变特征贡献与MSigDB标志基因集的mRNA单样本基因集富集分析(ssGSEA)得分之间显著的斯皮尔曼相关性(q ≤ 0.1, |rho| > 0.15)。 (F) 散点图显示烟草吸烟突变特征贡献与男性LUAD和男性LSCC肿瘤(n = 157)中G2/M检查点(左)和MTORC1(右)标志基因集的ssGSEA得分之间正相关(rho = 0.332)。
Para_01
- 由于已知吸烟会损害组蛋白脱乙酰化酶(HDAC)活性并影响组蛋白乙酰化,我们试图通过评估吸烟突变特征与肺腺癌(LUAD)肿瘤中组蛋白乙酰化之间的相关性来更好地表征这些效应,为了排除性别与吸烟之间强烈关联所带来的影响,我们限制研究对象为男性患者(性别与吸烟之间的p值=1×10^-4,图S5B)。
- 我们发现了两种正相关和两种负相关显著的相关性(FDR≤0.1;图S5C)。
- 其中一种相关性是先前描述过的吸烟与H4-16 K9和K13位点乙酰化剂量依赖性的关系(rho=-0.33,FDR=0.09)。
- 我们也发现了H2AZ1 K8/K12和H2AZ1 K12/K14位点乙酰化的正相关性(rho分别为0.34和0.39;FDR分别为0.08和0.06)(图S5C;表S6)。
- 这些位点的乙酰化已被证明可以使H2AZ1定位于多个癌症基因(例如ERBB3、CDK4和RASEF)的启动子区域,并促进它们的转录(图5B)。
- 接下来,为了探究吸烟对HDAC活性的影响,我们测试了吸烟与HDAC磷酸化的相关性。
- 我们发现了四个蛋白质上的六个显著(FDR≤0.1)的正相关性,这些蛋白质都是SIN3/HDAC复合体的组成部分(图S5D)。
- 其中一种相关性是HDAC2 S422位点的磷酸化(rho=0.36,FDR=0.04),这已经被证实可以降低脱乙酰化酶活性。
- 此外,这个位点的磷酸化是由CSNK2A1激酶在接触香烟提取物后介导的。
Para_02
- 在这项分析之后,我们通过将吸烟特征与ssGSEA途径得分相关联(图S5E),研究了与吸烟相关的组蛋白乙酰化变化可能带来的转录后果。
- 在显著关联中(FDR ≤ 0.1 和 rho ≥ 0.15),预期上调的G2/M检查点基因位列前茅,这与先前将香烟烟雾和增殖增加相联系的研究一致(FDR = 0.01, rho = 0.26, 图S5F, 左侧)。
- 我们也发现了与mTOR信号通路基因之间存在显著正相关(FDR = 0.01, rho = 0.27, 图S5F, 右侧),这与先前的研究一致,并且可能通过改变细胞增殖和代谢在肺部肿瘤发生中发挥作用。
Para_03
- 接下来,我们研究了关键调控因子(组蛋白乙酰转移酶[HATs]、组蛋白脱乙酰酶[HDACs]和溴域蛋白[BRDs];见STAR方法)与组蛋白乙酰化水平之间的关联。
- 我们发现多个组蛋白乙酰转移酶CBP/p300的蛋白质丰度与多种乙酰位点呈正相关,包括组蛋白H2B的N端乙酰位点如K11、K15、K16和K20(0.2 < 𝞵 < 0.52;补充表S5),这与报道的CBP/p300对这些位点的底物特异性一致(图5C)。
- 组蛋白乙酰转移酶NCOA1的蛋白质丰度也与H2BC9-K21乙酰化呈正相关(ꞵ = 0.29),NCOA1是已知的CBP/p300的共激活因子。
- 此外,我们还发现了新的关联,例如H3C1在K36位点的乙酰化与HAT1呈正相关(ꞵ = 0.36)。HAT1被证明可以促进H3在K14位点的乙酰化,并且其表达与多种癌症类型中的不良预后相关。
- 我们也观察到了负相关:HDAC5的蛋白质丰度与H2BC14在K16和K20位点的乙酰化呈负相关(ꞵ = -0.20)。HDAC5是一个已知的治疗靶标,在多种癌症类型中的细胞分化、干细胞性和增殖中发挥作用。
Para_04
- 我们还在我们的26个簇内测试了这些关联,并确实发现了特定簇的相关性(表S5)。
- 例如,使用所有样本时,CBP与H2B显示出较低的相关性(ꞵ = 0.25),但在评估第22簇中的肿瘤时,相关性明显增强,该簇富含脑部肿瘤(ꞵ = 0.65,图5D)。
- 此外,我们测试了组蛋白调控与癌症标志通路之间的关联。
- 我们在第二级树状图的最右侧比较左侧和右侧时,发现EP300在已知激活位点K1558和K1560上的乙酰化水平增加(FDR = 2.6 × 10⁻⁷)。
- 并且,在由CBP/p300调控的H2A和H2B的N端乙酰化位点(H2AC21-K5K9,FDR = 0.052;H2BC18-K16K20,FDR = 1.3 × 10⁻⁴)上也观察到了一致的乙酰化水平升高。
- 此外,基因集富集分析显示,在簇C的肿瘤中E2F和MYC转录靶标显著富集(FDR均为0.08)。
- 与此一致的是,我们在六个队列中发现了H3乙酰化与E2F、MYC以及G2/M检查点途径之间存在显著的正相关关系,这可能反映了与细胞增殖相关的转录增加。
- 我们还观察到H3在K27和K36位点的乙酰化与MTORC1信号传导之间存在显著的正相关关系,这与先前的研究一致。
Para_05
- 随后,我们关注了代谢变化如何影响我们泛癌症免疫亚型中组蛋白的调控。
- 上述发现表明,在免疫冷肿瘤中脂肪酸代谢增加(相对于免疫热肿瘤),并且我们还观察到相对于免疫热肿瘤,22个组蛋白乙酰化位点中的乙酰化水平下降;相对于免疫温肿瘤,则是在31个位点上观察到了这一现象(FDR < 0.1,图5E;补充表S5)。
- 正如先前所示,这些结果反映了组蛋白乙酰化与糖酵解通量以及不同免疫簇中细胞内乙酰辅酶A丰度和可用性之间可能存在的关联。
- 这些结果反映了一种可能的关联,即组蛋白乙酰化与糖酵解通量以及不同免疫簇中细胞内乙酰辅酶A的丰度和可用性有关。
Para_06
- 最后,我们分析了相邻组蛋白磷酸化位点和乙酰化位点之间的相关性,以更好地理解它们之间潜在的交互作用。在全球测试的81对组蛋白乙酰化位点与磷酸化位点(相距最多五个氨基酸)中,我们鉴定出12对显著相关的位点(FDR < 0.05;补充表S5)。例如,H3F3A-S31的磷酸化与H3F3A-K27K36的乙酰化在所有样本中高度相关(rho = 0.38,FDR = 6.2 × 10^-7),这与S31磷酸化通过p300活性刺激H3-K2乙酰化的发现一致。(图5F)。此外,H3-S28的磷酸化水平与H3-K27的乙酰化呈正相关(rho = 0.27,FDR = 3 × 10^-5),这与S28磷酸化降低K27三甲基化并促进乙酰化相一致。
Crosstalk between protein phosphorylation and acetylation in cancer
在癌症中蛋白质磷酸化和乙酰化的交叉对话
Para_01
- 受到组蛋白中磷酸化位点与邻近位点乙酰化之间相关性的启发,我们旨在系统地分析这种互作在其他蛋白质中的情况。
- 从机制上讲,丝氨酸/苏氨酸蛋白激酶以其磷酸化位点周围氨基酸序列的底物特异性而著称。
- 因此,我们探讨了磷酸接受位点附近的赖氨酸乙酰化是否会影响这些位点被磷酸化的可能性。
Para_02
- 我们通过使用简并肽底物实验性地表征了207种重组丝氨酸/苏氨酸激酶对赖氨酸-PTM选择性,这些肽底物比较了磷酸受体位点111、113、114、115、116周围五个相邻氨基酸位置上修饰和未修饰的赖氨酸(图6A)。
- 总体而言,我们观察到激酶组通常会选择排斥含有乙酰化赖氨酸的底物(图6B)。
- 然而,也有一些例外情况,其中某些激酶偏好乙酰化的赖氨酸而不是未修饰的赖氨酸来完成附近丝氨酸或苏氨酸的磷酸化(图6C)。
- 我们也观察到了对三甲基化赖氨酸的全局性排斥模式,但与乙酰化相比程度较小,这可能是因为三甲基化引起的立体结构变化较小且保留了赖氨酸上的正电荷(图S6A和S6B)。
-
综合来看,我们的筛选表明丝氨酸/苏氨酸激酶能区分磷酸受体位点周围的赖氨酸的不同PTM状态,并且赖氨酸乙酰化有可能调控丝氨酸/苏氨酸激酶的功能。
- 图6. 泛癌症中乙酰化与磷酸化的交互作用 (A) 激酶库概览——使用未修饰、甲基化或乙酰化的赖氨酸(标记为"K")对组合肽库进行生化测定,测试激酶对含有修饰赖氨酸的肽的亲和力,这些赖氨酸位于丝氨酸/苏氨酸磷酸接受位点(排除丝氨酸、苏氨酸和半胱氨酸)相对位置的±5处;例如,+3K表示有一个赖氨酸位于磷酸接受位点向C端方向的第三个氨基酸位置上。
- (B) 盒形图显示了未修饰和乙酰化赖氨酸残基的平均强度。
- ∗p值 < 0.05 和 ∗∗∗∗p值 < 0.0001。
- (C) 热图显示了乙酰化与未修饰赖氨酸残基平均强度之比。根据激酶的系统发育群对其进行着色。117
- (D) 散点图展示了组蛋白H3-3A上的K23乙酰化水平与S28磷酸化水平之间的相关性及其队列分布(顶部)。生化特异性测定显示了AurB和PKACB在未修饰与乙酰化肽之间的磷酸化情况(底部)。
- (E) 火山图显示了磷酸化位点与乙酰化位点对之间的相关性。突出了负相关性。
- (F) 散点图展示了RSF1上的K1378乙酰化水平与S1375磷酸化水平之间的相关性及其队列分布(左侧)。生化特异性测定显示了CDK1在未修饰与乙酰化肽之间的磷酸化情况(右侧)。
- (G) 提出的RSF1上抑制性交互作用机制。更多细节见图S6。
- 图S6. 与图6相关的激酶库 (A) 盒图显示了207种丝氨酸/苏氨酸激酶对于未修饰、三甲基化和乙酰化的赖氨酸,在中心磷酸受体位点周围10个位置(-5至+5)的激酶库标准化强度比值。
- (B)热图显示了207种丝氨酸/苏氨酸激酶中三甲基化赖氨酸与未修饰赖氨酸之间的激酶库标准化强度比值。根据激酶的系统发育群对它们进行着色。
- (C)热图显示了H3F3A上乙酰化的K23和磷酸化的S28在第8簇中的41位患者中的表达水平。样本根据它们相关性的层次聚类进行排序。
- (D)热图显示了RSF1上乙酰化的K1378和磷酸化的S1375在具有乙酰化和磷酸化数据的89位LUAD和LUSC患者中的表达水平。样本根据它们相关性的层次聚类进行排序。
Para_02
- 利用这些激酶特异性模式,我们有可能识别出参与特定乙酰化-磷酸化交叉对话的激酶。
- 由于不同的激酶可能在各种细胞类型和状态下活跃,我们首先将交叉对话映射到不同的系统发育树分支上,这些分支可能各自显示出共享的激酶活性,因为它们具有相似的RNA、蛋白质和磷酸化模式。
- 我们在全局蛋白质以及系统发育树聚类(STAR方法)中搜索相邻对(相距最多五个氨基酸)中的潜在乙酰化-磷酸化交叉对话。
- 我们在包含终端聚类22和23的一个系统发育树分支中鉴定出H3-3A在K23位点的乙酰化与S28位点的磷酸化之间存在负相关(rho = -0.58,FDR = 0.04,图6D顶部),表明这种抑制性交叉对话在这类肿瘤中独特存在,与其他所有肿瘤相比(rho = 0.08,FDR = 0.35全局)。
- 据报道,S28的磷酸化可以激活转录,而K23位点的乙酰化则抑制转录。
- H3-3A上的S28是奥拉激酶(AURK)家族和PKA家族成员报告过的底物。
- 与这一发现一致,我们的AurB和PKACB底物基序在这个背景下表现出对乙酰化赖氨酸的选择性排斥(图6D底部),表明K23位点的乙酰化抑制了这些上游激酶使S28磷酸化的能力
Para_03
- 随后,我们探讨了其他蛋白质中的乙酰化-磷酸化交叉对话,并在579名患者中鉴定出3,952对相邻位点(图6E;STAR方法)。
- 其中,74对位点显示出它们水平之间显著的负相关(FDR < 0.1)。
- 统计学上最显著的例子之一是中心粒蛋白RSF1上的S1375/K1378(图6F左和补充图S6D;补充表S6)。
- RSF1是一个调控有丝分裂的关键介质,在多种癌症中已知过度表达。
- 据报道,CDK1在G2/M期磷酸化RSF1上的S1375,这有利于激酶PLK1的招募,从而促进后续的有丝分裂事件。
- 在我们的肽底物实验中,CDK1强烈偏好位于C末端方向第三个位置的赖氨酸(+3K)附近的丝氨酸/苏氨酸,与RSF1已知的模式相匹配;此外,当赖氨酸被乙酰化时,磷酸化几乎完全消失(图6F右),这与CDK1在K1378乙酰化时减少对S1375的磷酸化能力一致,可能解释了观察到的负相关性。
Para_04
- 借助我们的激酶组范围评分系统,我们还能推断出RSF1的磷酸化如何促进这一信号级联的下一步,并随后招募PLK1(图6G)。
- PLK1与含有被磷酸化的丝氨酸或苏氨酸的肽段结合,这些丝氨酸或苏氨酸直接前一个未被修饰的丝氨酸(S-pS/pT),而RSF1上的T1371符合这种模式。
- 因此,当CDK1磷酸化S1375后,该磷酸化肽段成为泛表达的GSK3激酶(GSK3 alpha/beta)进行第二次磷酸化事件的底物,这次磷酸化发生在T1371上,之后磷酸化肽段可被PLK1识别。
- 一旦赖氨酸K1378被乙酰化,整个级联反应就会被抑制。
- 综上所述,这可以解释RSF1上S1375/K1378之间的串扰最终如何影响PLK1的招募。
Discussion
Para_01
- PTMs 是信号传导的核心调控因子,并且在蛋白质-蛋白质相互作用、蛋白质稳定性以及定位等众多基本功能中发挥重要作用。
- 在这项研究中,我们全面探讨了11种癌症类型中的PTMs,并突显了PTMs对已知癌症标志过程的贡献:(1) DNA修复,(2) 免疫反应,(3) 代谢,(4) 组蛋白调控,以及(5) 激酶调控。
- 我们注意到这些过程和PTM模式在不同癌症类型间的共性以及重要的差异。
- 这一丰富的资源将使人们能够进一步研究跨越多种癌症类型的PTMs,而不仅仅局限于本文所描述的研究工作。
Para_02
- 诸如HRD和MMRD之类的DNA修复缺陷在整个肿瘤发展中产生了体细胞突变的模式,提供了特定修复缺陷的证据。
- 重要的是,这些突变特征不一定反映当前的修复途径活动状态,这对于理解针对DNA修复基因(例如PARP和POLQ抑制剂等)疗法反应的变异至关重要。
- 对DNA修复缺陷癌症的深入分析突显了以磷酸化为重点的分析揭示和表征在基因组和转录组水平上无法检测到的信息模式的能力。
- 通过我们对HRD簇的分析,我们发现DNA修复蛋白的磷酸化显著差异与缺氧严重程度密切相关。
- 我们在慢性缺氧的HRD肿瘤中发现了包括PARP1在内的几种DNA修复蛋白活性降低,这可能影响它们对PARP抑制剂的反应。
- 我们对MMRD肿瘤的蛋白质基因组学分析将RAD50微卫星插入缺失与MRN复合体三个关键蛋白丰度的显著下降联系起来,这对DSB感知和信号传导至关重要。
- 通过位点特异性磷酸化分析,我们发现了进一步的DSB修复功能障碍证据,这可能为开发MMRD(即MSI)癌症的治疗方法提供额外途径。
Para_03
- 一般来说,免疫反应受到严格调控,以便针对宿主遇到的不同威胁做出相应的反应,这需要能够迅速调节的变化,而这类变化可以通过蛋白质翻译后修饰(PTMs)来实现。
- 同样地,细胞代谢也需要这种灵活性,因此PTMs在调节免疫和代谢反应中发挥着重要作用。
- 例如,越来越多的证据表明,癌症细胞通过FA酶上的PTMs调控脂质代谢可以影响免疫反应。
- 在本研究中,我们确定了四种基于表达的免疫聚类,这些聚类具有不同的代谢表型,并由乙酰化驱动。
- CLUMPS-PTM突出显示了与糖酵解相关的蛋白ALDOA,在免疫热亚型中,该蛋白存在显著改变的磷酸化和乙酰化位点群集,与增强的ALDOA活性相关联。
- 在小鼠中抑制ALDOA减少了肺转移并延长了生存期。
- 免疫冷亚型显示脂肪酸代谢活性增加,这与IFNγ表达减少密切相关,表明脂肪酸在免疫抑制中起重要作用。
- 最近的研究表明,在急性髓系白血病(AML)中抑制脂肪酸氧化可以恢复对venetoclax和azacitidine的敏感性,这两者在细胞变得耐药后仍然有效。
- 这些结果突显出,靶向肿瘤中的脂质代谢不仅可以降低肿瘤细胞产生高水平能量的能力,而且还可以促进更有利于免疫细胞浸润和激活的肿瘤微环境。
- 此外,我们还发现了转录活跃的代谢途径与组蛋白乙酰化水平下降之间的关联,这可能是因为用于乙酰化和能量产生的乙酰辅酶A的可用性降低;需要进一步的研究来探讨这种调控机制。
Para_04
- 最终,我们利用激酶库进行了乙酰化和磷酸化之间交叉调控的全面分析。
- 这一分析揭示了大多数丝氨酸/苏氨酸激酶不喜欢磷酸化位点附近存在乙酰化的赖氨酸(表现为显著负相关的邻近乙酰化-磷酸化位点对),这使我们能够预测可能负责这种交叉调控的激酶。
Para_05
- 总之,蛋白质翻译后修饰是肿瘤细胞适应和响应细胞内及环境变化不可或缺的一部分。
- 更深入地理解由蛋白质翻译后修饰调控的导致癌症发生和发展过程的机制有可能揭示新的治疗靶点,识别对现有疗法反应的生物标志物,并扩展我们对癌症生物学的认识。
Limitations of the study
研究的局限性
Para_06
- 基于基因组的泛癌症研究已被证明是发现新的癌症驱动基因、共享失调途径以及确定可操作治疗靶点的极其宝贵的资源。
- 我们的蛋白质基因组学泛癌症研究仅限于11种肿瘤类型的1,110个样本,我们预计更大规模的研究,包括更多病例和更多癌症类型,将增强我们识别癌症背后的蛋白质基因组机制的能力。
- 本研究中描述的所有分析均基于整体肿瘤材料。
- 类似于单细胞和空间转录组学分析,包括单细胞蛋白质组学、空间蛋白质组学和激光捕获显微切割等技术有望为了解肿瘤异质性和特定细胞类型对癌症的贡献提供更有价值的见解。
- 尽管全面专注于蛋白质翻译后修饰(PTM)的研究和PTM间的相互作用分析正在成为新兴领域,但仍存在一些不足:(1)当前的质谱分析具有相对较高的假阴性率,限制了我们在PTM之间进行相互作用分析的能力;(2)为了完全建立PTM之间的相互作用关系,需要进行双质谱搜索以同时检测2个或更多的PTM;(3)虽然有关磷酸化数据库和激酶预测工具的数量正在增长,但目前缺乏平行的全面乙酰化数据库和工具,且本研究报道的许多乙酰化位点的功能效应仍有待探索。
Consortia
Para_01
- 国家癌症研究所临床蛋白质组肿瘤分析联盟的成员包括弗朗索瓦·阿盖特、约·阿基亚马、尹坤庆、尚卡拉·阿南德、米纳克希·阿努拉格、奥兹根·巴布尔、贾斯敏·巴瓦尔瓦、切特·比尔杰、迈克尔·J·比里尔、安娜·卡利纳万、刘易斯·C·坎特利、曹松、史蒂文·A·卡尔、米歇尔·切卡雷利、丹尼尔·W·陈、阿鲁尔·M·钦奈安、乔·汉拜尔、肖拉班蒂·乔杜里、马尔辛·P·切斯利克、卡尔·R·克劳泽、安东尼奥·科拉皮科、周丹尼尔·崔、费利佩·达·维加·莱普罗沃斯特、科宾·戴、萨拉瓦纳·M·丹纳塞卡兰、李丁、马尔辛·J·多马加尔斯基、董永超、布莱恩·J·德鲁克、内森·爱德华兹、马修·J·埃利斯、米维齐·埃赛尔·塞万、大卫·芬约、史蒂文·M·福尔茨、艾丽西亚·弗朗西斯、伊法特·盖芬、加德·盖茨、迈克尔·A·吉利特、塔尼亚·J·冈萨雷斯·罗布尔斯、萨拉·J·C·戈斯林、泽耶内普·H·古穆斯、大卫·I·海曼、塔拉·希尔特克、洪润宇、盖伦·霍斯特特、胡英伟、黄晨、亨特曼·艾米莉、安东尼奥·伊瓦罗内、埃里克·J·詹宁、斯科特·D·朱厄尔、贾伊伊·吉、温·江、贾里德·L·约翰逊、利莎白·卡茨内尔松、凯伦·A·凯奇姆、伊加·科洛德热伊恰克、卡尔斯特恩·克鲁格、钱丹·库马尔-辛哈、亚历山大·J·拉扎尔、乔纳森·T·莱伊、李义泽、梁文蔚、廖玉兴、凯莱布·M·林德格伦、刘涛、刘文克、马卫平、D·R·马尼、费尔南达·马丁斯·罗德里格斯、威尔逊·麦克斯罗威、梅赫迪·梅斯里、阿列克谢·I·涅斯维日斯基、切尔西·J·纽顿、罗伯特·奥尔德罗伊德、吉尔伯特·S·奥门、阿曼达·G·保罗维奇、塞缪尔·H·佩恩、弗朗切斯卡·彼得拉利亚、彼得罗·普格利泽、鲍里斯·雷瓦、安娜·I·罗布尔斯、卡琳·D·罗德兰、亨利·罗德里格斯、凯莉·V·拉格尔斯、德米特里·里昆诺夫、尚卡·萨特帕蒂、萨拉·R·萨维奇、埃里克·E·施达特、迈克尔·施瑙贝尔特、托比亚斯·施赖尼克、斯特凡·舒尔、石志佼、理查德·D·史密斯、宋晓宇、宋宜哲、瓦西莱奥斯·斯塔西亚斯、埃里克·P·斯托尔斯、谭吉明、纳德日达·V·特雷哈诺娃、拉特纳·R·唐古杜、马塔吉·蒂亚加拉詹、妮科尔·蒂格诺、王约书亚·M、王良博、王沛、王颖、文博、麦克埃杰·维兹内罗维茨、吴一歌、马修·A·维查尔考斯基、姚立俊、雅龙·托默、易欣培、张冰、张辉、张青、张旭、张臻。
- 请注意,上述名单中的名字按原文顺序排列。
Additional resources
附加资源
Para_01
- 关于CPTAC项目的综合信息,包括项目举措、研究者和数据集,均可在CPTAC项目网站上获取:https://proteomics.cancer.gov/programs/cptac。
Para_02
- 对于泛癌症蛋白质基因组学收集论文,以及与这些出版物相关的数据和补充材料的链接,请访问蛋白质组数据公共库(PDC):https://pdc.cancer.gov/pdc/cptac-pancancer。
本文由mdnice多平台发布