影响因子:6.543
研究背景:线粒体是细胞的能量工厂,线粒体能量代谢通路相关基因(MMRGs)的表达和突变异常可能导致能量产生异常,这与恶性肿瘤的发生发展密切有关。其中,糖酵解途径中的一个重要基因GAPDHS在黑色素瘤中高表达,是预后不良的的生物标志物。ACSBG1是一种酰基辅酶A合成酶,参与脂肪酸的代谢。细胞色素P4504(CYP4)酶家族参与脂肪酸和信号分子的代谢,如CYP4A11在肝癌组织中被下调。线粒体能量代谢通路中的异常基因可能是诊断和治疗肺癌的新靶点和生物标志物。
本文,作者研究分析了线粒体能量代谢途径,从TCGA数据库提取肺癌,肺癌突变和临床特征,建立回归模型,并进一步验证肺癌这个模型的准确性。这些发现将为肺癌患者分层、精确的预后评估和个性化治疗提供有希望的数据。
我们可以综合各个文章中的内容,换成新的基因集/复合物/通路/基因家族等进行分析。如果需要的话可联系小编预定
结果解读:
一、MMRG在肺癌中的情况
该团队在TCGA数据库中的肺癌(n=1006)和对照肺(n=107)组织之间进行分析,并通过KEGG通路数据库中共获得了188个MMRGs。
二、MMRG-介导的信号通路
1、对188个MMRGs进行GSEA富集分析。肺癌组织中有151个具有统计学意义的基因集,对照组织中有19个具有统计学意义的基因集。
2、脂质代谢途径主要富集于肺对照组(图1),ATP能量产生相关途径(氧化磷酸化、ATP电子传递链、乳酸酸中毒、酸碱平衡紊乱)主要富集于肺癌组(图2)。
3、对肺癌I期(592例患者)和II期(385例患者)的188例MMRG进行GSEA富集分析。脂质代谢基因主要富集于第I阶段(图3a),ATP能量生成过程、氧化磷酸化途径和细胞呼吸基因主要富集于第II阶段(图3b和3c)。
综上所述,肺癌组织中线粒体能量代谢通路发生改变。
图1 癌旁正常组织与肺癌组的GSEA分析
图2 肺癌组织与邻近正常组比较的GSEA分析
图3 I期与II期肺癌的GSEA分析
三、肺癌中MMRGs的突变现状
1、对肺癌中188个MMRG的突变进行分析,发现几乎突变碱基都为胞嘧啶,前3个高突变碱基分别为C➔A、C➔T和C➔G(图4(a))。结果表明,胞嘧啶非常不稳定,氨基易被氧化。
2、MMRG的总体突变率不高,最高的突变率仅为4%(图4(b))。
3、在短期生存组(<1000天)和长期生存组(>1000天)中对188 个MMRGs突变进行分析,发现ACOX3的突变率在短期生存组更高,而OGDH的突变率在长期生存组更高 (图4(c))。
4、肺癌中ACOX3在突变组和野生型组之间的生存分析显著(图4(d))。而肺癌中OGDH在突变组和野生型组之间的生存分析不显著(图4(e))。
图4 188个线粒体能量代谢通路相关基因(MMRGs)的突变分析
四、年龄与肺癌中MMRGs表达水平及突变频率的关系
1、在肺癌组,年龄与MMRGs的相关分析发现,没有任何MMRGs与年龄显著相关,相关系数为-0.1~0.1(表3)。
2、在对照组,年龄与MMRG的相关性分析发现,5个MMRG与年龄的相关性相对较弱,相关系数大于0.2(表4)。结果表明,年龄对肺癌患者的MMRG没有影响。
五、肺癌中MMRG的差异表达
在188个MMRGs中,肺癌和对照组中有43个差异表达的MMRGs。与对照组相比,肺癌中有24个上调MMRGs和19个下调MMRGs(图5(a))。
六、差异表达的MMRGs的功能特征
1、对43个差异表达的MMRG进行GO富集分析,发现148个具有统计学意义的BPs、2个CCs和30个MFs(图6)。
2、BPs主要参与小分子分解代谢过程、脂肪酸代谢过程及核苷酸代谢过程(图6a)。CCs主要与线粒体基质和脂滴有关(图6b)。
3、MFs主要参与作用于供体醛或氧基的氧化还原酶活性,NAD或NADP作为受体,作用于供体醛或氧基的氧化还原酶活性,醛脱氢酶[NAD(P)+]活性和醛脱氢酶(NAD+)活性(图6c)。
图6 BPs、CCs和MFs中差异表达MMRGs的富集途径分析
七、差异表达MMRG的蛋白-蛋白相互作用网络
1、使用43个差异表达的MMRG构建PPI网络(图5(b))。通过细胞景观进一步分析PPI网络,发现10个枢纽分子,包括GAPDH、GAPDHS、PC、PKLR、ALDH18A1、GPI、PFKP、ACADL、ACSL1和CPT1B(图5(c))。
2、这些枢纽分子是糖酵解、三羧酸和氧化磷酸化过程中的关键酶和分子。结果表明,肺癌患者的线粒体能量代谢途径发生了改变。
图5 肺癌中差异表达的MMRG
八、肺癌中差异表达MMRG的生存分析
1、对肺癌中43个差异表达的MMRGs进行生存分析,发现3个差异表达的MMRGs(GAPDHS、ACSBG1和CYP4A11)具有生存意义(图7)。
2、在GAPDHS低表达组,肺癌患者的生存预后较优。对于肺鳞状细胞癌和肺腺癌,GAPDHS低表达和高表达组之间的生存预后无统计学意义(图8a)。
3、在ACSBG1高表达组,肺癌和肺腺癌患者的生存预后较优。对于肺鳞状细胞癌,ACSBG1低表达组和高表达组之间的生存预后无统计学意义(图8b)。
4、在CYP4A11高表达组,肺癌和肺鳞状细胞癌患者的生存预后较优。对于肺腺癌,CYP4A11低表达组和高表达组之间的生存预后无统计学意义(图8c)。
5、年轻(<60岁)患者的生存预后明显优于老年(>60岁)患者(图9a),且肺癌I期和II期之间无显著差异(图9b)。
综上所述,对性别、年龄、分期、癌症类型、GAPDHS、ACSBG1、CYP4A11的多因素Cox回归分析发现,年龄较大(>60岁)、高表达GAPDHS、低表达ACSBG1、低表达CYP4A11是肺癌预后的高危因素(图10)。
图7 肺癌患者GAPDHS、ACSBG1、CYP4A11的生存情况分析
图8 肺癌亚组中三个基因的生存分析
图9 肺癌不同亚组的生存分析
图10 肺癌多因素Cox回归分析
九、肺癌中生存相关差异表达MMRG的免疫组化分析
1、在人蛋白图谱在线数据库中,检测了正常肺组织中GAPDHS蛋白的染色情况。5例受试者的正常支气管或肺组织染色,GAPDHS蛋白均为阴性(图11)。
2、6个正常肺组织中的ACSBG1蛋白在肺泡细胞和肺组织中的巨噬细胞中染色强度中等(图12)。
图11 肺正常组织和支气管组织中GAPDHS的免疫组化分析
图12 正常肺静脉组织的免疫组织化学显示ACSBG 1染色
十、不同肺癌数据集中生存相关差异表达MMRG的验证
1、GAPDHS、ACSBG1和CYP4A11的LUAD组和LUSC均与对照组之间无显著差异(图13)。
2、GAPDHS在肺癌不同肿瘤分期(I、II、III、II期)的表达差异无统计学意义。而ACSBG1和CYP4A11在4个肿瘤分期的表达差异分别有统计学意义(图14)。
3、通过独立数据集GSE21933验证显示,ACSBG1在肺癌组中显著低表达。肺癌组与正常组间GAPDHS、CYP4A11差异无统计学意义(表3)。
图13在不同类型肺癌中,三种基因在癌组和正常组中的表达不同(红色代表癌症组,绿色代表正常组)
图14 不同阶段肺癌生存相关差异表达MMRGs(GAPDHS、ACSBG1和CYP4A11)的表达
十一、基于差异表达MMRG的肺癌构建机器学习模型
1、采用Ridge回归方法筛选出6个基因(ACADL、ADH1B、ALDH18A1、CPT1B、CYP2U1、PPARG)。又通过logistic回归模型筛选出4个特征基因(表4)(逻辑回归公式为y = 0.0069 ∗ ACADL – 0.001 ∗ ALDH18A1 – 0.0405 ∗ CPT1B + 0.0008 ∗ PPARG – 1.625,其正确分类率高达98.74%,AUC值高达0.992,漏诊率仅为0.6%)。
2、采用Weka3.8.5软件建模方法对癌旁正常组织和肺癌组织进行分类。建立了决策树桩、逻辑回归、朴素贝叶斯和多层感知器四种模型(图15(a))。4个差异表达的MMRGs在逻辑回归模型中的重要性是ACADL>CPT1B>ALDH18A1>PPARG(图15(b))。
图15 肺癌中四个差异表达的MMRG特征模型的构建
十二、机器学习模型中四种差异表达的mmrg的验证
Western blot结果显示,与对照组相比,CPT1B和ALDH18A1蛋白表达水平显著上调(p<0.05),p<0.05时ACADL和PPARG蛋白表达水平略有下调(图16)。
图16 对模型中4个差异表达的MMRG进行Western blot分析
总结:
线粒体能量代谢途径的改变是肺癌的重要标志。该团队研究分析了肺癌和对照组织中188个MMRGs的表达水平和突变状态,发现肺癌中有43个差异表达的MMRGs(24个表达上调,19个表达下调)。在肺癌中发现了3种与生存相关的差异表达的MMRGs,包括GAPDHS、ACSBG1和CYP4A11。年龄并没有增加MMRG突变的风险。在肺癌组织中,GAPDHS高表达、ACSBG1、CYP4A11低表达、ACOX3突变、老年预示着预后不良。4个差异表达的MMRGs(ACADL、ALDH18A1、CPT1B和PPARG)建立了能够有效诊断肺癌的逻辑回归模型(回归方程:y=0.0069∗ACADL−0.001∗ALDH18A1−0.0405∗CPT1B+0.0008∗PPARG−1.625),该公式能良好的区分肺癌和对照组,正确分类率高达98.74%,AUC值高达0.992,漏诊率仅为0.6%。它对肺癌的诊断和预后评估具有重要的科学价值。CPT1B和ALDH18A1蛋白的表达水平显著上调,而ACADL和PPARG蛋白的表达水平略有下调。结果表明,这四种蛋白对肺癌有一定的诊断作用。