影响因子: 6.1
研究内容:
肥胖是全球公共卫生问题,其中代谢健康肥胖(MHO)占10%-51%,而肥胖个体代谢健康是其患病率变化的重要因素,代谢异常与肥胖引发的并发症存在密切联系,但其中的潜在机制仍不完全清楚。该研究的主要目的在于阐明与代谢相关的基因如何参与肥胖相关的代谢疾病。作者通过GEO数据集鉴定出肥胖组和正常组之间的差异基因(DEGs),这些基因显著富集在丙酸酯代谢途径中。WGCNA分析鉴定出于丙酸酯代谢相关性最高的模块基因。利用DEGs,模块基因和机器学习法,作者最终鉴定出相关代谢相关基因,分别是STOX1和NWD2。这两个基因成功区分了肥胖和正常个体。 此外,作者构建的肥胖小鼠模型中也检测到以上两个基因的下调,说明STOX1和NWD2与肥胖代谢异常有关。
研究结果:
识别与肥胖相关的差异基因(DEGs)
通过DESeq2对GEO数据集中肥胖群体与正常群体之间的差异基因进行鉴定(图1 A-C)。图1A和B分别展示了差异基因的表达热图和火山图。图1C 则是两类群体的主成分分析结果。 图1 D和E分别是差异基因的GO富集分析结果和KEGG通路富集分析结果。此外作者还利用GSVA分析,检测了两组样本之间差异代谢相关途径,发现与正常样本相比,肥胖个体中的丙酸代谢基因集评分出现显著下调,相反,参与“卟啉和叶绿素代谢”和“半乳糖代谢”的基因集评分在肥胖个体中表现出上调(图2 A-B)。
**WGCNA和机器学习筛选关键基因并构建模型 **
作者利用WGCNA共表达网络(图3A -C)发现,在三种代谢途径途径中,orangered4与丙酸代谢途径的相关性最强(图3D),该模块组成基因与DEGs的交集基因共有14个(图3 E)。随后,作者根据这14个基因利用两种机器学习算法:Random Forest 和 XGBoost,筛选关键基因并构建模型,对于 XGBoost 模型,使用可变重要性值评估基因重要性,选择值大于或等于中位数的基因(见文章补充图)。同样,随机森林模型使用MeanDecreaseGini 值评估基因重要性,选择值≥ 1 的基因。两个算法所得出的关键基因分别是STOX1和NWD2。 随后作者通过分析 ROC 曲线来评估其所构建模型和两个特征基因的诊断性能(图4A-B, D-E )。图4C和图4F分别展示了两个基因在训练集或者验证集健康群体和肥胖群体的表达情况。
肥胖症的代谢亚型分类
为了研究大写基因在肥胖和健康个体中的预测潜力,作者进行了一致性聚类分析,成功确定了两种不同的亚型(图5 A),两个亚型间的基因存在着显著差异(图5 C),主成分分析结果也显示二者之间存在差异(图5D),差异基因的GO、KEGG 分析和 GSEA 的结果显示,通过共有聚类分析确定的亚型与代谢途径之间存在很强的相关性(图5 D-G)。棒棒糖图说明了两个关键基因 NWD2 和 STOX1 与代谢途径之间的强相关性(图5 H)。
体内模型鉴定关键基因的表达水平
为了研究 STOX1 和 NWD2 基因与代谢过程之间的潜在关系,作者检测了它们在野生型 (WT)、ob/ob(瘦素基因纯合突变)、DB/DB(廋素受体基因纯合突变) 和高脂饮食 (HFD) 小鼠白色脂肪组织中的表达水平。RT-qPCR结果显示,与瘦小鼠相比,肥胖小鼠的 STOX1 和 NWD2 mRNA 水平较低(图5A-B)。这些结果表明,STOX1 和 NWD2 基因可能作为与肥胖相关的代谢生物标志物。
研究总结:
这项初步研究旨在筛选并鉴定与肥胖相关代谢紊乱相关的基因,结果表明 STOX1 和 NWD2 可能作为肥胖人群中有前途的生物标志物。文章从差异分析着手,筛选差异基因所富集的关键代谢通路,通过WGCNA分析进一步确定与关键代谢通路有关的基因,随后利用机器学习筛选关键基因并构建模型,最后在相应疾病动物模型中验证关键基因的表达情况。 总的来说,本篇代码简单,容易复现。