最新5.7分生信,单细胞泛癌+空转泛癌+百种机器学习研究CAF的衰老表型,投稿到接收仅48天,可谓是水刊中的天花板!

1 发表杂志信息

发表杂志名称:Frontiers in Immunology

影响因子:5.7

online 时间:2024 年 12 月 5 日



2 研究概述

本研究利用泛癌单细胞和空间转录组分析,结合多组学数据与机器学习算法,旨在探究衰老相关癌症相关成纤维细胞(senes CAF)在神经母细胞瘤(NB)中的分子景观及临床意义。研究人员通过衰老相关基因鉴定 senes CAF 亚群,构建 senes CAF 相关特征(SCRS)模型,经多种算法和队列验证,该模型能精准诊断 4 期 NB 并预测预后。分析发现,低风险组患者生存结局更好、免疫浸润更丰富且对免疫治疗更敏感。此外,研究还揭示了关键基因 JAK1 在泛癌中的异质性。本研究成功开发 SCRS,为 NB 的诊断和预后分层提供新方法,也为 senes CAF 的研究提供新视角。

3 研究结果

图 1:癌症相关成纤维细胞(CAF)在泛癌中的异质性及衰老相关 CAF 的鉴定:

通过 UMAP 图展示泛癌中 CAF 亚群分布,发现 7 个 CAF 亚群及周细胞、平滑肌细胞(图 1A);曼哈顿图呈现各 CAF 亚型标记基因(图 1B);GO 富集分析显示各亚型前 3 个功能术语(图 1C);6 种 scRNA 评分算法结合衰老基因集进行富集评分,确定 senes CAF 子集在衰老富集评分中居首,且其高表达 OPTN、RAB31 和 IFI16 等衰老相关基因(图 1D - F);点图展示各 CAF 亚型标记基因(图 1F);不同癌症类型中,iCAFs 和 mCAFs 在 CAF 亚群中占比高,iCAFs 在肺腺癌(LUAD)更常见,mCAFs 在卵巢癌(OVCA)更常见,senes CAFs 在子宫内膜癌(UCEC)和头颈部鳞状细胞癌(HNSC)更常见(图 1G、H);CytoTRACE 分析表明增殖性 CAF(prolif CAF)可能处于早期状态(图 1I);Monocle3 和 slingshot 伪时间分析揭示 CAF 亚型分化谱系和评分,体现其分化的复杂性和异质性(图 1J、K);SCENIC 分析发现 mCAFs 中 TCF12 基序与 ECM 重塑相关,senes CAFs 中 IRF 家族与炎症衰老相关(图 1L)。本图全面展示了泛癌中 CAF 的异质性,成功鉴定出 senes CAF 子集,并揭示了不同 CAF 亚型的特征、偏好及分化关系。


图 2:CAF 亚型在多种癌症中的空间分布特征:

利用 CellTrek 整合 scRNA-seq 和 ST 数据,重建多种癌症的空间单细胞图谱,涵盖结直肠癌(CRC)及其肝转移、乳腺癌(BRCA)及其脑转移、卵巢癌(OVCA)和肝细胞癌(LIHC)等(图 2A - H);RCTD 反卷积分析展示肿瘤组织切片中各种主要细胞类型的空间分布(图 2A - H 第一个图);Cottrazm 分析划分恶性、混合和正常区域,展示肿瘤边界和免疫屏障空间分布(图 2A - H 第二个图);CellTrek 映射分析显示组织切片中 CAF 亚型的空间位置,表明肿瘤微环境中有多种 CAF 亚群浸润且存在 senes CAFs(图 2A - H 第三个图);计算空间 k 距离发现,CAF 亚群间空间 k 距离最小,senes CAF 与内皮细胞在 CRC 肝转移和 OVCA 中、与 B 细胞在 CRC 和 LIHC 中空间 k 距离较近(图 2A - H 第四个图)。该图详细呈现了 CAF 亚型在多种癌症组织中的空间分布特点以及与其他细胞类型的空间关系。


图 3:NB 肿瘤样本的单细胞测序分析:

在 GSE137804 scRNA 队列中,经质量控制和 “harmony” 算法去除批次效应后,获得 172,564 个细胞(补充图 S2A、B);依据文献标记手动注释 10 种主要细胞亚型,包括 NE 细胞、T 细胞等,并展示各亚型前 5 个标记基因(图 3A、B);热图可视化标记基因,结合 GO 和 KEGG 术语功能注释,验证单细胞注释结果(图 3C);“Dimplot” 展示部分标记基因表达水平(图 3D);不同 INSS 分期的 NB 患者中,NE 细胞占主导(图 3E);UMAP 视图展示各细胞子集分布和细胞密度(图 3F)。此图对 NB 肿瘤样本进行了单细胞层面的分析,明确了主要细胞亚型及其标记基因和分布特征。


图 4:鉴定与衰老最相关的 CAF 亚型 —— 肌成纤维细胞:

从 NB 单细胞数据筛选 3105 个成纤维细胞进行 scRNA 分析,质量控制和批次效应校正良好(补充图 S2C、D);基于文献标记手动注释 10 种 CAF 亚型(图 4A),展示各亚型前 5 个标记基因(图 4B);分析不同 INSS 分期中 CAF 亚型组成差异(图 4C);7 种 scRNA 评分算法显示肌成纤维细胞与衰老密切相关,可能是 senes CAFs,且在另外三个独立数据集得到验证(图 4D、E;补充图 S2G、H);热图和功能注释验证 CAF 亚型注释结果(图 4F);发现 iCAFs 标记基因在衰老过程中富集;鉴定出 1088 个显著的 senes CAF 标记(补充表 S4);不同 CAF 亚型在 INSS 分期上存在偏好(图 4G);CytoTRACE 和伪时间分析表明热休克蛋白 CAF 可能处于早期状态,senes CAF 相对衰老(图 4H - J);SCENIC 分析发现 senes CAFs 中 SRF 基序与细胞衰老相关(补充图 S2I)。该图成功鉴定出 NB 中与衰老相关的 CAF 亚型为肌成纤维细胞,并对其特征和分化关系进行了深入分析。


图 5:构建和验证诊断 SCRS 以诊断 INSS 4 期 NB:

对五个 NB 队列进行批次校正,PCA 图显示校正效果良好(补充图 S3A);利用 senes CAF 标记基因开发模型,13 个诊断标记基因用于诊断 ML 模型,8 个预后标记基因用于预后 ML 模型(补充图 S3B);基于留一法交叉验证(LOOCV)框架进行 101 种预后和 113 种预测 ML 组合,筛选最佳模型(补充图 S3C);RF 算法建立的模型在五个队列中平均 AUC 最高(0.862)(图 5A);多种评估指标表明 RF 模型是最佳诊断模型(补充图 S3D、E);GSE49710 和 E-MTAB 8248 队列中,混淆矩阵显示 SCRS 诊断精度良好(图 5B、C);五个数据集的 ROC 曲线显示 SCRS 区分能力强(图 5D);SCRS 和包含临床变量的 LR 模型的 AUC 优于其他临床因素(图 5E);校准曲线显示 SCRS 预测概率可靠(图 5F);DCA 曲线表明 SCRS 和 LR 模型临床获益大(图 5G);列线图可视化诊断 LR 模型辅助临床决策(图 5H);RF 选择的 11 个模型基因中,EPN2 影响力最大(图 5I)。此图详细展示了诊断 SCRS 的构建过程和良好的诊断性能,为 INSS 4 期 NB 的诊断提供了有力工具。


图 6:开发和验证预后 SCRS 以预测 NB 预后:

SuperPC 构建的 ML 组合在五个队列中平均 C 指数最高(0.763)(图 6A);多种指标表明 SuperPC 模型在校准和精度方面表现最佳(补充图 S3F);GSE85047 数据集中,低风险患者总生存期(OS)和无进展生存期(PFS)比高风险患者长(图 6B、C);1 - 、3 - 和 5 - 年 OS 的 ROC 曲线显示 SCRS 特异性良好(图 6D);3 - 年 OS 的 AUC 值表明 SCRS 和包含 SCRS 及临床因素的 cox 回归模型预测预后更具判别力(图 6E);时间依赖性 ROC 曲线显示 SCRS 和 cox 回归模型判别能力优于常见临床因素(图 6F);校准曲线(图 6G)和 DCA 曲线(图 6H)表明 SCRS 准确性和临床获益高;多变量 Cox 回归分析表明 SCRS 风险评分是独立预后变量(图 6I);单变量 Cox 回归分析展示每个模型基因的预后价值(图 6J);SuperPC 选择的 8 个模型基因中,CKS2 影响力最大(图 6K)。该图充分验证了预后 SCRS 在预测 NB 预后方面的准确性和可靠性,为 NB 患者的预后评估提供了重要依据。


图 7:GSE49710 队列中 SCRS 模型基因的功能富集分析和景观:

PCA 分析显示,由预后 SCRS 划分的高、低风险组存在显著差异(图 7A);通过 GO 和 KEGG 数据库对两组间差异表达基因(DEGs)进行功能富集分析,发现 DEGs 在 GO 术语中富集于外动粒,在 KEGG 术语中富集于 DNA 复制(图 7B、C);GSEA 发现高风险患者中核糖体和运动蛋白升高,细胞黏附分子降低(图 7D、E);GSVA 分析表明高风险患者在 myc_targets_v1 中升高,在 hedgehog_signaling 中降低(图 7F);SCRS 模型基因表达和临床因素在两组间差异明显,JAK1 在高风险患者中表达显著降低,具有预后保护价值(图 7G);Spearman 相关性分析表明 SCRS 模型基因间关系紧密(图 7H);CNV 数据显示 INPP4B 在诊断模型基因中、VGLL4 在预后模型基因中体细胞 CNV 频率最高(图 7I、J);描绘 SCRS 模型基因在染色体上的突变位点(图 7K)。此图深入分析了 SCRS 模型基因在不同风险组中的功能差异、表达特征以及与临床因素的关系,揭示了其潜在的生物学机制。


图 8:GSE49710 队列中不同风险组的肿瘤微环境(TME)分析:

使用八种免疫算法分析发现,高风险患者免疫细胞浸润显著低于低风险患者(图 8A);Spearman 相关分析揭示免疫细胞丰度与 SCRS 风险评分、模型基因表达之间的关联(图 8B);低风险患者免疫检查点基因表达谱更高,对免疫治疗更敏感(图 8C);基于免疫功能特征的 ssGSEA 分析显示低风险组免疫细胞浸润更高(图 8D);癌症免疫周期六个关键步骤的 ssGSEA 结果表明低风险患者得分更高(图 8E);Spearman 相关分析显示免疫功能水平与 SCRS 风险评分呈负相关(图 8F);利用肌成纤维细胞标记基因进行 ssGSEA 及相关分析,揭示肿瘤微环境中免疫细胞与 CAFs 的紧密关系(图 8G);探索风险评分与癌症代谢途径的关联,揭示 SCRS 潜在代谢功能(图 8H)。该图全面分析了不同风险组的肿瘤微环境特征,包括免疫浸润、免疫功能、免疫检查点基因表达以及与代谢途径的关系,为理解 SCRS 在肿瘤微环境中的作用提供了依据。


图 9:高风险和低风险组之间的体细胞突变、CNVs、免疫治疗和化疗景观:

展示 TARGET 队列中高、低风险患者的体细胞突变景观(图 9A、B);高风险患者肿瘤突变负荷(TMB)高于低风险患者,但差异不显著,且 TMB 与 SCRS 风险评分呈正相关,差异也不显著(图 9C、D);根据中位 TMB 分组后生存分析表明,高风险且低 TMB 的患者 OS 和 EFS 最短,低风险且高 TMB 的患者 EFS 最长(图 9E、F);TIDE 和 submap 方法评估显示,GSE49710 数据集中高风险组免疫逃逸可能性大,IMvigor210 数据集中低风险且对免疫治疗有反应的患者 OS 最长,E-MTAB 8248 数据集中低风险患者更可能对免疫治疗有反应,低风险组对 CTLA4 抑制剂更敏感,对 PD1 抑制剂不敏感(图 9G - J);四个免疫治疗数据集中,对免疫治疗有反应的患者风险评分更低(图 9K);通过 CTRP 和 PRISM 数据库预测出五种对高风险患者可能有效的化疗药物(图 9L)。此图系统分析了高风险和低风险组在体细胞突变、免疫治疗反应和化疗敏感性方面的差异,为 NB 患者的个性化治疗提供了参考。


图 10:三个 NB 队列(GSE49710、E-MTAB 8248、TARGET)中 SCRS 模型基因相关簇的共识聚类分析:

对三个队列进行共识分子聚类,发现 k = 2 时区分度最佳(图 10A);PCA 分析显示两个簇之间存在显著差异(图 10B);生存分析表明簇 2 的 OS 和 EFS 更短(图 10C、D);SCRS 模型基因表达和临床变量在两个簇之间差异显著(图 10E);对两个簇间 DEGs 进行功能富集分析,发现其在 GO 中富集于负性 T 细胞选择,在 KEGG 中富集于 ABC 转运体(图 10F、G);GSEA 表明簇 2 中辅因子的生物合成升高,NK - kappa B 信号通路降低(图 10H、I);GSVA 显示簇 2 在 myc_targets_v2 中升高,在 hedgehog_signaling 中降低(图 10J);八种免疫浸润方法评估显示两个簇中免疫浸润存在差异,并描绘每种细胞类型的 Cox P 值(图 10K)。该图通过共识聚类分析,进一步揭示了 SCRS 模型基因相关簇的特征和差异,为理解 NB 的分子机制提供了新视角。


图 11:模型比较和两个风险组及两个簇的景观:

比较 SCRS 与 39 个已发表的 NB 预后签名的 C 指数,发现 SCRS 在五个 NB 数据集中预测性能更优(图 11A);通过 “sankey plot” 展示风险组、簇和临床因素之间的关系(图 11B);定义 GSE49710 中患者免疫亚型后,发现不同风险组和簇中免疫亚型比例存在显著差异,高风险患者和簇 2 中伤口愈合(C1)亚型更多(图 11C);比较两个风险组临床因素,发现低风险患者预后更长、临床状态更好(图 11D)。此图验证了 SCRS 在预后预测方面的优势,并展示了风险组、簇与临床因素及免疫亚型之间的关系。


图 12:在 GSE137804 scRNA - seq 队列中探索 SCRS 模型基因:

通过 scRNA 评分算法计算 SCRS 富集分数,发现高 SCRS 细胞主要集中在 NE 细胞中(图 12A、B);利用 “scissors” R 包识别出 2120 个高 SCRS 细胞(scissors + 细胞)和 1875 个低 SCRS 细胞(scissors - 细胞),且 scissors + 细胞的 SCRS 值显著高于其他细胞(图 12C - E);Monocle 2 算法进行伪时间轨迹分析,发现部分 NE 细胞分化较差,高 SCRS 的 NE 细胞分化轨迹更早,意味着不成熟 NE 细胞 SCRS 得分更高(图 12F - J);Monocle 3 算法以 NE 细胞为起点,再次验证不成熟 NE 细胞 SCRS 得分更高,可能是恶性细胞(图 12K)。该图在单细胞层面验证了 SCRS 的风险分层能力,揭示了 SCRS 模型基因在不同细胞中的表达情况和细胞分化特征。


图 13:GSE137804 scRNA - seq 队列中 CNV、细胞间通信和转录调节子的景观:

inferCNV 分析表明 NE 细胞中染色体 17q 增益可能是恶性细胞,高 SCRS 细胞 CNV 更多(图 13A、B);cell chat 分析用 “circle plot” 展示细胞间通信频率和强度,以及高、低 SCRS 细胞的综合通信网络,高 SCRS 细胞中 B 细胞、髓细胞、施万细胞和成纤维细胞间存在过表达的配体 - 受体对和通信模式(图 13C - E);不同细胞类型对高、低 SCRS 细胞的总信号、输入和输出信号贡献不同,巨噬细胞等细胞作用显著(图 13F、G;补充图 S3G);探索 CAF 亚型间通信网络,并发现 JAK1 与 NB 中 CAF 亚型通信强度显著相关(补充图 S3H、I);SCENIC 分析显示高 SCRS 细胞中 SMARCA4 和 PBX3 的调节子更活跃,低 SCRS 细胞中 VEZF1 和 PDLIM5 的调节子更活跃(图 13H、I)。此图从多个角度展示了高、低 SCRS 细胞在单细胞层面的差异,为理解肿瘤微环境中的细胞相互作用和调控机制提供了依据


图 14:枢纽基因 JAK1 的泛癌分析和空间转录组学分析:

泛癌分析显示 JAK1 在 33 种癌症类型的肿瘤和正常样本中的表达存在差异(图 14A);JAK1 与 TMB、MSI、免疫细胞及免疫分数存在关联,表明其在肿瘤微环境、免疫细胞浸润和免疫检查点方面具有重要意义(图 14B - F);Cox 回归分析表明,JAK1 在 KIRC 中具有保护预后价值,与 NB 相似,在 LUSC 中则具有风险预后价值(图 14G);对 BRCA、CRC 等多种癌症类型进行空间转录组学分析,发现 JAK1 在多数癌症类型中与恶性细胞丰度呈正相关,在恶性区域表达高于正常区域,但在 LIHC 中呈负相关,在恶性区域表达低于正常区域(图 14H - J;补充图 S4A - F)。本图揭示了 JAK1 在泛癌中的表达异质性、与多种因素的关联及在不同癌症中的预后价值和空间表达特征。


图 15:通过免疫组织化学对枢纽基因 JAK1 的实验验证:

生物信息学分析表明,SCRS 中三个既是诊断模型基因又是预后模型基因的枢纽基因在 4 期 NB 中表达显著较低,且为保护性预后基因(图 15A、B);免疫组织化学(IHC)染色结果显示,JAK1 蛋白水平在其他阶段 NB 组织中显著高于 4 期 NB 组织(图 15C、D);根据 JAK1 的中位 IHC 评分将 40 例 NB 患者分为高、低表达组,生存分析显示高 JAK1 表达组患者的总生存期(OS)更好,但差异无统计学意义(图 15E)。此图通过实验验证了 JAK1 在不同阶段 NB 组织中的表达差异及对预后的影响,一定程度上支持了生物信息学分析的结果。


4 研究总结

本研究围绕神经母细胞瘤(NB)中衰老相关癌症相关成纤维细胞(senes CAF)展开,运用泛癌单细胞和空间转录组分析,结合多组学数据与机器学习算法,深入探究其分子景观和临床意义。研究成功构建了 senes CAF 相关特征(SCRS)模型,经多队列验证,该模型在诊断 INSS 4 期 NB 和预测患者预后方面表现卓越,优于传统临床变量和已发表的 NB 预后签名。通过对不同风险组的分析,发现低风险组患者生存结局更好,免疫浸润丰富,对免疫治疗更敏感。单细胞分析揭示了 SCRS 模型基因在细胞层面的特征,如高 SCRS 细胞多为不成熟的恶性 NE 细胞。此外,研究还对枢纽基因 JAK1 进行了泛癌分析,发现其在不同癌症中的表达模式、预后价值存在差异。尽管研究存在回顾性研究、缺乏部分临床细节等局限性,但 SCRS 模型仍为 NB 的精准诊断和预后评估提供了有力工具,为 NB 的个性化治疗开辟了新方向,也为深入研究 senes CAF 在肿瘤中的作用提供了重要依据 。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容