Cell丨实体瘤细胞状态和生态系统图谱
原创 珍奇 图灵基因 今天
收录于话题#前沿生物大数据分析
撰文:珍奇
IF:41.582
推荐度:⭐⭐⭐⭐⭐
亮点:
EcoTyper是一种机器学习框架,它可对细胞状态和多细胞生态系统进行大规模分析,且适用于批量、单细胞和空间解决的基因表达数据,是16 种癌变的 69 种细胞状态和 10种生态系统的参考图谱。本研究表明,癌细胞生态系统具有独特的生物学、临床结果和空间拓扑学。
确定细胞如何随其局部信号环境而变化并组织成不同的细胞群落对于理解发育、衰老和癌症等多种过程至关重要。2021年10月14日,《Cell》杂志上发表了一篇名为“Atlas of clinically distinct cell states and ecosystems across human solid tumors”的文章,本文介绍了一种机器学习框架 EcoTyper,它可从大量、单细胞和空间解析的基因表达数据中大规模识别和验证细胞状态和多细胞群落。这项研究阐明了人类癌症中细胞组织的基本单位,并为大规模分析任何组织中的细胞生态系统提供了框架。
EcoTyper是一种可从原体组织标本中高通量识别细胞状态,并在多细胞群落中广泛适用的框架。它包括了三个关键步骤:从散装组织转录体中对细胞型特定基因的表征进行数字化净化;识别和量化转录定义的细胞状态;以及将细胞状态共同分配到多细胞群落中。EcoTyper 的应用包括从新鲜、冷冻或固定生物样本中进行表型分析以及生物标志物的发现;通过整合已知的配体-受体对研究细胞间信号网络;空间转录组学数据中多细胞群落的探索。研究者编制了一个探索队列,由 16 种类型的人类癌症组成,涵盖5,946 个肿瘤和 529 个相邻的正常转录组,这些由癌症基因组图谱 (TCGA)分析得到。
在初始质量控制过滤之后,EcoTyper产生了 71 个离散的细胞状态,每种细胞类型有 3到 9 个状态。EcoTyper 实现了一个参考指导注释的监督框架,其中在一个数据集中学习的细胞状态可以在另一个数据集中被识别和统计评估。作为另一种验证方法,研究者还测试了在特定生物组(例如正常组织)中丰富的状态是否在单细胞水平上被概括。事实上,在将单细胞转录组映射到 EcoTyper 状态后,他们观察到富含相邻正常组织、腺癌或鳞状细胞癌的状态的显着一致性。随后,多种分析都证明了 EcoTyper 的性能,并强调了其在当前超出其他技术实际限制的规模上定义细胞类型特异性转录程序的价值。
先前研究已经表明,来自外部来源的细胞类型特异性参考资料,包括批量排序的群体和scRNA-seq 数据,可以预测癌症临床结果。然而,环境依赖性细胞状态在人类癌症中的预后影响在很大程度上是未知的。因此,他们利用 EcoTyper 的独特输出来绘制15,008 个肿瘤中 69 个细胞状态的预后图。在发现队列中调查的 16 种上皮癌类型中,大多数细胞状态与总生存期显着相关。全球生存协会几乎将所有评估的细胞类型分为有利和不利状态,突出了它们的生物学和临床异质性。正如先前研究中的发现,注释为M1和 M2的巨噬细胞亚群分别与更长和更短的存活时间相关。令人惊讶的是,在 M2样状态中,AEBP1+ 泡沫巨噬细胞是不利生存的前五个决定因素之一,这表明泡沫细胞可能作为癌症的免疫治疗靶点具有广泛的相关性。
肿瘤是由空间和时间相关的细胞状态组成的复杂生态系统。为了确定 EcoTyper 是否可以重建多细胞生态系统,他们设计了一种数据驱动的方法,用于基于共现和相互回避模式对细胞状态进行聚类。通过将这种方法应用于发现队列中的肿瘤样本,他们确定了十个具有惊人凝聚力的细胞群落,他们将其称为“癌生态型”(CEs)。重要的是,通过在细胞状态丰度图中聚合,CE 组成可以持续评估。虽然几乎每个肿瘤样本都有一个占主导地位的CE,但大多数肿瘤由多个CE组成,突出了肿瘤组织成分的模块化。这些数据验证了他们的方法,在大量和单细胞表达数据中识别了不同的多细胞群落,并指定 CE 作为人类癌症细胞组织的基本单位。
在确定了癌症中的 10 个主要多细胞生态系统之后,他们接下来探索了它们的细胞、基因组和临床特征。在整个发现队列中,8 个 CE 在单变量模型中具有显着的预后意义,5个在对阶段、年龄和性别进行多变量调整后仍然显着。 CE1- 和 CE2- 高位肿瘤缺乏淋巴细胞,与更高的死亡风险密切相关,并且分别以 POSTN+ 成纤维细胞和基底样上皮细胞水平升高为主要特征。
由于每个癌生态型都整合了来自多种细胞状态,因此他们推断 CE 分析可能具有改善临床结果预测的潜力。为了测试这种可能性,他们首先将 CE 与两种分子亚型方案进行比较,以预测发现队列中的总生存期:大量 NMF 聚类和由 TCGA 定义的六种泛癌免疫亚型的集合。前者被选为评估EcoTyper 反卷积的优势,而后者被选为TME分类的比较者。虽然批量NMF亚型在很大程度上仅限于上皮细胞的异质性,但泛免疫亚型表现出相对温和的预后关联。
接下来,他们试图确定癌生态型是否显示出不同的空间组织模式。为此,他们主要关注CE9 和 CE10,这两个具有典型 T 细胞状态和良好总体存活率但在其他方面不同的基因组和细胞特征的促炎群体。CE9-T 细胞状态表达激活和免疫调节基因,CE10-T 细胞表达原初细胞和中央记忆细胞的标志物。
为了检查 CE 特异性表型是否在空间上不同,他们首先对 GZMB 和 GZMK进行了多色免疫荧光 (IF) 染色,它们分别标记了 CE9 和 CE10-T 细胞。为了将分析扩展到 T 细胞之外,他们进一步将 IF 成像应用于 APOE+/CD68+ 和 CCR2+/CD68+ 细胞,它们分别标记了巨噬细胞/单核细胞谱系中富含 CE9 和 CE10 的状态。正如对 T 细胞所观察到的那样,APOE+/CD68+ 细胞定位于肿瘤核心,而 CCR2+/CD68+ 细胞定位于外周。此外,生态型之间的空间差异在与肿瘤细胞的距离方面非常显着,这一发现可扩展到黑色素瘤标本。这些数据一起进一步验证了他们的方法,将 CE 动力学与早期肺癌发展联系起来,并提供了一个平台来系统地询问肿瘤细胞生态系统的诊断和治疗潜力。
教授介绍:
AaronM. Newman,斯坦福大学生物医学数据科学系助理教授,其团队主要通过结合计算和实验技术来研究复杂组织的细胞组织,重点是确定肿瘤细胞亚群的表型多样性和临床意义。他们还致力于开发创新的数据科学工具,这些工具阐明了作为肿瘤发生、进展和治疗反应基础的细胞层次结构和基质元素。其中,他们开发了新算法来解决临床生物样本基因组谱中的细胞状态和多细胞群落、肿瘤发育层次和单细胞空间关系。该成果已经通过合作在进行进一步的实验探索,并有望转化到临床治疗。作为生物医学数据科学系和干细胞生物学和再生医学研究所的成员,以及生物医学信息学、癌症生物学和免疫学研究生课程的附属机构,他们还参与发育生物学、再生医学和系统免疫学研究。
参考文献:
Luca BA, Steen CB,Matusiak M, et al. Atlas of clinically distinct cell states and ecosystemsacross human solid tumors.Cell. 2021;184(21):5482-5496.e28.doi:10.1016/j.cell.2021.09.014