The single-cell transcriptional landscape of lung carcinoid tumors
肺类癌的单细胞转录景观
发表期刊:Int J Cancer
发表日期:2022 Jun 15
影响因子:7.316
DOI: 10.1002/ijc.33995
一、研究背景
肺癌是一种异质性疾病,包括不同的组织病理学亚型。除了腺癌和鳞状细胞癌外,2021年WHO的分类中还包含了肺神经内分泌肿瘤(NENs)的类别。该类别包括高级神经内分泌癌(NECs)、小细胞肺癌(SCLC)和大细胞神经内分泌癌(LCNEC)以及肺部低级和中级神经内分泌肿瘤(NETs),也分别称为典型和非典型类癌。
传统的肺癌亚型,即腺癌和鳞状细胞癌,以及NECs都与吸烟有关,并以高肿瘤突变负担为特征。相比之下,肺类癌影响年轻患者和非吸烟者,其突变负荷低得多,致癌突变谱也不同。此外,预测现代靶向和免疫疗法的疗效受到肿瘤内异质性的限制,肿瘤内可能藏有原发耐药的肿瘤细胞亚克隆,以及复杂的肿瘤微环境,调节着针对肿瘤的免疫反应。单细胞基因表达分析可以克服这一限制,并且已经为肺腺癌的细胞异质性提供了宝贵的见解。
二、材料与方法
1、数据来源
1) 在术中病理学家会诊时获得约0.1至0.5cm的肿瘤组织和正常肺实质的新鲜组织样本
2) 从GitHub下载大块样本基因表达数据和生存数据
2、分析流程
1) 组织解离和单细胞分离、单细胞RNA测序、H&E和免疫染色
2) 单细胞基因表达分析:预处理、细胞类型注释
3) 差异性基因表达分析:在对上皮细胞进行差异化基因表达分析之前,对肿瘤样本中的肿瘤细胞进行亚组化,并对基因表达进行重构;免疫和基质亚群被分成淋巴、骨髓、内皮和成纤维/平滑肌亚群,并重新调整基因表达;使用FindAllMarkers函数和Wilcoxon秩和检验以计算每个细胞簇的标记基因与该亚群的所有其他簇的关系
4) 功能分析:细胞周期阶段是用CellCycleScoring函数分配的;使用AddModuleScore函数对功能相关的基因签名的表达进行评分;将单细胞转录组分配给分子集群,选择每个分子集群与另外两个集群中上调幅度最大的50个基因,并分别合并为一个基因组(A1 vs A2和A1 vs B为基因组A1;A2 vs A1和A2 vs B为基因组A2;B vs A1和B vs A2为基因组B);使用AddModuleScore函数对得到的三个基因组(A1、A2、B)的表达进行评分
5) 大量基因表达和生存分析:在过滤掉位于性染色体和线粒体上的基因后,使用DESeq2工具包的VarianceStabilizingTransformation功能将大量基因表达数据归一化;单细胞基因表达数据被分成骨髓、淋巴、内皮和成纤维/平滑肌子集,并进行了重新划分;使用R工具包GSVA的gsva函数,对大量基因表达数据进行单样本基因集富集分析(ssGSEA);生存曲线、对数统计和Cox回归是用R软件包survive和survminer计算的
三、实验结果
01 - 单细胞RNA测序揭示了肺类癌的细胞多样性
为了在单细胞水平上探索肺类癌及其肿瘤微环境的细胞组成,作者从3名接受初治手术的肺类癌患者(患者1-3,图1A)收集了肿瘤组织和正常肺实质的新鲜组织样本。所有三名患者的肿瘤细胞都生长在固体巢中,并有神经内分泌标记蛋白突触素和色氨酸A的表达(图1B)。肿瘤包括一个典型的类癌(患者1),一个具有高增殖活性的非典型类癌(患者2)和一个具有局灶性肿瘤坏死的非典型类癌(患者3)。两个非典型类癌病例(患者2和3)在诊断时都有区域淋巴结转移。在随后的分析中包括了先前发表的队列(患者4-10)的7个正常肺组织样本的单细胞基因表达数据,总共分析了73 105个单细胞转录组,其中64 697个高质量的转录组在质量控制和过滤后仍然存在(图1C)。
通过UMAP对单细胞转录组进行可视化,发现正常和肿瘤组织样本之间有明显的变化(图1D)。不同患者的单细胞转录组在许多集群中重叠,排除了不同样本的系统性批次效应(图1E)。在上皮细胞、免疫细胞和基质细胞区块中,由典型标记基因的基因表达定义,观察到肿瘤特有的变化(图1F)。在肿瘤组织样本中,大多发现上皮细胞和基质细胞的转录组,而免疫单细胞转录组在正常组织样本中更为丰富(图1G)。
02 - 肺类癌的瘤内异质性反映了临床病理特征和分子亚型
为了进一步分析上皮细胞区块,上皮细胞转录组被亚组化并重新聚类。在正常或肿瘤组织样本中过度代表的上皮细胞簇被分别指定为正常或肿瘤细胞簇(图S2A,B)。观察到正常细胞簇由不同的病人共享,而肿瘤细胞簇则具有高度的患者特异性(图2A)。在正常细胞簇中,使用规范标记基因和预定义的基因特征,确定了肺泡上皮1型和2型、纤毛细胞、棒状细胞(club cell)和基底细胞(图2A,B)。正如高度患者特异性的肿瘤细胞集群所表明的那样,在不同患者的肿瘤细胞中发现了许多差异表达的基因(图2C),如CD44、TFF3和EGFR,这些基因与不同的蛋白质表达相关,如免疫组织化学所示(图2D)。患者1的典型类癌中的高表达基因包括许多与良好预后相关的基因,如MT1G、MT1M、MT1X、PCK1、LPL、CD44。虽然发现不同肿瘤病例之间存在明显的转录差异,但单个肿瘤内的转录谱是相当均匀的,主要取决于每个细胞的读数和基因数量(图S2C-F)。
为了进一步探索病人之间的异质性,作者从单细胞基因表达谱推断出不同的功能特征,即细胞周期阶段、线粒体读数比例和信号通路活性。患者2的肿瘤细胞在S期的比例最高,同时在免疫组化中显示最高的Ki67增殖指数(图2E)。在患者3的肿瘤细胞中观察到最高比例的线粒体读数,其特点是局灶性肿瘤坏死(图2F)。患者3的肿瘤细胞转录组在表皮生长因子受体通路活性方面有很高的得分,并且在蛋白质水平上有很强的表皮生长因子表达(图2D,G)。雌激素和雄激素受体信号传导的通路活性得分与患者的性别相关(图2G;并见图1A的临床特征)。最近,有研究表明,根据转录和表观遗传特征,肺类癌可以被细分为三个不同的分子簇。在本研究单细胞基因表达谱中,可以将患者2和3的肿瘤归入A1簇,而患者1的肿瘤则同时归入A2簇和B簇(图2H)。值得注意的是,免疫和基质细胞区块只表现出分子簇基因特征的少量表达分数。
03 - 肺类癌的免疫微环境以非炎症性单核细胞衍生的骨髓细胞为特征
为了发现免疫微环境的细胞组成,对免疫单细胞转录组进行了亚组化和重新聚类。作者利用典型的标记基因和预定义的基因签名(图3A,B),确定了免疫细胞区间内各种不同的细胞类型。
确定了不同的淋巴细胞,如常规T细胞、CD8+T细胞、NK细胞、B细胞和浆细胞(图3A和S4A,B)。平均而言,肿瘤组织中淋巴细胞类型的比例与正常组织非常相似,同时也注意到肿瘤和正常组织中存在一些患者间的异质性。反映淋巴细胞的幼稚性、细胞毒性或衰竭的基因特征在正常和肿瘤组织中表现出相似的表达分数(图3C)。在所有的淋巴细胞类型中,衰竭的签名得分都很低。总之,肺癌的淋巴细胞微环境与正常肺实质的淋巴细胞区相类似。
在骨髓细胞区,发现单核细胞、树突状细胞、巨噬细胞和肥大细胞在肿瘤和正常组织中的丰度不同(图3A和S4A,C)。在单核细胞中,经典的单核细胞群2在肿瘤组织中富集(图3D)。传统的树突状细胞包括两个集群,其中CD141+集群1主要在肿瘤组织中发现(图3E)。除此之外,还发现了一个肿瘤富集的细胞群,它同时具有高表达水平的单核细胞标志物,如CD14和LGMN,一个在分化的单核细胞中上调的基因(图3B),结论是这个细胞簇代表了单核细胞衍生的骨髓细胞分化为巨噬细胞的谱系,或分化为树突状细胞(图S4D)。虽然单核细胞和传统树突状细胞的比例在不同患者的肿瘤与正常组织中异质性增加,但在分析的所有三种类癌肿瘤中,单核细胞衍生的骨髓细胞持续增加。单核细胞源性骨髓细胞的进一步特征是SELENOP、C1QA、C1QB、C1QC和趋化因子CCL3和CCL4的高表达(图3F)。与正常组织相比,肿瘤组织中的单核细胞衍生的骨髓细胞显示出与炎症和免疫反应相关的各种基因签名的表达分数相同或略低(图3G)。结果表明,肺类癌的免疫微环境以非炎症性单核细胞衍生的骨髓细胞为主。
通过单细胞RNA测序分析的三个肺类癌,骨髓细胞区的组成在一定程度上是异质的。为了在更大的队列中研究患者间的异质性,作者在已发表的肺类癌的大量基因表达数据集中量化了特征性免疫细胞类型的标记基因的表达。在此,发现肿瘤富集的单核细胞源性髓系细胞群2和3的标记基因与非典型类癌相关,与总生存期无关(图S4E),表明肺类癌亚型之间的微环境差异。
04 - 血管细胞和CAF样肌成纤维细胞构成肺类癌的基质微环境
为了深入了解基质微环境的组成,对基质单细胞转录组进行了亚组化和重新聚类,作者使用典型的标记基因和预定义的基因签名(图4A,B),确定了内皮细胞、成纤维细胞和平滑肌细胞的不同集群。
在内皮细胞中,可以根据预定的标记基因签名区分支气管、毛细血管、动脉和静脉内皮细胞(图4A)。虽然不同亚型的内皮细胞存在于正常肺实质中,但肿瘤组织中支气管型内皮细胞明显富集(图4A和S5A)。这里,大部分内皮细胞转录组来自患者1的肿瘤,与免疫染色显示的密集血管相关(图S5B)。肿瘤组织中的内皮细胞显示出INSR的高mRNA表达,INSR是肿瘤相关内皮细胞的标记基因,和INSR蛋白的高表达(图S5C,D)。此外,发现与血管生成有关的基因的高表达,如VWA1、COL15A1、IGFBP7和GSN10(图S5D)。
在肿瘤组织的成纤维细胞和平滑肌细胞区,发现肌成纤维细胞、血管平滑肌细胞和周细胞,而成纤维细胞与正常组织相比明显减少(图4A)。肌成纤维细胞在肿瘤组织中强烈富集,并显示出细胞外基质成分的高表达,如COL1A1、COL3A1和COL6A3,以及基质降解酶,如SULF1(图4C),表明这些细胞可能参与细胞外基质重塑。此外,肌成纤维细胞的特点是TGFβ信号的高活性(图4D)。在肌成纤维细胞内,与肌成纤维细胞群2和其他成纤维细胞和平滑肌细胞群相比,群1显示了FAP和MMP11的特异性过表达,以及各种胶原蛋白的高表达(图4E)。在一个独立的肺类癌队列中,肌成纤维细胞群1的标记基因特征与非典型类癌明显相关,并与较差的总生存率相关(图S5E)。这些数据共同表明,肺类癌肿瘤组织中的肌成纤维细胞表现出癌症相关成纤维细胞的生物学特征。
类癌的基质微环境以血管平滑肌细胞和周细胞为主。被诊断为典型类癌的病例1中的周细胞比例最高,而被诊断为非典型类癌的患者2和3中的周细胞较少(图4A)。相应地,在一个独立的肺类癌队列中,周细胞标记基因特征与典型类癌相关,并与更好的总生存率相关(图S5F)。肿瘤组织中的周细胞显示了RGS5(一种参与周细胞发育的基因)和ACTA2(一种平滑肌标志基因)的高表达(图4F)。平滑肌细胞表达低水平的周细胞标记基因,如COX4I2和PDGRB(图4C)。作者发现这些基因以一种分级的方式表达,表明在肿瘤组织中,周细胞和血管平滑肌细胞形成一个连续体,而不是独立的细胞类型(图4G)。这些结果表明,肺癌的基质微环境是由让人联想到癌症相关成纤维细胞的肌成纤维细胞,以及血管平滑肌细胞和周细胞组成的。肌成纤维细胞和周细胞可能分别与较差和较好的总生存率有关。
05 - 肿瘤微环境细胞之间的相互作用可能激活NOTCH、VEGF、TGFβ和JAK/STAT信号
作者观察到,不同的细胞类型在肺癌微环境中被特异性地富集(图5A)。为了划定微环境和肿瘤细胞之间的功能关系,量化了潜在的旁分泌受体-配体相互作用。大多数潜在的相互作用是在基质微环境的细胞类型之间发现的,涉及肿瘤相关的内皮细胞、肌成纤维细胞、血管平滑肌细胞和周细胞,而肿瘤细胞较少参与潜在的旁分泌相互作用(图5B)。潜在相互作用的数量与每个细胞类型的细胞数或mRNA计数的平均数无关。专注于最相关的信号通路,作者发现许多可能激活NOTCH、TGFβ、VEGF和JAK/STAT信号的相互作用(图5C)。肿瘤相关的内皮细胞可能接受VEGF、TGFβ和NOTCH通路的激活信号,而肌成纤维细胞主要接受TGFβ通路的激活信号,都是通过各种旁分泌和自分泌的相互作用。树突状细胞、单核细胞和单核细胞衍生的骨髓细胞主要通过与其他免疫细胞的自分泌和旁分泌相互作用接受潜在的JAK/STAT途径激活信号。这些结果表明,各种基质细胞和免疫细胞之间的自分泌和旁分泌相互作用可能塑造了肺类癌肿瘤的微环境。
四、结论
在这项研究中,通过对三个类癌肿瘤和正常肺组织样本进行单细胞RNA测序,全面分析了肺类癌的细胞组成。表明类癌细胞的单细胞基因表达谱反映了临床病理特征,并允许分配到最近定义的分子集群中。此外,发现肿瘤微环境的特点是具有非炎症特征的单核细胞衍生的骨髓细胞、肿瘤相关的内皮细胞、一系列血管平滑肌细胞和周细胞以及具有癌症相关成纤维细胞特征的肌成纤维细胞。本研究分析为进一步研究肺类癌肿瘤微环境、潜在的预后和预测性生物标志物以及新的治疗目标提供了基础。