介绍
这一篇是今年发在Oncogene上的文章,作者提供了非常详细的分析代码。
Code used for analyses is available as a Code Ocean capsule from https://doi.org/10.24433/CO.0121060.v1. Complementary code is available from https://github.com/bischofp/single_cell_lung_adenocarcinoma.
所以我们先来看一下这篇文献讲了什么,有时间的话做一下复现。
文献解读
1. Single-cell RNA sequencing uncovers the cellular diversity of lung adenocarcinomas
第一张图是常规流程图和分类图
Fig 1A:该研究取了10个肺腺癌样本和10和对应的HC的肺样本,(红色表示取了肿瘤组织,蓝色表示取了正常组织)对20个样本进行了单细胞测序得到了133736个细胞,过滤之后得到114489个细胞
Fig 1B C:114489个细胞的UMAP图,B图是按分组着色,C图是按样本来源着色
Fig 1D:细胞注释得到3大类细胞(上皮,基质和免疫细胞),D图整合了病人信息,肿瘤组织类型和每个人的样本中三种细胞的比例。可以看出在这几类细胞中,免疫细胞占比最多,但是上皮细胞在病人间显示出最大的异质性。
2. Intertumoral heterogeneity of tumor epithelial cells reflects differentiation gradients
第一部分注释出了上皮,基质和免疫三大类细胞,第二部分就把上皮细胞提出来进行了进一步分析
Fig 2A:左:所有上皮细胞的UMAP图,左:按分组着色,中:按细胞类型着色(5种上皮细胞➕癌细胞),右:按样本来源着色;右图上面不同细胞类型的比例。可以看到不同病人的肿瘤细胞群异质性较大(出现每个病人是单独一团细胞的现象)
Fig 2B:五种上皮细胞的marker基因气泡图展示
Fig 2C:不同病人的marker基因热图,一些基因(箭头指出)显示出病人肿瘤细胞的特异性
Fig 2D:免疫组化验证Fig 2C的结果
Fig 2E:通路活性评分提示不同病人间EGFR, TGFβ, JAK/STAT, Hypoxia 和 PI3K这些通路活性存在比较大异质性。这一张图是用PROGENy做的
Supplemental Figure 3 E:前面都是在说不同患者间上皮细胞的异质性,为了强调肿瘤间的相似性,4,6,8个(而不是前面的20个)PC的基因被用于UMAP降维。可以看到,这时候细胞主要根据组织学类型而不是病人聚在一起。
Fig 2F, Supplemental Figure 3 E F:而且the first principal component (PC1) displayed a gradient along histological grades.
PC_1被认为代表了最主要的生物差异因素。这里的bin是根据PC_1的数值从小到大将PC_1划分成了10个bin,可以理解为根据细胞在PC_1这个轴上的投影(参考Supplemental Figure 3 E)从左到右把细胞均分为了10份
#导出行为细胞,列为metadata和前10个PC的矩阵
epi_tumor_data <- FetchData(epi_pca, c(colnames(epi_pca@meta.data), paste0("PC_", 1:10)))
#根据PC_1的值从小到大排列将PC_1分成10个bin
epi_tumor_data$bin <- cut_number(epi_tumor_data$PC_1, n = 10, labels = c(1:10))
#绘制Supplemental Figure 3 F,根据每个bin的样本来源画图
ggplot(epi_tumor_data, mapping = aes(x = bin, fill = factor(patient_id, levels = c("p032", "p018", "p019", "p024", "p031", "p030", "p033", "p023", "p027", "p034")))) +
geom_bar() +
theme(legend.title = element_blank()) +
scale_fill_manual(values = use_colors)
ggsave2("SuppFig3F.pdf", path = "../results", width = 30, height = 30, units = "cm")
# histological subtypes along PC1
ggplot(epi_tumor_data, mapping = aes(x = bin, fill = factor(histo_subtype, levels = c("lepidic", "acinar", "mucinuous (papillary)", "(micro)papillary", "solid", "sarcomatoid")))) +
geom_bar() +
theme(legend.title = element_blank()) +
scale_fill_manual(values = use_colors)
ggsave2("Fig2F.pdf", path = "../results", width = 30, height = 30, units = "cm")
##其他图同理,只要有每个bin和metadata对应的矩阵,都可以画
Supplemental Figure 3 G:有趣的是,SCGB3A1和SCGB3A2这两个此前报道和肺脏发育相关的基因和PC1正相关(在Fig 2C和Supplemental Figure 3 G均有箭头指出)。
画这个热图用的基因是做RunPCA()的时候返回的基因,参考:单细胞RunPCA()结果解读
Figure 2 G:此外,正常肺组织的gene signature scores along PC1显示出和肺泡一型,二型和杯状细胞的表达谱很强的正相关。
这些结果提示PC1 reflects the degree of differentiation of tumor epithelial cells. 因此,与PC1positively和negatively相关的top 30 genes分别被定义为“alveolar/club-like”和“undifferentiated” tumor cell signature。(Fig. 2F–H, Supplementary Fig. 3G, H)
Supplementary Fig 3I:尽管不同分化程度的肿瘤细胞没有显示出明显的分裂活性差异,但是“undifferentiated”的细胞显示出很强的 JAK/STAT, Hypoxia, EGFR 和TGFà通路活性,而‘’alveolar/club cell-like”肿瘤上皮细胞具有较高的PI3K信号通路评分(Fig. 2H)。
小结:不同肺腺癌患者的肿瘤上皮细胞显示从 “undifferentiated” 到 ‘’alveolar/club cell-like” 的转录模式,而且这种转录模式和与不同的致癌通路活性相关。
3. Two subtypes of myofibroblasts constitute the tumor stromal microenvironment
上一部分对上皮细胞进行了分析,这一部分主要分析基质细胞。
Figure 3 A:基质细胞的亚群细分和比例变化,分为了EC7群,淋巴型内皮,FB2群,肌成纤维2群,平滑肌2群,间皮细胞。发现肿瘤组织中存在一个fibroblast to myofibroblast的shift。而且肌成纤维2群几乎只在肿瘤样本中存在。
Figure 3 B:marker gene的DotPlot。肌成纤维细胞同时表达成纤维细胞的marker PDGFRA,LUM和平滑肌的marker MYLK和ACTA2。
Figure 3 C:top10. marker gene的Heatmap。可以看到肌成纤维细胞2群高表达胶原marker,比如COL3A1, COL5A1, COL5A2, COL6A3和基质蛋白VCAN以及基质讲解酶SULF1和MMP11,提示这一类细胞参与细胞外基质重构。
Figure 3 D:和前面Fig 2E一样做的PROGENy,肌成纤维细胞2群显示出高度活化的TGFà和JAK/STAT以及缺氧诱导信号通路,这些都是已经有报道的肿瘤相关肌成纤维细胞的特征。
Figure 3 E:所有病人样本中肌成纤维1群和2群的比例,呈负相关。
Figure 3 F:免疫组化检测肌成纤维2群的marker CTHRC1
小结: 肌成纤维细胞1群和2群分别代表了肌成纤维细胞“normal-like”和“cancer-associated”表型。
4. The tumor immune microenvironment exhibits pro- and non- inflammatory traits
Figure 4 A:肿瘤微环境中的免疫细胞分群和比例变化。一共分了22群。在这些细胞中,粒系:monocyte-derived macrophages和树突状细胞比例增加。组织原位巨噬细胞和单核细胞比例下降。淋系:CD8+ T, B和浆细胞比例上升,NK和conventional T比例下降。Treg几乎只存在于肿瘤组织。
Figure 4 B:每个群的淋系/髓系marker基因气泡图
Figure 4 C:巨噬细胞群的一些模块评分;monocyte-derived macrophage1群高表达SELENOP (Supplementary Fig. 8B),与M2表型相关。而且这一群细胞immune response-related signatures评分较低(白色箭头)。2群则高表达一些促炎因子,如CXCL9,CXCL10,IL1B等 (Supplementary Fig. 8B),而且gene signatures和immune response以及M1 polarization相关。这提示monocyte-derived macrophage1群和2群分别代表着抗炎和促炎状态。
这里左边四个pathway都是GSEA的hallmark基因集中的。
M1up和M1down的分数来自于GSE5099_CLASSICAL_M1_VS_ALTERNATIVE_M2_MACROPHAGE_UP/GSE5099_CLASSICAL_M1_VS_ALTERNATIVE_M2_MACROPHAGE_DOWN。
Figure 4 D:monocyte-derived macrophage1群和2群在病人间的比例呈负相关。但促炎的2群与其他免疫细胞例如plasmacytoid DCs的比例呈正相关。
Figure 4 E:免疫组化检测了monocyte-derived macrophages 2群 (CXCL9)和plasmacytoid DCs (CD123),与前面结论一致。
Figure 4 F:淋系细胞中,Figure 4 A显示CD8+T细胞比例上升,这类细胞分为4个群,并分别计算了毒性和耗竭评分。tumor-enriched CD8+ T细胞1群和2群以及增殖T细胞具有比较高的耗竭评分。
Figure 4 G: tumor-enriched CD8+ T细胞1群和2群比例和促炎性monocyte-derived macrophage2群以及plasmacytoid DCs的比例正相关。与Treg的比例有正相关的趋势。
小结:we identify patient-overarching changes of the immune cell composition from normal lung tissue to adenocarcinoma, and distinct tumor immune microenvironment patterns contributing to interpatient heterogeneity.
5. The tumor microenvironment of lung adenocarcinoma features two major patterns
Figure 5 A: PCA图显示患者按照cellular composition of the tumor microenvironment聚在一起
Figure 5 B H: 将病人划分为2个pattern
· N3MC pattern:P018, P019, P024, P031, P032和P033(marked by normal-like myofibroblasts, noninflammatory monocyte-derived macrophages, NK cells, myeloid dendritic cells and conventional T cells)
· CP2E pattern:P023, P027, P030和P034 (characterized by cancer-associated myofibroblasts, proinflammatory monocyte-derived macrophages, plasmacytoid dendritic cells and exhausted CD8+ T cells)
Figure 5 C D:对这两个pattern的细胞做了互作分析,参考CellphoneDB,发现CP2E环境的肿瘤细胞 receive potential paracrine signals from cancer-associated myofibroblast cluster 2 activating Ephrin, FGF, WNT, TGFβ, and BMP signaling, and from proinflammatory monocyte-derived macrophages cluster 2 potentially activating JAK/STAT signaling
为了看两种pattern和预后的相关性,作者从TCGA上下载了533个肺腺癌患者的数据
Figure 5 G:TCGA lung adenocarcinoma cohort,发现 N³MC 相关的gene signature预后更好
结论:免疫活化的CP²E微环境由癌症相关的肌纤维细胞,促炎单核细胞衍生的巨噬细胞,血浆骨质树突树突细胞和排出的CD8 + T细胞组成,并且预后不利;惰性N³MC 微环境主要包括正常的肌纤维细胞,非炎症单核细胞衍生的巨噬细胞,NK细胞,骨髓树突细胞和常规T细胞,并与良好的预后有关。