Multi-omics Analysis of Microenvironment Characteristics and Immune Escape Mechanisms of Hepatocellular Carcinoma
杂志 frontier in oncology
研究方法:
研究队列(只纳入stage I和II):
训练队列:TCGA(257),GEO(170),ICGC(142),共三个训练队列569个HCC患者的基因表达。
验证队列:GSE14520(170)和ICGC(142)队列。
免疫基因分析:TIMER数据库——13个免疫metagene(集合基因)。中位表达=score。MCP包计算10种免疫细胞的score
数据处理:TCGA同时下载FPKM和SNP,TIMER下载score
HCC免疫亚型分型:ConsensusClusterPlus包做累积分布函数CDF决定亚型个数。SigClust分析用于比较亚型间差异。K-S法挑选亚型上调基因。Top100上调基因做PCA,并找出亚型标志基因
基因共表达网络:WGCNA包(TOM)。KEGG用的ClustProfiler包。最显著关联基因用Cytoscape作图。
5个HCC亚型验证:Support Vector Machine(SVM)
结果:
1. HCC分5个免疫亚群
1a. ConsensusClusterPlus包用778个免疫相关基因表达谱对HCC进行分群(根据CDF),SigClust分析计算分5群后各个亚群间的显著性。
1b. 因此认为分5群成立以及画聚类热图。
2. 5个亚群的免疫微环境基因表达特征
2a. 5个亚型中,分别找出每个亚型中找出上调的免疫基因。再看两两亚型间的上调基因的overlap(C3和C4,C1和C4有54个overlap)——Venn图
2b. 每个亚型top100上调基因做PCA图(也分为5类)
2c. 每个亚型top100上调基因做热图
3. 5种亚型临床特征
临床信息:年龄、性别、TNM分期、组织G分期、T分期、全球分型、HCV感染、HBV感染——此处作图,而不是列表格
4. HCC的免疫原性
4a. 分析免疫逃逸机制方法:13组免疫metagene表达及score(图AB)、肿瘤免疫成分matrix基因表达及score(图CD)、immunity、tumor purity、10种免疫细胞相关MCP counter及score(EF)、6种免疫浸润细胞及score(GH)
4b. 8个immune checkpoint表达:VTCN1、PDCD1、CTLA4、CD86、CD80、CD276、CD274、PDCD1LG2
5. 5种亚型的预后
6. 五种亚型的突变特征
TP53、CTNNB1、AXIN1在5种亚型的突变频率。以及5种亚型中基因突变总数比较。
7. 基因共表达网络
7a. 492个免疫DEG做WGCNA(ABC)
7b. 分出7个module(其中灰色module不能与替他module聚合)
7c. 6个module的相关性分析(D),5个共表达module???
7d. 5个module的KEGG
8. 5个亚型的外部验证
8a. 73个共表达基因(与module相关性>0.8)放进SVM来分类训练集
8b. 用SVM170例验证集分5型,然后看13组metagene在5型中的表达(A)和score(B)
8c. 基质score、免疫score、ESTIMATE肿瘤纯度score
8d. 10组免疫细胞score