今天和大家分享的是2020年1月发表在Journal of Cancer(IF:3.182)上的一篇文章,“Tumour-Infiltrating Immune Cell-Based Subtyping and Signature Gene Analysis in Breast Cancer Based on Gene Expression Profiles”,文章中作者使用GEO数据库和CIBERSORT网页工具,整合乳腺癌样本中肿瘤浸润免疫细胞的丰度数据,通过LASSO-Cox回归分析和聚类分析建立了预后模型和免疫分型,并筛选出预后相关的免疫特征基因。
Tumour-Infiltrating Immune Cell-Based Subtyping and Signature Gene Analysis in Breast Cancer Based on Gene Expression Profiles
基于基因表达谱对乳腺癌中肿瘤浸润免疫细胞进行亚型分类和特征基因分析
一、研究背景
乳腺癌发病率在女性癌症患者中位居首位,是一个具有不同临床和预后特征的复杂疾病集合,近年以ER、PR、HER2将乳腺癌分为管腔A,管腔B,HER2过表达和三阴性四种分子亚型,但在每个亚型中仍可以发现显著的异质性,特别是管腔B和三阴性乳腺癌。肿瘤免疫研究显示肿瘤相关的免疫激活可以改善临床结果,肿瘤浸润免疫淋巴细胞(TILs)在HER2阳性和三阴性乳腺癌(TNBC)中可以作为关键的预后指标。探索新的免疫亚型对乳腺癌预后具有重要意义。
二、分析流程
三、结果解读
1. 数据准备和临床信息概述
经过数据合并和过滤,纳入来自12个GEO数据集、具有预后信息的801例乳腺癌样本和964例正常组织样本,平均随访5.54年,以及TCGA-BRCA的956个样本、METABRIC的372个样本。对样本通过网页工具CIBERSORT估计每个免疫细胞亚群的绝对免疫分数和丰度,gene signatures使用的是LM22和LM7,剔除其中CIBERSORT P value >= 0.05的样本进行下一步分析。
表1:GEO、BRCA和METABRIC数据的乳腺癌患者临床病理特征,展示了年龄、TNM分级、分子亚型等信息。
图1:使用CIBERSORT计算的免疫细胞丰度,展示了两种signatures文件计算得到的丰度(A和B)和三个数据集中丰度结果的P值(C和D)。
表1:乳腺癌患者临床病理特征
图1:CIBERSORT计算的免疫细胞丰度
2. 肿瘤浸润免疫细胞的丰度和分布分析
在不同临床病理特征分组中比较肿瘤浸润免疫细胞亚群的估计丰度和分布。显示免疫细胞在HER2过表达和三阴性亚型中更丰富,且总体丰度与不良病理特征有关,HR阴性(P < 0.001)、淋巴结阳性 (P= 0.01) 、较高的组织学分级(P < 0.001)。
进一步研究显示淋巴结阳性的肿瘤中CD8 + T细胞和浆细胞百分比较高,而淋巴结阴性肿瘤中活化的肥大细胞,Treg细胞,静息NK和DC百分比较高。随着组织学等级的提高,巨噬细胞,幼稚B细胞和嗜中性粒细胞的百分比增加,而γδT细胞,Treg细胞和肥大细胞减少。
单因素Cox分析筛选预后相关的免疫细胞子集。结果显示在管腔B,HER2过表达和三阴性乳腺癌中免疫细胞的丰度与生存率显著相关。以风险比HR进行subgroup analysis,显示所有浸润细胞可分为保护相关survival-favourable、危险相关survival-unfavourable以及中性neutral 3个子集(表2)。
表2:肿瘤浸润免疫细胞亚群的COX分析结果
3. 建立基于肿瘤浸润免疫细胞的乳腺癌预后模型
基于单因素分析结果,作者使用GEO数据通过LASSO-Cox回归进一步筛选免疫细胞亚群并在管腔B,HER2过表达和三阴性亚型中建立模型,从22个亚群中筛选出7个,根据免疫细胞丰度计算免疫风险评分immunorisk score(IRS)作为预后指标。IRS计算公式:
Immunorisk score = 2^((-0.056)* B cell+(-0.017)* CD8+T cell+0.151* γδT+(-0.060)* NK cell+(-0.165)* activated CD4+ memory T cell+(0.099)* activated mast cell+(0.177)*neutrophils)
构建可预测3年和5年OS的列线图(图A),C指数0.71(95%CI:0.64-0.78),并展示了列线图的校准曲线(图B和C),显示五年OS的预测准确度较高。
图2:基于肿瘤浸润免疫细胞的列线图预后模型
图3:列线图模型的校准曲线
在GEO样本中以年龄、肿瘤体积、淋巴结三种特征进行分组,分析IRS高低组的生存差异。结果显示IRS在高风险组中更为准确:年龄大于50岁,肿瘤大于2 cm或淋巴结阳性的患者(图4)
图4:不同临床病理特征分组的IRS生存曲线
使用TCGA-BRCA和METABRIC数据验证Cox回归模型,结果显示较高的IRS在两者中均预后不良,TCGA-BRCA(HR 11.80,95%CI:3.86-36.13,P <0.001)和METABRIC(HR 1.24,95%CI:1.02-1.51, P = 0.035)。
展示两数据集中7种免疫细胞亚群的免疫评分热图(图A)以及IRS四分位数分组的生存曲线(图B)。可以看到IRS较高的样本中Survival favourable细胞亚群免疫评分低,而Survival unfavourable亚群评分高。并且四分位数划分的Q1-Q4 IRS的OS具有显著性差异。以上验证结果表明IRS可以作为乳腺癌预后指标。
图5:IRS在TCGA-BRCA和METABRIC数据中的浸润细胞免疫评分及OS验证
4. 乳腺癌免疫分型的聚类分析
在3种乳腺癌亚型中使用GEO队列进行无监督聚类分析。结果聚为两类:免疫亚型A(immune-reactive)中survival-favourable的免疫细胞丰度更高;免疫亚型B (immune-nonreactive)中survival-unfavourable丰度高:Immunotype A (B_cellhigh NKhigh CD8+_ Thigh CD4+ _ memory_T_activatedhigh γδTlow Mast_cell_activatedlow Neutrophillow);immunotype B (B_celllow NKlow CD8+_ Tlow CD4+_memory_T_activatedlow γδThigh Mast_cell_activatedhigh Neutrophilhigh)
图6A展示了聚类分析热图结果和生存曲线,显示在GEO数据中A、B两型OS具有显著差异。
在TCGA-BRCA和METABRIC数据中进行了验证。免疫A型METABRIC数据中OS与B型具有显著差异(图6C)。
在三种乳腺癌分子亚型中进行多因素Cox分析,结果显示Immunotype预后价值显著。(表3)
图6:基于免疫细胞亚群的无监督聚类及生存分析
表3:三种乳腺癌分子亚型中的多因素COX分析
作者进一步比较了两种免疫亚型的IRS、免疫细胞亚群丰度和生存差异。并且分析了重要免疫细胞因子和检查点分子的表达差异。
免疫A型IRS显著低于免疫B型,且survival-favourable细胞亚群免疫评分较高(图7A-B)。
与免疫B型相比,免疫A型具有更好的5年OS(85.7% vs 73.4%,P <0.001),RFS,DFS和DMFS也显著更好。(图7C-F)
图8比较几种重要细胞因子IL-2、IFN-γ、TGF-β和免疫检查点分子PD-L1、PD-1、CTLA-4在两种免疫亚型中的表达。结果显示GEO和TCGA-BRCA数据中免疫A型的IL-2和IFN-γ,PD-L1,PD-1和CTLA-4表达显著高于B型。而TGF-β在B型中水平更高。
图7:免疫A型、免疫B型的IRS差异分析和生存分析
图8:两种免疫亚型中重要免疫细胞因子和检查点分子的表达
5. 免疫A型和免疫B型之间的免疫特征基因分析
作者对两种免疫亚型进行差异表达基因分析,鉴定出202个高表达的免疫相关基因。KEGG分析显示这些基因与T细胞分化,NK细胞毒性,细胞因子-细胞因子受体相互作用,NF-κB信号通路等通路相关 。PPI分析表明该网络由T细胞,B细胞和NK细胞相关基因和细胞因子组成。作者进一步对每个差异表达基因进行单因素和多因素Cox回归分析,鉴定出与OS显著相关的前列腺素D2合酶PTGDS。进一步分析乳腺癌中PTGDS的功能:
生物信息学结果:
图9:在METABRIC数据中分析正常组和不同临床病理特征组中PTGDS及其受体PTGDR的表达差异,结果显示在肿瘤体积大(图B,F)、高临床分期(图C,G)和高组织学分级(图D)的肿瘤中,PTGDS和PTGDR的mRNA水平显著下调,表明PTGDS可以作为保护因子。
作者还以平均PTGDS mRNA水平将样本分为高低表达组进行了差异基因分析,显示高低组间的差异基因与乳腺癌中的免疫相关通路有关。
最后对GEO样本中PTGDS表达水平与免疫细胞亚群丰度进行了相关性分析,显示PTGDS表达与保护性TILs的丰度正相关,而与危险性的M0/M2巨噬细胞、粒细胞丰度负相关。
图9:METABRIC数据中不同临床病理特征组PTGDS/PTGDR的表达差异
组织学结果:
在98例乳腺癌患者石蜡切片中进行了免疫组化(IHC)和免疫荧光(IF)检测。图10A显示TNBC组织中基质TILs的PTGDS表达明显高于导管上皮细胞,与生信分析结果一致,图10B显示PTGDS在乳腺癌组织中表达不均匀。
PTGDS 和免疫细胞标志物的IHC和IF染色确定表达PTGDS的特定细胞类型。结果显示,IHC染色中PTDGS与多种TILs标志物共表达(图10C),IF染色显示CD19 + / CD20 + B细胞和CD4 + / CD8 + T细胞均与PTGDS共定位(图11)。
图10:IHC检测乳腺癌及癌旁组织中PTDGS的表达以及与不同免疫细胞亚群标志物的共表达
图11:IF检测TNBC乳腺癌组织中PTGDS与CD19+ B cells 和CD4+/CD8+ T cells 共定位
最后,作者根据IHC鉴定的平均PTGDS表达水平将98位患者分为高表达和低表达组分析临床病理特征的差异。结果表明PTGDS的高表达与TIL高浸润水平、肿瘤较小以及较早的病理分期有关,与生信分析的结果一致。
表4:PTGDS高表达组和低表达组临床病理特征的差异
小结
作者首先使用CIBERSORT对样本进行肿瘤浸润免疫细胞亚群的丰度评估,然后进行单因素和多因素Cox分析筛选其中具有显著预后意义的子集,在管腔B,HER2过表达和三阴性乳腺癌建立了以IRS作为浸润免疫细胞指标的预后模型,并且对IRS的预后意义进行评估。接着对GEO样本进行聚类,得到免疫A型、免疫B型两类,在TCGA、METABRIC数据中进行了验证,同样分析了免疫分型的临床病理特征差异及预后价值。最后作者筛选了免疫A型和免疫B型之间的差异表达基因,鉴定出特征基因PTGDS,进一步分析不同临床病理特征分组的PTGDS表达差异,并通过IHC和IF验证其在TILs中的特征表达。
还是和往常一样,后台回复「54a」,即可获取今天小编为大家解读的文献。本期的分享就到这里啦,一起期待下一期的精彩分享吧~
▼▼是否遗漏了往期精彩生信解析没看呢?▼▼
关注科研菌回复"1"即可获取"28G全网最全科研绘图素材"、"谷歌上网助手"(梯子)和"科研常用软件合集"、“肿瘤/消化内科指南”、"考研复试大礼包";回复2020,可获得2020年生信套路合集;回复“单细胞文献”,可获得单细胞文献合集(均无需转发/集赞)