文章题目:Tumor mutation burden and recurrent tumors in hereditary lung cancer
文章链接:https://www.ncbi.nlm.nih.gov/pubmed/30941903
摘要
We identified specific mutations in T1 and T2, and attributed them to tumorigenesis and recurrence. These tumor specific variants were enriched in antigen presentation pathway.
背景
首先,Many studies showed several genes were associated with cancer relapse but a global view of lung cancer relapse by whole genome analysis is lacking.
已知的是,Previous studies indicated genetic heterogeneity between primary tumors and locally recurrent or metastatic tumor.
曾经,We identified a germlinem mutation in YAP1, a key component of the Hippo pathway, for hereditary lung adenocarcinoma.
然而 ,However,==intratumor heterogeneity== of normal‐tumor pairs with primary and relapse tumors in has not been systematically characterized by next‐generation sequencing in hereditary lung cancer.
因此,We applied whole genome sequencing to study multiple samples from blood, primary and relapse tumors in one lung adenocarcinoma patient with germline YAP1 R331W missense mutation and family history.
最后,We investigated the ==genetic intratumor heterogeneity== and found that the immune‐associated gene somatic variants would predict the relapse‐free survival.
生词
germline mutation生殖系突变 文章中好像是用的病人blood的样本来代表是生殖系突变
somatic mutatin 体细胞突变
cancer relapse 疾病复发
intratumor heterogeneity 瘤内异质性
tumor mutational burden (TMB) 肿瘤突变负荷
Synonymous mutations:同义突变:由于生物的遗传密码子存在简并现象,在某一碱基改变后,在原来的某种氨基酸的位置译成同一种氨基酸,此现象称同义突变。如:CTA与CTG 均编码亮氨酸,若A突变为G则该变异为同义突变。
关于肿瘤异质性(ITH)和肿瘤突变负荷(TMB)
- 肿瘤异质性:
肿瘤的异质性是恶性肿瘤的特征之一,是指肿瘤在生长过程中,经过多次分裂增殖,其子细胞呈现出分子生物学或基因方面的改变,从而使肿瘤的生长速度、侵袭能力、对药物的敏感性、预后等各方面产生差异。
同一肿瘤中可以存在有很多不同的基因型或者亚型的细胞。因此同一种肿瘤在不同的个体身上可表现出不一样的治疗效果及预后,甚至同一个体身上的肿瘤细胞也存在不同的特性和差异。
肿瘤内异质性(ITH)越高,免疫系统抗癌的能力就越容易被抑制,癌症进展的就更快。
- 肿瘤突变负荷(TMB)
肿瘤突变负荷(TMB)被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。
程序性死亡抑制因子-1(PD-1)蛋白或其配体(PD -L1) 已在多种肿瘤治疗中获得显著的临床疗效。肿瘤突变负荷(TMB)作为PD-1抗体治疗效果评估的最新标志物,其效果已在PD-1抗体用于治疗有错配修复缺陷的结直肠癌中得到证实。
我们都知道,在肿瘤免疫治疗领域有个非常重要的假设:肿瘤的突变负担,也就是TMB越大,新抗原就越多,肿瘤的免疫原性就越强。言外之意,TMB越高,免疫治疗效果应当更好。TMB高的患者对免疫治疗的反应也不一致,很多TMB低的患者对免疫治疗也有反应。参考https://mp.weixin.qq.com/s/dcUfzisG7gY85FbjA0toIQ
方法
样本收集的是病人的 血液、一期癌组织(T1)、一期癌旁组织、转移灶组织、转移灶旁组织。送出去测序。
接下来是测序后数据分析所用的生信工具,截图如下
- 关于Functional enrichment and phylogenetic analysis
作者用了两个软件分别是IPA(ingenuity pathway analysis )
HLA regions were used to determine the best model by MEGA6 17 was used to con-struct maximum‐likelihood phylogenetic trees
这里作者依然用了TCGA中的数据,不过是 somatic mutation 的数据,这个数据接下来怎么用呢?
数据分析------很重要啦
上面的截图中是说在T1和T2分别用了t检验,并且根据基因突变的数目将组织分成了高突变组和低突变组。现在问题是前面作者的取样是一共取了5个样,那么T1和T2的group就分别是肿瘤组织,也就是说计算的是第一次的肿瘤组织中的突变基因的数目和第二次复返转移时转移灶中突变基因的数目,然后将这两次结果进行比较后,分成了高-低突变组。
暂且在没看后文时先这么理解,能当成悬疑小说看,挺好。
结果
图一 Figure 1 showed the flowchart of tumor mutational burden (TMB) identification in this study.
TMB was defined as the number of somatic mutation in coding region. 然后 作者提到了一个同义突变和非同义突变的 问题,因为同义突变不能产生新抗原,所以这篇文章主要是看的非同义突变。
图二
The exonic alterations of each sample were presented as Circos plots in Figure 2.
上面的点的颜色分别是如下的含义
文章中的一句话After comparing with germline background (blood DNA), and normal part tissues, the 215 tumor specific functional mutations (missense and nonsense mutations) were identified.
所以就是说,将T1和T2中的突变与血液blood中的germline突变和normal组织(也就是前面取的T1和T2的癌旁组织)进行对比,就可以知道体细胞突变了。
关于单核苷酸突变类型的比例如下图
关于We used deconstructSigs to identify of mutational signa-tures. Correlation with the 30 curated mutation signatures according to Somatic Mutations in Cancer (COSMIC) database indicated that a primarily C to T transition signature (Figure 3B).
作者用IPA(凯捷公司)将846个基因(1665个变体)按照默认值设置,最终得到的功能富集如下,为啥没有富集分析的 Y叔的包呢,害我琢磨半天
这个文章看的 我实在不适呀,捡重要的结果吧,就是如下挑了几个分组然后找到p值明显的就是 mutation load了,其实文章不就是在做这样一个事嘛,直接做生存相关呗?
对于上面图7的解释是:we demonstrated that patients with high allele frequency of missense and nonsense mutations in tumor specific parts had a significantly shorter relapse‐free survival time than the low mutation frequency group for the EGFR wild‐type lung cancer patients (P = 0.017, Figure 7), though no significant difference present in overall survival (P = 0.67, Figure 7
还有这个mutation load 是什么?就是前面得到的一系列结果嘛 ?然后a图说明对生存没影响,但是作者为补救本文有个较好的结果,所以拉来了这个TCGA数据集中的EGFR wild type来帮忙,得到了为0.017的显著结果嘛?
文章中关于如何引进这个HLA和EGFR,描述如下,暂且记录一下吧,留着以后回忆时用,下面红色地方是从TCGA中的LUAD的数据获得的嘛?超过我的理解了哦...
总结
看的云里雾里,感觉前面的图片都不知道怎么得来的,就哗一下 放个结果的图,其他理解都穿插在文中了,慢慢来吧~不好hold呀~