作者,Evil Genius
2023年马上结束了,不知道大家今年的任务完成了多少,如果顺心如意就继续保持,如果坎坷不断,就砥砺前行,人生唯一确定的是不确定的人生,当下的苟且或许是在为将来蓄力。
最后一天了,分享一下关于科服和临检的内容,为实现自动化出特检报告做心理上的准备。
NGS基因测序(panel)报告解读数据库汇总
GATK的人类宿主的微生物检测流程PathSeq和在空转上的运用
肿瘤突变负荷(TMB)及计算方法
OncoKB数据库介绍及爬虫爬取位点用药信息
外显子(wes)panel数据分析OncoKB注释
外显子(panel)数据分析的初步解读
外显子(WES)panel分析基础篇
没接触特检之前,形成了一些刻板印象,很多人说临检有前景,比科服强,但是比较累等等,当然也零零星星听过一些临检的内容什么的,不太系统,也觉得临检不见得比科服强。
当然科服作为最开始接触的工作,单细胞空间的分析也确实让人着迷,以为这是可以工作一生的方向,现在回头看,自己还是天真了,科服的一项技术红利期也就3年,尤其是技术的发展,很快见顶,分析方法经过了很短时间的爆发期之后,天花板就到了,比如单细胞,大家分析单细胞还是用Seurat、monocle、Cellchat等等,19年的时候大家也是用的这些方法,只不过软件版本更新了而已。
科服还有一个很大的特点是售后,因为科服需要很多的经验积累,思路总结等等,比如细胞注释,并不能流程化的出结果,当然了轨迹、通讯等等也要根据自己的课题进行设计,所以会形成大量的售后问题,但是这些售后问题从利润的角度出发,完全是吃力不讨好,慢慢公司就抬高了个性化售后分析的价格,甚至有的公司在签合同的时候故意诱导客户不包含下游的个性化分析,所以很多老师拿到数据也无从下手,就让自己的学生研究,而很多学生根本没有接触过生信,或者没有接触过单细胞空间的分析内容,所以衍生了很多的培训班,培训公司等等,再进一步,市面上有了很多的盗版,我作为学生的时候一个月生活费500,所以也买过盗版内容,其实大家都是硕士博士,也知道应该支持正版,但是就像我不是药神的电影那样,吃不起正版药,不吃进口药就是等死,当然科服就是不会分析就被别人卷死,这其中唯一的不同是贩卖盗版资料的人应该没有一个有程勇的觉悟。
临检,对于生信而言当然主要是特检,主要分为两部分,NGS和tNGS,其中还有更为细化的分析方向,比如产前诊断等等,NGS主要检测基因位点的突变,tNGS主要检测病源微生物,所以对检测的精准度有要求,以NGS为例,检测到一些位点的突变就要吃一些对应的靶向药,或者给化疗的建议,所以临检更多的是应用层面,出了报告之后一般不会有后续的事情了,但是特检最核心的问题是靶向用药的数据库,这个数据库,各个公司都有自建的数据库,这里就不得不提国外的研究优势了,各种NGS位点突变数据库都是国外建立的,其中不乏需要花大额费用才能使用的数据库,对于靶向用药的批准上市,例如FDA,NCCN等,也是外国的,国内目前严重缺失这些。
科服和临检唯一的相同点就是,无论技术、平台、数据库、研发还是软件开发、分析质量、市场占有、工资水平等,国外远高于国内。
简单了解这些以后,我们来解读一下肿瘤检测的报告内容,为自动化出检测报告做一下铺垫。
了解一些简单
- 驱动基因:是指与癌症发生发展相关的重要基因。目前常见的几大肺癌驱动基因变异有:EGFR基因、ALK基因、BRAF基因、RET基因、MET基因、NTRK基因、KRAS基因、ROS1基因。
- 靶向药物:是指被赋予了靶向能力的药物或其制剂。其目的是使药物或其载体能瞄准特定的病变部位,并在目标部位蓄积或释放有效成分。
- 临床试验:是指任何在人体(病人或健康志愿者)进行药物的系统性研究,以证实或揭示试验药物的作用、不良反应及/或试验药物的吸收、分布、代谢和排泄,目的是确定试验药物的疗效与安全性。临床试验一般分为I、II、III、IV期临床试验和EAP临床试验。
- 免疫治疗:是指针对机体低下或亢进的免疫状态,人为地增强或抑制机体的免疫功能以达到治疗疾病目的的治疗方法。免疫治疗的方法有很多,适用于多种疾病的治疗。肿瘤的免疫治疗旨在激活人体免疫系统,依靠自身免疫机能杀灭癌细胞和肿瘤组织。与以往的手术、化疗、放疗和靶向治疗不同的是,免疫治疗针对的靶标不是肿瘤细胞和组织,而是人体自身的免疫系统。
- 化疗:是化学药物治疗的简称,通过使用化学治疗药物杀灭癌细胞达到治疗目的。
- NGS (Next Generation Sequencing):下一代测序技术,也称为高通量测序技术。
- PD-1(programmed cell death protein 1):程序性细胞死亡蛋白1,也称为CD279(分化簇279),是一种重要的免疫抑制分子。
- PD-L1(Programmed cell death 1 ligand 1):程序性细胞死亡-配体1也称为表面抗原分化簇274(cluster of differentiation 274,CD274)或 B7同源体(B7 homolog 1,B7-H1),是人类体内的一种蛋白质,由CD274基因编码。
- HRR(Homologous recombination repair):同源重组修复,是DNA双链损伤的核心修复方式之一,其通过对DNA的同源链的重组,完成对双链损伤部位的修复。
- HRD(Homologous recombination repair defect):同源重组修复缺陷,当DNA出现双链断裂时,细胞失去了通过同源重组的方式对断裂进行修复的能力。
- MRD(Minimal residual disease):微小残留病灶,指癌症患者在治疗中或治疗后仍有残留的恶性细胞存在,是癌症复发的主要原因。
- dMMR(mismatch-repair deficiency):错配修复缺陷。错配修复是由一系列高度保守的基因及其表达的产物酶构成,具有维持DNA复制的高保真度和基因组稳定性、降低自发突变的功能。
- PARP(poly-ADP-ribose polymerase)抑制剂:聚腺苷二磷酸-核糖聚合酶抑制剂,PARP抑制剂通过抑制肿瘤细胞DNA损伤修复、促进肿瘤细胞发生凋亡,从而可增强放疗以及烷化剂和铂类药物化疗的疗效。
基因变异命名规则
人类基因组变异协会(HGVS)的主要职责是发现和分类包括人群分布与表型相关联的人类基因组变异,并根据方法学与信息学的发展对数据及相关的临床变异进行更新。目前行业中普遍应用HGVS规则对变异进行命名,统一的命名规则方便了各种各样的交流和解读。
变异描述的顺序为:参考序列、变异位置、变异类型,参考序列必须是NCBI或EBI数据库中的ID。
参考序列前缀
常用符号的使用
常见缩写
DNA水平的变异描述规则
胚系突变分类
2015年ACMG/AMP发布了最新的遗传变异分类标准与指南,该指南建议使用特定标准术语来描述孟德尔疾病相关的基因变异——“致病的(P)”、“可能致病的(LP)”、“意义不明确的(VUS)”、“可能良性的(LB)”和“良性的(B)”。
此外,该指南描述了基于典型的数据类型(如人群数据,计算数据, 功能数据,共分离数据)对变异进行五级分类的标准过程。
序列变异解读的流程
人群频率等参考文章NGS基因测序(panel)报告解读数据库汇总。
体细胞突变
2017年,美国分子病理学协会(AMP)/美国临床肿瘤学会(ASCO)/美国病理学家协会(CAP)联合制定了体细胞突变变异位点解读指南,将体细胞突变等级进行了分类。
两者由于其来源的差异,在解读时的侧重点也会有所区别。胚系变异的解读侧重于对特定疾病变异的致病性或疾病的因果关系,而体细胞变异的解读则侧重于它们对临床治疗的影响,包括靶向治疗、耐药监测、预后判断等。
体细胞突变在解读时可分为两大部分:证据等级划分和临床意义分级。
证据等级划分
证据等级划分包括体细胞变异在不同癌种中对应的药物敏感性、对特定肿瘤的诊断及预后的价值,这三个方面。
临床证据的来源决定突变位点分级,证据来源包括肿瘤特异性公共数据库(如COSMIC、cBioPortal、My Cancer Genome、Personalized Cancer Therapy、Clinical interpretations of variants in cancer、oncoKB等)、临床试验数据库(如ClinicalTrials.gov、中国临床试验注册中心、EudraCT等)及肿瘤相关指南(如NCCN指南、ESMO指南、CSCO指南等)。
根据证据来源,可将其分为以下4个等级:
A级:美国FDA批准靶向治疗药物相关突变位点(特定肿瘤)或者是临床诊疗指南中治疗、诊断或者预后判断相关突变位点(特定肿瘤);
B级:基于证据充分临床研究基础上专家共识认为与靶向治疗、某一疾病诊断或者预后相关的突变位点;
C级:美国FDA批准靶向治疗药物相关突变位点(不同肿瘤)或者是临床诊疗指南中治疗、诊断或者预后判断相关突变位点(不同肿瘤),即非适应证的用药,临床试验的入组标准或者基于多个小规模研究表明具有指导诊断和预后判断的意义;
D级:临床前研究表明可能有治疗指导意义,或者在小规模研究、多个病例报道(非共识)中表明该突变(或者和其他标志物联合)具有指导诊断和预后判断的意义。
临床意义分级
根据上述证据等级的分类,按其临床意义的重要性可以进一步将肿瘤体细胞突变的划分为4个等级:
I级,具有强烈临床意义的变异(A级或B级证据);
II级,具有潜在临床意义的变异(C级或D级证据);
III级,临床意义未明的变异:在人群数据库和肿瘤相关数据库中均没有较高的发生率;没有确定的与肿瘤相关的文献证据
IV级,良性或可能良性变异:在人群数据库中突变频率较高;没有与肿瘤相关的文献证据。
在临床实践中,I类变异和II类变异均被广泛使用,尤其是Ⅰ类变异,是临床最关注的变异类型。
此外还有MSKCC的精准医疗肿瘤数据库(OncoKB)证据等级规则,参考文章OncoKB数据库介绍及爬虫爬取位点用药信息。
如何看基因检测报告?
丰度
突变检测丰度
丰度低不代表疗效不好,没有必要在意丰度的高低,而应将丰度变化作为动态监控,通过变化趋势预测当前的治疗效果。
基因变异级别
对于多基因变异、特别是多个潜在驱动变异共存的情况,要结合肿瘤类型、既往治疗史、相对突变丰度、既往分子检测结果等信息综合判读,以推测不同变异之间的逻辑关系(原发性VS获得性、主克隆vs亚克隆、敏感克隆vs耐药克隆),指导后续治疗。
肿瘤负荷突变
肿瘤突变负荷(tumor mutation burden,TMB)即肿瘤基因组编码区包含的非同义突变的数量或密度(突变数/Mb),是肿瘤新抗原负荷的替代指标,简单理解为患者肿瘤组织中具有多少个基因变异,突变的基因越多,越有可能产生更多异常的蛋白,越有可能被免疫系统识破。
目前基于 NGS 大panel检测的TMB 已可达到与WES (全外显子组测序)的高度相关并在大量免疫治疗临床研究中证实其对疗效的预测价值。
当我们看到 TMB 数值时,如果所选择的 panel太小,是无法准确测算TMB 的,除此之外还需要通过TMB 绝对值以及该数值在已检测的肿瘤样本中的相对排序等,综合评估 TMB 水平及其可信度。
理论上TMB水平低,可能预示靶向效果相对较好,TMB水平高,可能预示免疫治疗获益相对高。
微卫星不稳定性
微 卫 星 不 稳 定 性(microsatellite instability, MSI))检测对于多种实体瘤患者具有重要临床意义,多个研究表明,dMMR/MSI-H患者能够从免疫检查点抑制剂中获益,且不限癌种。因而MSI 成为了所有实体瘤中免疫治疗疗效的预测因子之一。