这是MSK于2019年发表于《nature medicine》的一篇文章《高深度测序揭示血浆中cfDNA变异的来源》,文章设计实验对cfDNA变异的来源进行了分析,揭示了克隆性造血突变对cfDNA突变检出的影响,强调了WBC作为配对的重要性,是一篇非常经典的学习文献。
1 摘要
想要准确鉴定血浆中肿瘤驱动的 somaitc 突变,需要理解不同生物过程对cfDNA的贡献。文章想确认cfDNA和配对白细胞高深度测序方法的可行性,在124例转移性癌症患者的前瞻性研究中,对基因组较大的一个区域进行了高深度测序(508个基因,2Mb区域大小,>60000初始深度),也进行了同期配对肿瘤组织和47个无肿瘤对照的分析。结果显示该方法有较高灵敏度和特异性,可以检测肿瘤来源的突变,推断bTMB,bMSI,肿瘤信号及肿瘤驱动的 somaitc 突变。大多数的cfDNA突变(81.6%在对照中,53.2%在癌症病人中)显示出与克隆性造血CH(clonal hematopoiesis)相一致的特征。这种cfDNA测序方法揭示了克隆性造血是一种普遍存在的生物学现象,强调了cfDNA-白细胞配对测序对准确检测变异的重要性。
2 引言
癌症病人血浆中的循环cfDNA是肿瘤驱动DNA的潜在来源。大规模平行测序cfDNA表明ctDNA只占整个cfDNA的很小一部分,这一比例随疾病负荷、部位和肿瘤生物学特征(包括组织学、血管化、增殖和凋亡)而变化。ctDNA在许多癌症的早期和一些转移性癌症中比例极低,需要高灵敏度的方法才能检测到。即使使用准确的cfDNA检测方法,cfDNA结果仍可能与体细胞嵌合体产生的生物信号混淆。体细胞嵌合体的一种形式是克隆性造血(CH),这是克隆繁殖后代的造血干细胞 somatic 突变累积的结果。这些体细胞突变可能为某些造血干细胞和其后代细胞提供适应性优势,导致其无序的扩张。CH 随着年龄的增长而增加,在31%的老年人中发生,也可以在cfDNA中检测到。在这种情况下,它可能会混淆cfDNA突变,因为很大一部分cfDNA的片段都来自于造血细胞。
cfDNA样本与肿瘤组织活检中的somatic突变存在较好的一致性。肿瘤组织中未发现somatic变异,但cfDNA发现的情况,文献中也有记载。但是,它们的特征和来源并没有被确认。在这里,文章报导了cfDNA和配对白细胞高深度测序检测cfDNA中somatic的方法,不需要预先知道配对组织中的突变。该方法结合FDA授权的TN配对的靶向测序方法,允许对ctDNA突变来源进行分类和定量。
3 结果
3.1 实验设计信息
1、血浆的cfDNA 和转移性乳腺癌MBC,非小细胞肺癌NSCLC,前列腺癌CRPC配对的白细胞gDNA同时进行GRAIL 508基因 panel的靶向测序
2、在没有进行干预治疗的情况下,肿瘤组织和配对白细胞采用MSK-IMPACT panel(410个基因) 进行靶向测序
3、39个MBC,41个NSCLC,44个CRPC样本;47个 cfDNA对照样本。如图 Fig1a 所示:
3.2 肿瘤来源 cfDNA 突变的从头检测
1、 为了确认cfDNA中肿瘤来源的somatic 突变,对cfDNA,WBC gDNA 和 配对组织和白细胞进行了独立测序
2、cfDNA和WBC gDNA采用 UMI标签进行测序,初始去重前测序深度在60000X左右
3、使用机器学习算法对cfDNA和WBC gDNA配对的突变进行检测, 结果显示该方法具有高灵敏度Fig1bc(HD753细胞系模拟数据),低假阳性,高重复性Fig1de,与ddpcr的结果相一致Fig1f;高深度测序结果显示,每个碱基的错误率范围为110^-5 到 310^-5 ,性能可与其他高可信度cfDNA测序相媲美。
4、既在肿瘤组织检出也在血清中检出的突变在 MBC,NSCLC,CRPC 分组和整理中的比例如Fig2a所示,具体基因检出的一致性如Fig2b所示,这也表明组织和cfDNA中基因突变的一致性还是比较高的
5、cfDNA检出的比例与组织样本中癌细胞的比例(CCFs)高度一致,如Fig2e所示
6、以上数据证明,cfDNA测序方法有较高的灵敏度去检测来自于组织中肿瘤亚克隆来源的somatic突变
3.3 肿瘤突变负荷 TMB 和突变特征
文章对能否单独使用cfDNA测序确定TMB,突变特征,bMSI值进行了探索。
1、组织和cfDNA的TMB突变特征分布如图Fig3a。其中有6个样本在cfDNA中TMB值较高,在组织中TMB值较低,可能的解释是肿瘤的空间异质性,可能在一些转移位点存在高突变特征
2、以上数据表明,cfDNA测序方法可以精确的检测肿瘤来源的突变,有可能用于TMB,MSI和突变特征分析,并为治疗手段的选择提供信息
3.4 cfDNA变异的生物来源特征
变异检测和tag逻辑:
1、变异覆盖深度较低,白细胞中频率较高的点,标记为噪音
2、白细胞中,变异频率大于20%的点被认为是germline
3、同义突变被独立标记
4、变异在白细胞中存在,但是未达到阈值的标记为 WBC matched
5、如果白细胞中深度较低,不能提供足够信息的标记为模糊
6、剩余的突变标记为Somatic,还分为以下三个种类:
如果在组织MSK中检出的标记为biopsy matched;
如果在组织MSK中低于阈值的标记为biopsy subthreshold;
如果变异没有匹配到信息的标记为VUSOs;
1、在cfDNA病人中,somatic检测的特异性不高只有24.4%(与组织Somatic检测一致的个数占总Somatic的比例)
2、在没有癌症的controls中,TMB平均值为7.27。之前的研究表明,这些突变可能是由超高深度测序导致的人工突变。但是基于分析方法的特异性,文章假设这些变异来源于体细胞嵌合体(特别是克隆性造血)和空间异质性引起的肿瘤来源突变(特别是在高突变癌种中)
3、克隆性造血一般与年龄相关,WBC matched显示了与年龄的强相关性Fig4c。根据这个解释,89.5%的病人中,83%的健康人中的cfDNA突变为克隆性造血,如Fig4b。
4、WBC matched中的大部分基因DNMT3A,TET2,PPM1D和TP53 也与文献中报导的克隆性造血基因一致,如图Fig4d
5、WBC matched中的cfDNA 的VAFs与WBCs中的VAFs相关
6、很大一部分VUSOs可能来自于肿瘤,但是由于肿瘤的空间异质性和抽样偏倚,可能并没有在活检组织样本中检测到,如Fig2b。为了确定cfDNA检测的VUSOs的准确性,使用ddpcr方法对结果进行了正交验证,发现两种方法完全一致,如图Fig4f所示
7、以上数据表明,高深度cfDNA测序确定了CH突变是cfDNA中检测到的非肿瘤突变最大来源,CH可能比以前文献报导的低深度WBC测序方法更普遍。并且在cfDNA中能检测到肿瘤活检中缺失的亚克隆来源突变
3.5 WBC变异特征
1、对白细胞进行高深度测序分析是检测源自CH体细胞突变的主要方法。至少有1个CH突变在99.1%的肿瘤病人WBC中和93.6%的健康人对照中被检测到
2、DNMT3A和TET2基因是癌症病人和正常人中检测到的最高突变VAFs的基因,如Fig5c
3、治疗干预可能会导致特定类型CH的获得,PMM1D基因在癌症患者的频率要对照组,并且在接受放疗和化疗中基因突变的比例要高于未治疗组,如Fig5d
4 讨论
1、目前大多数的临床cfDNA panel只是针对少量的关键基因和热点突变,并没有纳入白细胞测序。之前通过扩大区域检测范围,坚定了出了大量肿瘤组织中不存在的变异,并推断为体细胞变异(存在的问题)
2、文章采用了cfDNA和WBC gDNA联合高深度测序分析的方法,来减少测序错误。如果不考虑WBC的测序结果,cfDNA测序结果会产生一些误导,因为一些影响癌症基因的克隆性造血突变可能会被当做肿瘤来源的突变(如TP53突变)
3、文章分析显示,在cfDNA中发现的大多数非肿瘤匹配的非同义突变在各自的WBC gDNA样本中都有reads支持,这在癌症患者和正常对照组中都存在。这些白细胞中有支持的突变基因大多与CH相关,并且这些突变与年龄分布有较强的相关性
4、这些WBC中有支持的CH基因变异,在不同患者中具有差异,这表明在基于cfDNA的临床分析中,需要cfDNA配对的WBC DNA进行测序分析
5、如果没有WBC,来自于非肿瘤来源的突变(如CH)会被当做肿瘤来源,会影响cfDNA分析中TMB的计算和特征分析
6、文章还证明了VUSOs的多种来源,比包括肿瘤异质性,极低水平的CH,细胞嵌合体和技术噪音。其中大多数的VUSOs是肿瘤相关的突变,主要来自于肿瘤亚克隆
5 参考文献
[1] Razavi P , Li B T , Brown D N , et al. High-intensity sequencing reveals the sources of plasma circulating cell-free DNA variants[J]. Nature medicine, 2019, 25(12):1-10.