背景
这是一篇文献(DNA damage is a major cause of sequencing errors, directly confounding variant identification.)的简单介绍。
NGS 用于肿瘤细胞的体细胞突变的检测有着重要的意义。由于肿瘤细胞的异质性以及正常细胞的背景,肿瘤细胞的用药相关的基因突变往往是低丰度的。而低丰度的突变会受到PCR错误、测序错误、DNA损伤的影响,带来很多假突变。其中DNA损伤带来的影响尤为严重。
FFPE DNA, 时间久远的DNA,ctDNA 都会受到损伤的影响。公共数据库,1000 Genomes Project 和 TCGA 中的数据大部分也存在DNA损伤。
全局不平衡值(GIV) 衡量DNA Damage
为了检测DNA损伤对突变检测的影响,文章使用illumina 文库准备流程,使用双端测序。连上接头序列的双链模板DNA,在测序中读为 R1,而他们的互补链则读为 R2。
DNA损伤会造成DNA双链中的一条链引入错误的碱基,从而导致R1中的某一种突变类型(例如:G-T) 远远超过R2。如图:
基于这种不平衡设计了一组 GIV 值来检查DNA damge: https://github.com/Ettwiller/Damageestimator
- C1v : R1 中G→T的突变数量;
- C1 : R1 中G 的总量;
- C2v: R2中C→A的突变数量;
- C2: R2中C的总量;
- C1v_RC: R1中C→A的突变数量;
- C1_RC: R1中 C 的总量;
- C2v_RC: R2中 G→T的突变数量;
- C2_RC: R2中 G 的总量。
文章中,认为GIV 的值超过1.5表示有严重的损伤,暗示至少有三分之一的突变是错误的。没有DNA损伤的话IGV值应该是1。
DNA氧化损伤
使用DNA 修复试剂盒可以显著降低损伤。同时,DNA 破碎的缓冲液环境也是避免氧化损伤的重要部分。
由DNA 损伤引入的测序错误,并不会降低测序的碱基质量值,提高突变检测的质量值无法去除这些错误。
DNA 的氧化损伤没有序列的特异性,在DNA上随机发生。
氧化损伤影响的突变分度范围
氧化损伤形成的假突变丰度大部分在5%以下,其中1%-5%区间的突变,对我们突变检测的影响最大。因为这些突变有足够的reads证据支持,容易保留。