写在前面
IGV(Integrative Genomics Viewer)是一款本地即可使用的基因组浏览器,经常被用来做比对结果的可视化。它除了能够方便查看二代测序结果检出的SNV/InDel等各种变异的信息之外,还可以通过简单的设置,用不同的颜色标注一对reads的方向关系。通过方向关系的颜色标注,我们可以轻松地从中发现包括倒位(inversions)、重复(duplications)、易位(translocations)在内的多种染色体结构变异信息。
设置IGV
选择Color alignments>by pair orientation,就可以方便的标记出reads的方向关系了。
正常而言,Illumina双端测序的一对reads是从一个DNA片段的两条不同链测出的,因此比对到参考基因组上的方向是不同的,在IGV上看起来像两个对着的箭头:read1向左,read2向右。在IGV中,这种方向关系正常的reads对用浅蓝色标注。
除此之外,还有一些由于染色体结构变异导致的方向关系异常的reads对。例如:
- 两条reads都向左(IGV用蓝绿色标注);
- 两条reads都向右(IGV用蓝色标注);
- read1向右,read2向左(IGV用绿色标注);
当然,上述颜色标注只适用于这对reads都比对到同一个染色体的情况。
倒位(Inversions)
染色体某一片段的位置颠倒了180度,造成染色体内的重新排列,称为倒位。
当一对reads跨过了Inversion断点时,比对在参考基因组上时就会出现两个reads都向左,或两个reads都向右的情况。
在IGV上,就会用蓝色或蓝绿色展示出这种异常情况。
倒位复制(Inverted Duplication)
染色体上一段DNA片段复制后,颠倒180度,并插入到染色体中称为倒位复制。
这种情况同样会引起reads对的方向同时向左或向右,并且异常reads比对到参考基因组的位置相互重叠,引起了重复片段在参考基因组位置处的覆盖深度改变。
在IGV上会出现这种情况:
串联重复(Tandem Duplication)
当一段DNA片段复制后插入了片段结束位置时,这种染色体变异称为串联重复。
跨过俩重复片段连接点的一对reads,在比对到参考基因组上时,会出现两个reads背靠背的情况,即read1向右,read2向左。
在IGV上会用绿色展示出来。
染色体内异位(Translocation on the Same Chromosome)
当一个染色体片段从原来的位置脱离并插入到染色体其他位置中,称为染色体异位。
跨过染色体内易位断点的两个reads比对到参考基因组上,会出现背靠背的情况;染色体间易位则会出现异常的插入片段长度,通过设置IGV展示插入片段长度,就可以发现这种异常的比对情况。
参考
https://software.broadinstitute.org/software/igv/interpreting_pair_orientations