1.覆盖深度 mapping depth
基因组被测序片段(短读 short reads)“覆盖”的强度有多大?每一碱基的覆盖率是基因组碱基被测序的平均次数。 基因组的覆盖深度是通过与基因组匹配的所有短读的碱基数目除以该基因组的长度来计算的。 它通常表示为1X、2X、3X、...(1、2或3倍覆盖)。此处通常被称为测序深度(sequencing depth)或者覆盖深度(depth of coverage)。
计算公式
原始测序数据的深度,Depth = (# sequenced bases) / (# bases of reference)
比对上的数据的深度,Depth= (# bases of all mapped reads) / (# bases of reference).
2.覆盖范围 covered length
短读“覆盖”了基因组的多少区域?是否有些区域没有任何的短读覆盖?覆盖范围是参考基因组被一定深度覆盖的碱基的百分比。例如,一个基因组的90%区域在1X深度覆盖,另外仍然有70%的区域被覆盖了5X深度。此处通常称为覆盖度(genome covarage)或者覆盖范围(breadth of coverage)。
计算公式
Coverage = (# area covered by mapped reads) / (# area of reference).
3.PanDepth快速计算reads深度,覆盖度
安装
wget -c https://github.com/HuiyangYu/PanDepth/releases/download/v2.25/PanDepth-2.25-Linux-x86_64.tar.gz
tar zvxf PanDepth-2.25-Linux-x86_64.tar.gz
cd PanDepth-2.25-Linux-x86_64
./pandepth -h
export PATH=$PATH:/home/chensiyuan/PanDepth-2.25-Linux-x86_64
命令
./pandepth -i /home/chensiyuan/03.BWA/aln.bam -o test
4.samtools 统计重测序数据深度
samtools depth SRR1770413.sorted.bam > depth01.txt
samtools depth -a SRR1770413.sorted.bam > depth02.txt
samtools depth -aa SRR1770413.sorted.bam > depth03.txt