gatk4 MarkDuplicates后出现:MATE_NOT_FOUND 或者Mate not found for paired read

gatk4 MarkDuplicates

java -jar picard.jar MarkDuplicates \
      I=input.bam \
      O=marked_duplicates.bam \
      M=marked_dup_metrics.txt

问题记录:

在此步结束之后,会有metrics.txt生成,metrics.txt中的内容讲解可见metric

gatk4 ValidateSamFile

java -jar /software/picard-tools-1/picard-tools-1.103/ValidateSamFile.jar

问题记录:

在检验831panel中的去重之后的BAM文件时出现以下错误:(mode为VERBOSE)

注:用FixMateInformation对去重之后的BAM进行修正后,依然出现这种问题。

image.png

后又用SUMMARY模式重新跑,看到以下结果:

image.png

嗯,有27876个read 丢失了meta。但是去重的前一步验证BAM时是一切正常的,然后查看了MarkDuplicates的metrics文件,发现以下结果:

image.png

原因找到了,因为这27876个read被标记过滤了。所以,是因为,这么多read被过滤了,留下的bam中就有这么多的read找不到他们的meta了。

unpaired read可以这么理解:which did not have a mapped mate pair, either because the read is unpaired, or the read is paired to an unmapped mate.所以这里出现的应该是第二种可能: the read is paired to an unmapped mate。

image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容