2021-04-22 bam文件中提取比对(mapped)或未比对上(unmapped)reads

flags

1 0x1 这序列是PE双端测序

2 0x2 这序列和参考序列完全匹配,没有错配和缺失

4 0x4 这序列没有mapping到参考序列上

8 0x8 这序列的mate序列没有mapping到参考序列上

16 0x10 这序列比对到参考序列的负链上

32 0x20 这序列的mate序列比对到参考序列的负链上

64 0x40 这序列是read1

128 0x80 这序列是read2

256 0x100 这序列不是主要的比对,因为序列可能比对到参考序列的多个位置上

512 0x200 这序列没有通过QC

1024 0x400 这序列是PCR重复序列

2048 0x800 这序列是补充比对

1.查看

其中bam文件中用标签4代表read未比对上;所以查看未比对上的reads用

samtools view -f 4 *bam|less -S

2.提取

提取未比对到参考序列的结果:

samtools view -b -h -f 4 *.bam > unmapped.bam

-h 文件包含header line;-f,提取;-b,输出为bam格式

###-F参数是过滤的意思(filter);这里类似grep -v

所以提取比对到参考序列的结果:

samtools view -b -h -F 4 *.bam > mapped.bam

F意思为过滤掉以4为标签的序列

提取双端序列都比对到参考序列(4+8)的结果

samtools view -bF 12 *.bam > mapped.bam

3.bam2fastq

bamToFastq -bam file_unmapped.bam -fq1 unmappedR1.fastq -fq2 unmappedR2.fastq

参考文献:http://blog.sina.com.cn/s/blog_9fe4fc830102x7s6.html

https://www.cnblogs.com/leezx/p/8655086.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容