1.View
samtools view -bS abc.sam > abc.bam
samtools view -b -q 20 abc.bam > abc.q20.bam
-b bam 输出bam
-S sam 输入sam
-@ 线程
-q 20 筛选mapping quality > 20
-F 数字 筛选:Explain SAM Flags do not show reads with flags containing any of these values
samtoools view -F 4 bam > sam 去除unmapped
# 去除unmapped前:
# 去除unmapped前:
ref:sam文件解读 - 简书
2.Sort
samtools sort abc.bam abc.sort
samtools sort -@ 5 SRR1909070.bam -T SRR1909070.sorted
可以用:
samtools sort --threads 10 -m 2G -o Tumor-2.bam Tumor-2.sam
-m 500M或1G 每个线程使用的最大内存
-@ 线程
可以用?
samtools view -@ 5 -bS xxx.sam | samtools sort -@ 5 > xxx.sorted.bam
3.merge
samtools merge -@ 5 out.bam 1.bam 2.bam
4.index
samtools index abc.sort.bam
5.faidx:对基因组文件建立索引
samtools faidx genome.fasta
6.flagstat:给出BAM文件的比对结果
比对率97.15%
samtools flagstat -@ 20 T-2.sam
emmm
参考1
参考2
例二
samtools flagstat -@ 20 T-3.sam
例二
图片发自简书App
图片发自简书App
7.depth
8.rmdup
samtools rmdup input.sorted.bam output.bam