今天根据NC大作1143份籼稻测序数据进行callsnp操作记录
1-下载SRA文件
prefetch --option-file SRR_Acc_List.all.txt
有时候我们选择用迅雷下载时需要添加后缀
for file in SRR*;do mv $file $file".sra";done
2-解压sra文件
for file in SRR*;do fasterq-dump -e 30 -b 100MB -c 200MB -m 2000MB --split-3 $file;done
3-生成bam文件
bwa mem -t 10 nip_all.chrs.con.fasta sra1_1.fastq sra1_2.fastq | samtools view -bS -@ 10 -o sra1.bam
4-排序
for file in *.bam;do samtools sort $file -@ 5 -o $file"sorted.bam";done
5-callsnp
bcftools mpileup -Ou -f nip_all.chrs.con.fasta sra1.sorted.bam | bcftools call -vm -Oz -o sra1.sorted.bam.vcf.gz
6-合并vcf文件
建立索引 bcftools index sra1.sorted.bam.vcf.gz
合并 bcftools merge *vcf.gz -Oz -o merged.vcf.gz
最终结果包含了SNP和Indel信息。