1.构建索引
$HISAT2_HOME/hisat2-build $HISAT2_HOME/example/reference/22_20-21M.fa \
--snp $HISAT2_HOME/example/reference/22_20-21M.snp 22_20-21M_snp
2.序列比对
a单端序列
$HISAT2_HOME/hisat2 -f \
-x $HISAT2_HOME/example/index/22_20-21M_snp \
-U HISAT2_HOME/example/reads/reads_1.fa \
-S eg1.sam
b双端序列
$HISAT2_HOME/hisat2 -f \
-x $HISAT2_HOME/example/index/22_20-21M_snp \
-1 $HISAT2_HOME/example/reads/reads_1.fa \
-2 $HISAT2_HOME/example/reads/reads_2.fa \
-S eg2.sam
3.使用SAMtools/BCFtools进行下游分析
SAMtools是一组用于操作和分析SAM和BAM比对文件的工具。BCFtools是一组用于calls变异和操作VCF和BCF文件的工具,它通常与SAMtools一起发布。同时使用这些工具允许您操作从SAM格式的比对到VCF格式的calls变异。本示例假设已经安装了samtools和bcftools,并且包含这些二进制文件的目录位于PATH环境变量中。
a 双端序列比对
$HISAT2_HOME/hisat -f \
-x $HISAT2_HOME/example/index/22_20-21M_snp \
-1 $HISAT2_HOME/example/reads/reads_1.fa \
-2 $HISAT2_HOME/example/reads/reads_2.fa \
-S eg2.sam
b SAM文件转化为BAM文件
samtools view -bS eg2.sam > eg2.bam
c 将原始BAM文件转化为排序过的sorted BAM文件
samtools sort eg2.bam -o eg2.sorted.bam
d 我们现在有一个已排序的BAM文件,名为eg2.sord.bam。bam文件是一种有用的格式,因为比对内容是(a)压缩的,这便于长期存储,(b)是排过序的,这便于calls变异。要生成calls变异的VCF格式文件,请运行:
samtools mpileup -uf $HISAT2_HOME/example/reference/22_20-21M.fa eg2.sorted.bam | bcftools view -bvcg - > eg2.raw.bcf
e 要查看bcf格式文件
bcftools view eg2.raw.bcf