使用hisat2开始分析

1.构建索引

$HISAT2_HOME/hisat2-build $HISAT2_HOME/example/reference/22_20-21M.fa \

--snp $HISAT2_HOME/example/reference/22_20-21M.snp 22_20-21M_snp

2.序列比对

a单端序列

$HISAT2_HOME/hisat2 -f \

-x $HISAT2_HOME/example/index/22_20-21M_snp \

-U HISAT2_HOME/example/reads/reads_1.fa \

-S eg1.sam

b双端序列

$HISAT2_HOME/hisat2 -f \

-x $HISAT2_HOME/example/index/22_20-21M_snp \

-1 $HISAT2_HOME/example/reads/reads_1.fa \

-2 $HISAT2_HOME/example/reads/reads_2.fa \

-S eg2.sam

3.使用SAMtools/BCFtools进行下游分析

SAMtools是一组用于操作和分析SAM和BAM比对文件的工具。BCFtools是一组用于calls变异和操作VCF和BCF文件的工具,它通常与SAMtools一起发布。同时使用这些工具允许您操作从SAM格式的比对到VCF格式的calls变异。本示例假设已经安装了samtools和bcftools,并且包含这些二进制文件的目录位于PATH环境变量中。

双端序列比对

$HISAT2_HOME/hisat -f \

-x $HISAT2_HOME/example/index/22_20-21M_snp \

-1 $HISAT2_HOME/example/reads/reads_1.fa \

-2 $HISAT2_HOME/example/reads/reads_2.fa \

-S eg2.sam

b SAM文件转化为BAM文件

samtools view -bS eg2.sam > eg2.bam

将原始BAM文件转化为排序过的sorted BAM文件

samtools sort eg2.bam -o eg2.sorted.bam

我们现在有一个已排序的BAM文件,名为eg2.sord.bam。bam文件是一种有用的格式,因为比对内容是(a)压缩的,这便于长期存储,(b)是排过序的,这便于calls变异。要生成calls变异的VCF格式文件,请运行:

samtools mpileup -uf $HISAT2_HOME/example/reference/22_20-21M.fa eg2.sorted.bam | bcftools view -bvcg - > eg2.raw.bcf

要查看bcf格式文件

bcftools view eg2.raw.bcf

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。