本文就以生信小白的角度,简述bowtie2的下载、安装及使用。关于bowtie2的使用教程非常丰富,具体的概念本文不再赘述,只对操作过程进行简(xi)简(zhi)单(ru)单(wei)的介绍,希望对同样的初学者提供一些帮助。
我是使用Mac终端连接服务器环境下使用的。
下载及安装
起初我是在服务器环境下使用 wget+链接 下载软件,运行时发现安装失败。
于是在服务器里下载miniconda,并添加了bioconda镜像。(conda安装教程https://www.jianshu.com/p/edaa744ea47d)。conda环境下输入conda iinstall gatk bowtie2。检索结果输入y。
在miniconda/bin目录下输入ls,可以看到bowtie2,输入 ./bowtie2 -help,出现help说明软件就可以用了。
使用
序列数据
我已经把需要比对的序列和参考基因组上传服务器了。read 目录下是我的测序文件a_0.fq、 a_20.fq 和 a_60.fq,ref 目录下是我的参考基因组 Tas.V1.genome.fa
建索引
进入ref目录。输入bowtie2-build Tsa.v1.genome.fa(参考基因组) Tas(输出文件名前缀)
需要一段时间,我170M的基因组大概1分钟多时间。完成后会获得6个 .bt2后缀的文件,如下,说明索引建立成功。
序列比对
这里的参数较多,选取主要的使用即可。通常测序文件是双端的,这里我的是序列是单端,所以使用的参数也不同。首先是双端序列(我没跑双端,结果就不呈现了),单端序列结果如下。
进入read目录下输入:
双端:$ bowtie2 -x ../ref/Tsa(索引所在目录,因为在上一级,所以使用../) -1 read1_1.fq(第一端) -2 read1_2.fq(第二端) -S read1.sam(指定输出文件名)
单端:$ bowtie2 -x ../ref/Tsa(索引所在目录) -U a_0.fq(第一端) -S a_0_Tsa.sam(指定输出文件名)
初步结果显示,a_0.fp 文件中有172333条序列,其中只有8.79%的序列比对到参考基因组上。
以此类推,我获得了其余两个序列的sam文件。
参考及其感谢
hsy_hzauer https://www.jianshu.com/u/49bcf3035565
卖萌哥 conda的安装与使用(最新版):https://www.jianshu.com/p/edaa744ea47d
郭威 序列比对软件bowtie2--快速入门:https://v.qq.com/x/page/m0846mwp8cl.html