生信小白——初学 bowtie2

本文就以生信小白的角度,简述bowtie2的下载、安装及使用。关于bowtie2的使用教程非常丰富,具体的概念本文不再赘述,只对操作过程进行简(xi)简(zhi)单(ru)单(wei)的介绍,希望对同样的初学者提供一些帮助。

我是使用Mac终端连接服务器环境下使用的。


下载及安装

起初我是在服务器环境下使用 wget+链接 下载软件,运行时发现安装失败。

就是这样,安装失败

于是在服务器里下载miniconda,并添加了bioconda镜像。(conda安装教程https://www.jianshu.com/p/edaa744ea47d)。conda环境下输入conda iinstall gatk bowtie2。检索结果输入y。

检索后输入“y”

在miniconda/bin目录下输入ls,可以看到bowtie2,输入 ./bowtie2 -help,出现help说明软件就可以用了。

安装成功

使用

序列数据

我已经把需要比对的序列和参考基因组上传服务器了。read 目录下是我的测序文件a_0.fq、 a_20.fq 和 a_60.fq,ref 目录下是我的参考基因组 Tas.V1.genome.fa

read目录下是我测序获得的三条序列,ref目录下是我的参考基因组

建索引

进入ref目录。输入bowtie2-build Tsa.v1.genome.fa(参考基因组) Tas(输出文件名前缀)

建索引

需要一段时间,我170M的基因组大概1分钟多时间。完成后会获得6个 .bt2后缀的文件,如下,说明索引建立成功。

获得索引文件

序列比对

这里的参数较多,选取主要的使用即可。通常测序文件是双端的,这里我的是序列是单端,所以使用的参数也不同。首先是双端序列(我没跑双端,结果就不呈现了),单端序列结果如下。

进入read目录下输入:

双端:$ bowtie2 -x ../ref/Tsa(索引所在目录,因为在上一级,所以使用../) -1 read1_1.fq(第一端) -2 read1_2.fq(第二端) -S read1.sam(指定输出文件名)

双端序列

单端:$ bowtie2 -x ../ref/Tsa(索引所在目录) -U a_0.fq(第一端) -S a_0_Tsa.sam(指定输出文件名)

单端序列

初步结果显示,a_0.fp 文件中有172333条序列,其中只有8.79%的序列比对到参考基因组上。

比对结果

以此类推,我获得了其余两个序列的sam文件。

获得三个序列的sam文件


参考及其感谢

hsy_hzauer  https://www.jianshu.com/u/49bcf3035565

卖萌哥    conda的安装与使用(最新版):https://www.jianshu.com/p/edaa744ea47d

郭威    序列比对软件bowtie2--快速入门:https://v.qq.com/x/page/m0846mwp8cl.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容