本学期在学习谈老师讲的基因组重测序数据比对和变异检测软件这一章时,我们了解到了短序列比对软件主要有以下几种:
其中,BWA和Bowtie的使用较为普遍,接下来对这两个软件的安装使用进行介绍。
一、BWA的安装使用
1、BWA的安装:
2、使用参数
-o int:允许出现的最大gap数。
-e int:每个gap允许的最大长度。
-d int:不允许在3’端出现大于多少bp的deletion。
-i int:不允许在reads两端出现大于多少bp的indel。
-l int:Read前多少个碱基作为seed,如果设置的seed大于read长度,将无法继续,最好设置在25-35,与-k 2 配合使用。
-k int:在seed中的最大编辑距离,使用默认2,与-l配合使用。
-t int:要使用的线程数。
-R int:此参数只应用于pair end中,当没有出现大于此值的最佳比对结果时,将会降低标准再次进行比对。增加这个值可以提高配对比对的准确率,但是同时会消耗更长的时间,默认是32。
-I int:表示输入的文件格式为Illumina 1.3+数据格式。
-B int:设置标记序列。从5’端开始多少个碱基作为标记序列,当-B为正值时,在比对之前会将每个read的标记序列剪切,并将此标记序列表示在BC SAM 标签里,对于pair end数据,两端的标记序列会被连接。
-b :指定输入格式为bam格式。
3、BWA简单比对(部分是在网上找的代码)
建立索引
# 建立索引可以通过子命令调用两种算法
# -is IS线性时间算法,无法处理2GB以上文件
# -Bwtsw BWT-SW中使用的算法,对于短的参考序列不工作,必须大于10Mb
$ bwa index ref.fa
例:bwa index GCA_000012525.1_ASM1252v1_genomic.fna
二、1、Bowtie的安装
2、Bowtie 简单比对
三、Bowtie和BWA的区别
BWA: 准确率高,是SNP分析的首选比对软件。
Bowtie:借着其算法上的优势,在运算速度上一
举成名。如果对速度的要求高于准确率的时候,
bowtie就成了不二选择。bowtie被广泛地应用
于ChIP-seq, RNA-seq的分析当中。