-
建立比对数据库
makeblastdb -in Ms.Unigene.fa -dbtype nucl -parse_seqids -out Msrna '##建立比对数据库
-in 数据来源fasta 格式,
-dbtype 数据库类型, nucl 代表核酸 prot为蛋白质
-parse_seqids 用途不明,建议加上,
-out 数据库名称
执行上述代码后将生成后缀为nin,nhr,nsq,nsi,nsd,nog六个文件,至此,自定义搜索库文件生成完成
开始blast
blast程序的基本格式
blast* -query [filename,输入文件名] -db [dbname数据库名称] -out [outputfilename输出文件名]
-query 比对序列文件,必须是fasta格式
-db 格式化好的数据库名称,需要先建库
-out 输出到文件
-outfmt # 输出文件格式;
0 = pairwise,
1 = query-anchored showing identities,
2 = query-anchored no identities,
3 = flat query-anchored, show identities,
4 = flat query-anchored, no identities,
5 = XML Blast output,
6 = tabular,
7 = tabular with comment lines,
8 = Text ASN.1,
9 = Binary ASN.1
10 = Comma-separated values
-perc_identity # 指定结果中perc_identity 的范围
-evalue 1e-5 #指定筛选标准,超过指定evalue值的数据被舍弃,普通模式 1e-5
-num_threads #线程数,根据电脑配置量力而行
-num_descriptions# tabular格式输出结果的条数
blastn ## 核酸比对
blastp ## 蛋白比对
blastx ## 用核酸序列比对蛋白数据库
tblastn## 蛋白序列对核酸库的比对,现将核酸库翻译成蛋白库,再将蛋白序列与翻译后的蛋白库进行比对。
tblastx## 核酸与核酸数据库在蛋白质水平比较
短序列比对
blastn -task blastn-short -db Zea_mays.B73_RefGen_v4.dna.toplevel.fa -query primer.txt -word_size 7 -evalue 1 -out uniprimer.txt
短序列比对,不用-dbtype 及-parse_seqids
-task 指定任务类型,这里需要指定为blastn-short
-word_size 这里设为7
-evalue 指定筛选标准,这里设为1,因为短序列的e值一般会较大