感觉真坑。每次用这个软件都忘记怎么用,看帮助文档,查中文资料都不对。。。
目前只用了建立索引和比对俩个功能
1 建索引
gmap_build -D ./ -d genome_index_file_name genome.fa
-D 指定建立索引的文件夹的位置,我就放在当前目录了
-d 指定建立索引的文件夹的名字
再接上参考基因组文件
这步骤花费时间较长,应该nohup运行。
2 比对
比对就简单了。无非是需要索引文件,要比的序列文件,序列文件得是fasta格式
gmap -t 10 -D ./ -d ./genome_index_file_name -f 1 test.fa > mapping_1
-t 线程数
-D 和上面一样
-d 和上面一样
-f 是输出文件得格式,有1到9好几个,具体你用哪个你看看帮助
最后是你要比对的fasta序列文件。
-f, --format=INT Other format for output (also note the -A and -S options
and other options listed under Output types):
psl (or 1) = PSL (BLAT) format,
gff3_gene (or 2) = GFF3 gene format,
gff3_match_cdna (or 3) = GFF3 cDNA_match format,
gff3_match_est (or 4) = GFF3 EST_match format,
splicesites (or 6) = splicesites output (for GSNAP splicing file),
introns = introns output (for GSNAP splicing file),
map_exons (or 7) = IIT FASTA exon map format,
map_ranges (or 8) = IIT FASTA range map format,
coords (or 9) = coords in table format,
sampe = SAM format (setting paired_read bit in flag),
samse = SAM format (without setting paired_read bit)
参考资料:
http://research-pub.gene.com/gmap/
https://blog.csdn.net/ccArtermices/article/details/100598734