使用minimap2将三代数据比对到基因组,再使用racon纠错。做3次。
一、软件安装
minimap2安装:直接github上下载make安装。
https://github.com/lh3/minimap2
racon使用conda install -c bioconda racon racon 安装。
也可以直接安装。
二、将fasta比对到基因组
先建立索引,在比对。
x :非常中要的一个选项,软件预测的一些值,针对不同的数据选择不同的值
map-pb/map-ont: pb或者ont数据与参考序列比对;
ava-pb/ava-ont: 寻找pd数据或者ont数据之间的overlap关系;
asm5/asm10/asm20: 拼接结果与参考序列进行比对,适合~0.1/1/5% 序列分歧度;
splice: 长reads的切割比对
sr: 短reads比对
-d :创建索引文件名
-a :指定输出格式为sa格式,默认为PAF
-Q :sam文件中不输出碱基质量
-R :reads Group信息,与bwa比对中的-R一致
-t:线程数,默认为3
minimap2 -d ref1.mmi ../assemble/prefix.ctg.fa # indexing
minimap2 -ax map-pb -t 8 ref1.mmi ../data/pb.fasta.gz > map1.sam # aligment
三、使用racon纠错
racon -t 8 ../data/pb.fasta.gz map1.sam prefix.ctg.fa > prefix1.fa
polish做三次
#fist polish
minimap2 -d ref1.mmi ../assemble/prefix.ctg.fa
minimap2 -ax map-pb -t 8 ref1.mmi ../data/pb.fasta.gz > map1.sam
racon -t 8 ../data/pb.fasta.gz map1.sam ../assemble/prefix.ctg.fa > prefix1.fa
# second polish
minimap2 -d ref2.mmi prefix1.fa
minimap2 -ax map-pb -t 8 ref2.mmi ../data/pb.fasta.gz > map2.sam
racon -t 8 ../data/pb.fasta.gz map2.sam prefix1.fa > prefix2.fa
# third polish
minimap2 -d ref3.mmi prefix2.fa
minimap2 -ax map-pb -t 8 ref3.mmi ../data/pb.fasta.gz > map3.sam
racon -t 8 ../data/pb.fasta.gz map3.sam prefix2.fa > prefix3.fa
参考
https://github.com/lh3/minimap2
https://zhuanlan.zhihu.com/p/92701077?from_voters_page=true
https://blog.csdn.net/u012110870/article/details/82500726