Racon三代数据纠错2021-01-19

使用minimap2将三代数据比对到基因组,再使用racon纠错。做3次。

一、软件安装

minimap2安装:直接github上下载make安装。
https://github.com/lh3/minimap2

racon使用conda install -c bioconda racon racon 安装。
也可以直接安装。

二、将fasta比对到基因组

先建立索引,在比对。
x :非常中要的一个选项,软件预测的一些值,针对不同的数据选择不同的值
map-pb/map-ont: pb或者ont数据与参考序列比对;
ava-pb/ava-ont: 寻找pd数据或者ont数据之间的overlap关系;
asm5/asm10/asm20: 拼接结果与参考序列进行比对,适合~0.1/1/5% 序列分歧度;
splice: 长reads的切割比对
sr: 短reads比对
-d :创建索引文件名
-a :指定输出格式为sa格式,默认为PAF
-Q :sam文件中不输出碱基质量
-R :reads Group信息,与bwa比对中的-R一致
-t:线程数,默认为3

minimap2 -d ref1.mmi ../assemble/prefix.ctg.fa       # indexing
minimap2 -ax map-pb   -t 8  ref1.mmi ../data/pb.fasta.gz > map1.sam      # aligment

三、使用racon纠错

racon -t 8 ../data/pb.fasta.gz map1.sam prefix.ctg.fa > prefix1.fa

polish做三次

#fist polish
minimap2 -d ref1.mmi ../assemble/prefix.ctg.fa
minimap2 -ax map-pb -t 8  ref1.mmi ../data/pb.fasta.gz > map1.sam
racon -t 8 ../data/pb.fasta.gz map1.sam ../assemble/prefix.ctg.fa > prefix1.fa
# second polish
minimap2 -d ref2.mmi prefix1.fa
minimap2 -ax map-pb -t 8  ref2.mmi ../data/pb.fasta.gz > map2.sam
racon -t 8 ../data/pb.fasta.gz map2.sam  prefix1.fa  > prefix2.fa
# third polish
minimap2 -d ref3.mmi prefix2.fa
minimap2 -ax map-pb -t 8  ref3.mmi ../data/pb.fasta.gz > map3.sam
racon -t 8 ../data/pb.fasta.gz map3.sam  prefix2.fa  > prefix3.fa

参考
https://github.com/lh3/minimap2
https://zhuanlan.zhihu.com/p/92701077?from_voters_page=true
https://blog.csdn.net/u012110870/article/details/82500726

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 三代测序数据简单分析 原创 saber universebiologygirl 简单介绍: 三代测序技术读长较长,...
    天明豆豆阅读 10,923评论 1 17
  • 组学工具合集 整理了一些目前知道的与组学相关的工具,可能不全面,欢迎补充 基因组学 一代组装 Celera Ass...
    Boer223阅读 9,460评论 3 68
  • SVIM 可基于long reads(pacbio, ONT,HIFI)进行call SV,deletion, i...
    斩毛毛阅读 2,582评论 1 6
  • 作者:Aron审稿:童蒙编辑:amethyst 引言 长读长测序技术的突破使得转录本结构鉴定、可变剪切等分析更为准...
    生信阿拉丁阅读 7,599评论 0 14
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,753评论 0 5