dotPlotly-Minimap2比对paf文件比对可视化

最近进行基因组共线性分析,基因组比较大,利用nucmer比对报内存,改用minimap2进行比对分析,进行可视化发现dotPlotly工具,是利用R语言写的可视化Minimap2/mummer比对输出的结果文件。麻烦点主要在于安装各种依赖的R包,
不想安装可以使用在线的shiny app,非常方便。

经过安装dotPlotly,使用下方命令,就得到了共线性图,会自动排序,调整正负方向,和mummer软件出来的图有所差别,更美观,同时也会损失正负链信息。

# -s 显示序列一致性,关上默认画黑色线,-l 显示水平线,-x 关闭互动展示
Rscript pafCoordsDotPlotly.R -i paf -o prefix -s -l -x
共线性图

dotPlotly工具的参数如下

Rscript pafCoordsDotPlotly.R -h
Usage: pafCoordsDotPlotly.R -i alignments.coords -o out [options]


Options:
-i INPUT, --input=INPUT                                                                       # 输入文件,minimap paf文件
coords file from mummer program 'show.coords' [default NULL]

-o OUTPUT, --output=OUTPUT                                                           #输出文件前缀
output filename prefix [default out]

-v, --verbose
Print out all parameter settings [default]

-q MIN-QUERY-LENGTH, --min-query-length=MIN-QUERY-LENGTH                # 最短的查询序列长度,用于过滤
filter queries with total alignments less than cutoff X bp [default 4e+05]

-m MIN-ALIGNMENT-LENGTH, --min-alignment-length=MIN-ALIGNMENT-LENGTH            #最短的比对长度
filter alignments less than cutoff X bp [default 10000]

-p PLOT-SIZE, --plot-size=PLOT-SIZE                 # 绘图图片大小
plot size X by X inches [default 15]

-l, --show-horizontal-lines                                      # 显示水平线,默认关上,建议打开
turn on horizontal lines on plot for separating scaffolds [default FALSE]

-k NUMBER-REF-CHROMOSOMES, --number-ref-chromosomes=NUMBER-REF-CHROMOSOMES              # 选择绘图时染色体数目,默认绘制所有序列
number of sorted reference chromosomes to keep [default all chromosmes]

-s, --identity                                                                           # -s 不同比对一致性显示不同的颜色,默认关上,建议打开
turn on color alignments by % identity [default FALSE]

-t, --identity-on-target                                                           # 仅对目标对比时计算一致性,可以理解为比对很好时才会计算一致性,如果加上-s 参数,那就是只有比对很好的序列会显示颜色,其他都是黑白
turn on calculation of % identity for on-target alignments only [default FALSE]

-x, --interactive-plot-off                                                         #是否打开互动展示,默认开,建议关上,打开报错
turn off production of interactive plotly [default TRUE]

-r REFERENCE-IDS, --reference-ids=REFERENCE-IDS                        #要保留的引用id列表(以逗号分隔)


comma-separated list of reference IDs to keep [default NULL]

-h, --help
Show this help message and exit

画图遇到如下报错,解决方法

报错信息  Error in ggplot(alignments) : object 'alignments' not found
解决方案: 将前12列 cut出来生成新的paf,在输入绘图

参考资料
https://github.com/tpoorten/dotPlotly

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 组学工具合集 整理了一些目前知道的与组学相关的工具,可能不全面,欢迎补充 基因组学 一代组装 Celera Ass...
    Boer223阅读 13,167评论 3 68
  • 参考地址[https://www.jianshu.com/p/9d28de3d18e6]Ka/Ks和4DTv用于分...
    wo_monic阅读 12,667评论 0 26
  • MUMmer出现的历史背景测序技术刚开始发展的时候,大家得到的序列都是单个基因的长度,所以一般都是逐个基因的比较,...
    生信师姐阅读 37,502评论 2 49
  • Minimap2是知名比对工具BWA的开发者Li Heng新开发的比对工具,它能够快速的将DNA或者mRNA序列比...
    xuzhougeng阅读 12,092评论 7 21
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 12,735评论 28 53