Assemblytics, 发表在Bioinformaticshttp://www.ncbi.nlm.nih.gov/pubmed/27318204,鉴定基因组间SV。
Githup,https://github.com/marianattestad/assemblytics
同时也可以在线使用,http://assemblytics.com
Assemblytics 首先基于nucmer比对 (),然后进行过滤,获取单一比对结果,进而进行SV的检测,可检测如下SV。
其中
- 插入和缺失, <50 bp overlap or gap
- Tandem, overmap >50 bp
依赖的工具
R相关
- ggplot2
- plyr
- RColorBrewer
-scales
Python
- argparse
- numpy
从githup下载后,给权限即可运行
chmod a+x scripts/Assemblytics*
第一步 序列比对
nucmer -maxmatch -l 100 -c 500 REFERENCE.fa ASSEMBLY.fa -prefix OUT
第二步 过滤并鉴定SV
scripts/Assemblytics <delta_file> <output_prefix> <unique_anchor_length> <min_variant_size> <max_variant_size>
或者直接使用在线工具也是可以的,将比对好的结果拽入红色框中即可
主要结果
-
变异类型即数量分布图
变异结果bed文件
reference ref_start ref_stop ID size strand type ref_gap_size query_gap_size query_coordinates method
NC_000913.3 1972855 1978502 Assemblytics_b_1 5647 + Deletion 5647 0 NZ_CP009685.1:1721649-1721649:+ between_alignments
NC_000913.3 1873031 1873039 Assemblytics_b_2 777 + Insertion -8 769 NZ_CP009685.1:1821473-1822242:+ between_alignments
NC_000913.3 1096961 1097583 Assemblytics_b_3 181 + Tandem_expansion -622 -441 NZ_CP009685.1:2597877-2598318:- between_alignments
NC_000913.3 4295948 4296271 Assemblytics_b_5 113 + Tandem_contraction -323 -436 NZ_CP009685.1:4040722-4041158:- between_alignments