[TOC]
1. SGA 简介
SGA (String Graph Assembler), 采用 String Grapher 的方法来进行基因组的组装。软件通过创建 FM-index/Burrows-Wheeler 索引来进行查找 short reads 之间的 overlaps, 从而进行基因组组装。
使用 SGA 的注意事项:
1 SGA 的输入文件为 fastq 文件,序列长度推荐为 100bp 及以上。较短的序列长度,则使用 De Bruijn 的方法进行组装能或得更好的基因组序列。
- 使用 SGA 进行基因组组装需要最少 40X
按照github文档安装不成功,后来想到了万能的conda,结果的确,直接安就可以了
conda install -c bioconda sga
但有时缺脚本,还是需要把附属/bin/的下来
bin下的python脚本大多为 python 2.7