更新版 | 共线性!WGDI 一键搞定 - ColinearScan 改进版!

共线性分析

作为王希胤老师课题组的学生,共线性相关分析上,一直没有提出更方便或深刻的方法,着实有点儿惭愧。王老师是共线性分析软件ColinearScan的第一作者和MCscan的重要作者。在我们课题组内,常常用的还是Colinearscan。总的来说,两个软件目前都有一定的用户。
MCScanColinearscan在共线性区块的提取上有细微差别,具体效果上,各有优劣。两个软件都是基于动态规划来实现共线性区块提取,而主要区别在于对同源基因对的具体判别。

  • Colinearscan 的筛选规则是:一个基因相对另一个基因组同源基因的数量限制(repeat_number的参数,blast结果的过滤)。
  • MCscan 的筛选规则是:任意两条染色体间(即点图中的一个小方块内部),一个基因相对另外一套染色体上的基因个数(默认为5,主要到 MCscan读取的是所有比对结果,并无类似repeat_number的过滤参数)。
  • 具体体现到结果上,ColinearScan 提取的是前面点图中看到的片段,古老加倍的片段常常不如 MCscan 的完整。 MCscan 能够提取到更古老的片段,但会有较多不准确的片段被提取。


使用 wgdi (改进版的 ColinearScan)

获取参数配置

wgdi -icl ? >> total.conf

wgdi是改进后colinearscan程序,python编写,不需要c环境(有些慢)。

wgdi -icl >> total.conf

修改配置文件

vim total.conf
[collinearity]
gff1 = Grape.gff
gff2 = Grape.gff
lens1 = Grape.len
lens2 = Grape.len
blast = Grape.blastp
blast_reverse = False
evalue = 1e-5
score = 100
grading = 50,40,25
mg = 40,40
repeat_number = 20
positon = order
savefile = collinearity file

注意到,最近wgdi更新了,增加了process参数,支持多线程!
结果如下

写在最后

好的软件,总是持续更新。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容