parallelLastz使用初探
尝试计算一下保守性分数,但是教程推荐软件lastz不支持并行,还是得与时俱进。在谷歌里找到了一个并行的软件parallelLastz这里记录一下
以并行模式运行Lastz(https://github.com/lastz/lastz)。
当查询文件格式是fasta时,可以指定许多线程来处理它。它可以线性地减少运行时间,并使用与原始lastz程序几乎相等的内存。当你把一个大的query file 转换成一个大的参考文件时,比如人类全基因组序列,这是很有用的。
该程序是由鲍勃·哈里斯(lastz的作者)编写的原始LASTZ程序的扩展。
1下载
conda install -c jnarayan81 parallellastz
2 使用说明
--qfile|-q query multifasta/fasta file
--tfile|-t target genome file
--cfile|-c config file
--speedup|-s number of core to use
--length|-l length below this is ignored
--help|-h brief help message
后续
似乎不是很快,还是先拆分染色体再并行脚本吧