Seqkit是一款专门处理fsata/q序列文件的软件。
github地址:
https://github.com/shenwei356/seqkit
下载地址:
https://bioinf.shenwei.me/seqkit/download/
选择适合自己的版本
tar -zxvf seqkit_linux_amd64.tar.gz,解压后只有一个seqkit程序。
发现有很多的功能,多到自己曾经遇到过的所有的序列处理问题(相见恨晚),从序列查看到提取序列、拆分、处理、排序等等,实在是序列处理居家必备良药,思绪两秒钟,加入自己环境变量。
这次检索到这个工具,的因为想评估一下我用Hifiasm组装出来的序列碱基数,剩下的功能几乎涉及了我能想到的所有的序列处理工作,在CSDN社区中,作者“生信宝典”几乎阐述了所有的功能(Ref1),时间原因,我就不探索了。
seqkit stat 统计序列信息
$ seqkit stats *.f{a,q}.gz #统计序列信息
$ seqkit stats *.f{a,q}.gz -T #用tab分割
$ seqkit stats *.f{a,q}.gz -a # 统计更多信息
$ seqkit stats -j 10 refseq/virual/*.fna.gz #多文件统计( -j:使用多线程)
补充37个工具:
上图参考生信宝典的帖子。
Ref1:
https://blog.csdn.net/qazplm12_3/article/details/115535361
Ref2: https://www.jianshu.com/p/471283080bd6?utm_campaign=hugo
本文使用 文章同步助手 同步