Seqkit:强大的序列处理工具

Seqkit是一款专门处理fsata/q序列文件的软件。

github地址:

https://github.com/shenwei356/seqkit

下载地址:

https://bioinf.shenwei.me/seqkit/download/

选择适合自己的版本

tar -zxvf seqkit_linux_amd64.tar.gz,解压后只有一个seqkit程序。

发现有很多的功能,多到自己曾经遇到过的所有的序列处理问题(相见恨晚),从序列查看到提取序列、拆分、处理、排序等等,实在是序列处理居家必备良药,思绪两秒钟,加入自己环境变量。

这次检索到这个工具,的因为想评估一下我用Hifiasm组装出来的序列碱基数,剩下的功能几乎涉及了我能想到的所有的序列处理工作,在CSDN社区中,作者“生信宝典”几乎阐述了所有的功能(Ref1),时间原因,我就不探索了。

seqkit stat 统计序列信息

$ seqkit stats *.f{a,q}.gz #统计序列信息

$ seqkit stats *.f{a,q}.gz -T #tab分割

$ seqkit stats *.f{a,q}.gz -a # 统计更多信息

$ seqkit stats -j 10 refseq/virual/*.fna.gz #多文件统计( -j:使用多线程)

补充37个工具:

上图参考生信宝典的帖子。

Ref1

https://blog.csdn.net/qazplm12_3/article/details/115535361

Ref2 https://www.jianshu.com/p/471283080bd6?utm_campaign=hugo

本文使用 文章同步助手 同步

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容