fastq fasta 序列数快速统计

fasta序列条数统计

搜索>的数量

grep -c '^>' name.fasta

#seqkit统计提取

seqkit stats name.fasta -T | grep -v file | cut -f 4

# 统计 1-100bp 范围长的序列数

cat name.fasta | seqkit seq -m 1 -M 100 | seqkit stat -T | grep -v file | cut -f 4

fastq序列条数统计

# 通常以fastq.gz格式压缩

zcat name.fastq.gz | awk 'NR%4==2{c++} END{print c}'

# 推荐下面的方法 pigz 会比gzip快10倍

pigz -dc name.fastq.gz | awk 'NR%4==2{c++} END{print c}'

# 如果不是压缩格式

cat name.fastq | awk 'NR%4==2{c++} END{print c}'

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容