JELLYFISH简介及使用


软件简介

功能

  1. 统计并筛选DNA序列中k-mers的数目,输出的结果为二进制文件,能够使用jellyfish dump转换成文本文件。
  2. 最终得到将所有reads打断为长度为k的fasta文件,从而应用于后续的序列组装。

官网

  • 部分用户需翻墙

GitHub主页

帮助文档


软件使用

软件的帮助信息

Usage: jellyfish <cmd> [options] arg...
Where <cmd> is one of: count, bc, info, stats, histo, dump, merge, query, cite, mem, jf.
Options:
  --version        Display version
  --help           Display this message

示例

#统计both.fa中将k-mer设为31时所生成的reads的数目。其中:-t表示线程数;-m表示所设定的k-mer大小;-s表示所生成的哈希表的大小;--cannonical表示规范化。默认将结果输出到mer_counts.jf,重定向使用-o参数。
jellyfish count -t 10 -m 31 -s 4000465651  --canonical  both.fa

#将k-mer的序列输出到文件jellyfish.kmers.fa中。在fa文件中,头部为总的k-mer的数目,其它的都未每个k-mer的reads出现的次数。-L用来指定过滤掉的最低频率,-U用来制定过滤掉的最高频率。
jellyfish dump -L 2 mer_counts.jf > jellyfish.kmers.fa

#输出k-mer频率的直方图到*.histo文件
jellyfish histo -t 10 -o jellyfish.kmers.fa.histo mer_counts.jf

其它语言的接口

python

#! /usr/bin/env python

import jellyfish
import sys

mf = jellyfish.ReadMerFile(sys.argv[1])
for mer, count in mf:
    print("%s %d" % (mer, count))

perl

#! /usr/bin/env perl

use jellyfish;

my $mf = jellyfish::ReadMerFile->new($ARGV[0]);
while($mf->next_mer) {
  print($mf->mer, " ", $mf->count, "\n");
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容