bedtools的一个报错:Received illegal bin number xxxxx from getBin call

$ bedtools intersect -a SRR369xxxx.bed -b HC_gene.bed -wa
ERROR: Received illegal bin number 37458 from getBin call.
ERROR: Unable to add record to tree.

Biostars上找到了原因——https://www.biostars.org/p/129072/

原来是坐标数值太大(也可以说是基因组size太大),超过了536,870,912 = 2**29,差不多是512Mb。至于为什么是512Mb,这个问题太底层了(跟建立索引 / index有关),我暂时还不清楚。此外,我之前在做一些比对的时候,也碰到过参考基因组的染色体超过了512Mb时,会拆成两段chr_parts的情况,否则以sam/bam为out.file的比对软件都不可用。

解决的方法我知道的有两个,一是降低bedtools的版本(如2.17.0),另一个是换软件(如BEDOPS)。

前面那个bedtools的版本是

$ bedtools --version
bedtools v2.27.1-9-g5f83cac

$ which bedtools
~/mysoft/bedtools2/bin/bedtools

现在用conda装一个低版本的

~/miniconda3/bin/conda install bedtools=2.17.0
# =2.17.0指定安装版本

$ ~/miniconda3/bin/bedtools --version
bedtools v2.17.0

这回没有报错了

$ ~/miniconda3/bin/bedtools intersect -a SRR119xxxx.bed -b HC_gene.bed -wa
chr4A   702339777   702340323
chr7A   29110342    29111558

另一种解决办法是换用BEDOPS,这是一款和bedtools很相似的软件,也可以用来处理基因组特征文件。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • wes定义: 全外显子组测序,是利用目标序列捕获技术, 将全基因组编码基因外显子区域的DNA捕获并富集后,进行高通...
    凤凰_0949阅读 9,931评论 0 7
  • 一、在任意文件夹下面创建形如 1/2/3/4/5/6/7/8/9 格式的文件夹系列。 mkdir –p 1/2/3...
    Hocchan_7阅读 9,679评论 1 50
  • 转自:https://blog.csdn.net/sinat_38163598/article/details/7...
    简单点lili阅读 9,781评论 0 9
  • 转录组学习一(软件安装) 转录组学习二(数据下载) 转录组学习三(数据质控) 转录组学习四(参考基因组及gt...
    Dawn_WangTP阅读 27,883评论 0 39
  • “有这样一种场景是最近经常浮现的,一间很棒的民宿,房子不是很大,挑高的设计,木质楼梯,柔软的地毯,落地窗旁有一个吊...
    妖精的旧口袋阅读 1,625评论 0 0