bedtools shuffle 迷思

bedtools shuffle 的目的是保持每个 interval 的总长,随机变换所有 inerval 的位置,结果可以作为一种随机背景。-chrom 参数将随机重分配限定在原来的染色体上,可能有助于一些原本就在各个染色体上分布有差异的样本得到更「公正」的结果,或换言之更关注每条染色体之间的差异,然:

对一堆 ChIP-seq peak bed 文件一通操作:bedtools shuffle -chrom

发现很多 bed 文件在各种 variant 上产生了 startend 都为负的情况,之前也有人发现了这个问题 Bedtools shuffle produces gibberish when using -chrom #663 .

应该是由于 bed 文件和 基因组文件中染色体名称不同,当然是各种变体的名称

随便看一个 ChIP-seq bed 文件:

image

基因组文件:

image

所以,最终的解决办法就是,只保留 canonical 的染色体,或者不用 -chrom 这个参数。


最后,更希望有人点击我的绿鸟网站页面...

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容