bedtools intersect用法 (intersectBed)

bedtools intersect可以对两个基因组特征 (genomic features) 进行overlap,找到两者重合的区域。比如求两个peaks的交集,或者看很多位点信息在没在peaks或其他区域中,用这个工具非常方便快捷。


默认用法为:

bedtools intersect [OPTIONS] -a <FILE> \
                             -b <FILE1, FILE2, ..., FILEN>

或者:

intersectBed [OPTIONS] -a <FILE> \
                             -b <FILE1, FILE2, ..., FILEN>

其中a和b提供的文件为BAM/BED/GFF/VCF格式。

下边举例几种常见用法:

  1. 默认

默认情况下取两个文件的交集区域:

cat A.bed

chr1 10 20
chr1 30 40

cat B.bed

chr1 15 18

intersectBed -a A.bed -b B.bed

chr1 15 18

  1. -wa -wb参数

-wa 输出有overlap区域的原-a文件中的内容:

intersectBed -a A.bed -b B.bed -wa

输出:
chr1 10 20

-wb会输出overlap的区域和其中-b文件中的内容:

intersectBed -a A.bed -b B.bed -wb

输出:
chr1 15 18 chr1 15 18

-wa -wb 输出overlap的区域所在-a和-b中的原内容:

intersectBed -a A.bed -b B.bed -wa -wb

输出:
chr1 10 20 chr1 15 18

  1. -v 参数
    -v输出在-a参数文件中没有overlap的区域:
intersectBed -a A.bed -b B.bed -v

输出:
chr1 30 40

  1. -wo
    输出overlap的长度:
 intersectBed -a A.bed -b B.bed -wo

输出:
chr1 10 20 chr1 15 18 3

此外还有一点要注意,假如是看两个位点是否一致,这里是不可以的,比如:
C.bed:
chr1 10 10
D.bed:
chr1 11 11

intersectBed -a C.bed -b D.bed -wa -wb

输出:chr1 10 10 chr1 11 11

也就是这里会认为是overlap的。但是,C.bed和D.bed第三列分别加1,即C.bed改成chr1 10 11, D.bed改成chr1 11 12,则不会有overlap了。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、概述 BEDTools是可用于genomic features的比较,相关操作及进行注释的工具。而genomi...
    Calamy阅读 5,362评论 0 1
  • 欢迎关注天下博客:http://blog.genesino.com/2018/04/bedtools/Jump t...
    生信宝典阅读 6,671评论 0 19
  • 刘小泽写于19.10.11跟着Bioconductor的教程学习一下ChIPpeakAnno的基本流程 前言 官网...
    刘小泽阅读 7,320评论 0 11
  • 万科在作秀吗? 李文元 在“万科2018年秋季例会”上,一张有意或无意流出的会议现场照片中,赫然出现了红底...
    青山秋鸿阅读 227评论 0 0
  • 日更第52天 这世上没有谁活得比谁容易,只是有的人在呼天抢地,有的人在默默努力。 人生百味,离合悲欢,苦笑泪水,都...
    鲤佳阅读 399评论 0 0