在上一步确定好候选区间后,需要找到候选区间内的基因,即候选区间和参考基因组取交集,用到的工具是bedtools。
关于bedtools的详细用法,推荐这篇文章,介绍的很详细,需要的自取:
https://www.jieandze1314.com/post/cnposts/151/
0.下载安装
各版本的安装包下载链接:https://github.com/arq5x/bedtools2/releases
$ tar xvf bedtools-2.25.0.tar.gz
# 进入目录
$ cd /your/path/bedtools2
#安装
$ make
bedtools现在不太好装,推荐用conda解决。
1.准备区间位置文件
11.GWAS:确定候选区间 - 简书 (jianshu.com)
将上一步计算得到的候选基因区间整理为.pos文件,格式如下:
其中第一列为染色体,第二列为区间起始位置,第三列为区间终止位置。
2.对位置文件和gff文件进行排序
bedtools的输入文件必须先进行排序再计算,否则会报错:
$ cd ~/bedtools2-2.25.0/bin
$ bedtools sort -chrThenSizeA -i candi_range.pos > candi_range_sort.pos
$ bedtools sort -chrThenSizeA -i genome.gff3 > genome_sort.gff3
3.在基因组范围内查找候选区间中的候选基因
$ ./bedtools intersect -a candi_range_sort.pos -b Cmo_sort.gff3 -wb > candi_gene.pos
查看结果:
引用转载请注明出处,如有错误敬请指出。