12.GWAS:候选基因挖掘

在上一步确定好候选区间后,需要找到候选区间内的基因,即候选区间和参考基因组取交集,用到的工具是bedtools。

关于bedtools的详细用法,推荐这篇文章,介绍的很详细,需要的自取:
https://www.jieandze1314.com/post/cnposts/151/

0.下载安装

各版本的安装包下载链接:https://github.com/arq5x/bedtools2/releases

$ tar xvf bedtools-2.25.0.tar.gz
# 进入目录
$ cd /your/path/bedtools2
#安装
$ make

bedtools现在不太好装,推荐用conda解决。

1.准备区间位置文件

11.GWAS:确定候选区间 - 简书 (jianshu.com)
将上一步计算得到的候选基因区间整理为.pos文件,格式如下:
其中第一列为染色体,第二列为区间起始位置,第三列为区间终止位置。

candi_range.pos

2.对位置文件和gff文件进行排序

bedtools的输入文件必须先进行排序再计算,否则会报错:

$ cd ~/bedtools2-2.25.0/bin
$ bedtools sort -chrThenSizeA -i candi_range.pos > candi_range_sort.pos
$ bedtools sort -chrThenSizeA -i genome.gff3 > genome_sort.gff3

3.在基因组范围内查找候选区间中的候选基因

$ ./bedtools intersect -a candi_range_sort.pos -b Cmo_sort.gff3 -wb > candi_gene.pos

查看结果:

candi_gene.pos

引用转载请注明出处,如有错误敬请指出。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容