gff格式与gtf格式转换——NBISweden / AGAT

在上一篇文章中,介绍了利用gffread进行gff和gtf的格式转换,但是会丢失一些信息,比如UTR,因此这篇文章将介绍另一种方法,AGAT。
gff格式与gtf格式转换——gffread - 简书 (jianshu.com)

NBISweden / AGAT是一款可以处理gff/gtf文件中基因注释的工具,有能力检查、修复、填充任何类型的GTF和GFF的缺失信息,以创建完整的排序和标准化的gff3格式。

官网:
https://github.com/NBISweden/AGAT#update-agat

1.下载安装

依赖环境:

  • R
  • Perl >= 5.8
  • Perl modules

1.1 方法一:Docker

# get the chosen AGAT container version
$ docker pull quay.io/biocontainers/agat:0.8.0--pl5262hdfd78af_0

1.2 方法二:Singularity

# get the chosen AGAT container version
$ singularity pull docker://quay.io/biocontainers/agat:0.8.0--pl5262hdfd78af_0 

1.3 方法三:Bioconda (我是用的这个方法)

创建新的虚拟环境:

$ conda create -p /your/path/AGAT_env

激活新环境:

$ conda activate /your/path/AGAT_env

安装依赖环境:

$ conda install perl-bioperl perl-clone perl-graph perl-lwp-simple perl-json perl-carp perl-sort-naturally perl-file-share perl-file-sharedir-install perl-moose

安装:

$ conda install -c bioconda agat

1.4 方法四:Clone

$ git clone https://github.com/NBISweden/AGAT.git
$ cd ~/AGAT
$ perl Makefile.PL 
$ make
$ make test 
$ make install

2. 主要功能

2.1 检查,修复,填充缺失的信息到排序和标准化的gff3中

$ cd ~/AGAT/bin
$ agat_convert_sp_gxf2gxf.pl -gff CE10g_v2.0.gff3 

3.2 格式转换

具体命令参加下表:


3.2.1 gff3转gtf
$ cd ~/AGAT/bin
$ agat_convert_sp_gff2gtf.pl -gff CE10g_v2.0.gff3 -o CE10g_v2.0.gtf
3.2.2 对比gffread和AGAT转出gft文件

gffread:可以看到UTR和gene都丢失了



AGAT:完整的信息


3.3 执行多种任务

引用转载请注明出处,如有错误敬请指出。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容