对蛋白质序列进行信息注释2022-09-28

准备资料

  1. eggNOG 数据库
  2. 蛋白序列文件
  3. 用于比对、注释的脚本:emapper.py
  4. 用于提取注释信息的脚本:gene2anno.py

运行步骤

第0步:新建一个文件夹

mkdir work928 cd work928

第一步:拷贝蛋白序列文件和注释脚本到该新建文件夹下:

cp ../目录/蛋白文件.faa ./
cp ../目录/memapper.py ./
cp ../目录/gene2anno.py ./

第二步:运行 emapper.py 进行比对和注释

emapper.py -i [蛋白文件.faa] --output [输出文件名] --database bact --data_dir /bioinfo/database/eggNOG/eggnogdb.embl.de/download/emapperdb-4.5.1 --cpu 2(增加cpu数目可以加快程序运行)
#如果比对时间长,可以使用nohop 命令行 &进入后台运行
输出结果显示

第三步: 提取所需注释信息:

gene2anno.py -table 蛋白文件.emapper.annotations -colGeneID 1 -colAnno 6 -output xxx;
gene2anno.py -table 蛋白文件.emapperll.annotations -colGeneID 1 -colAnno 7 -output  xxx;

查看输出文件内容


效果显示
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容