基因功能注释

1.InterPro注释

InterPro数据库简介

Interpro是EBI开发的一个整合的蛋白家族功能注释数据库,包括Gene3D、CDD、Pfam等10几个数据库,官网链接
这里主要介绍下linux 下运行InterProScan5来进行基因功能和注释,软件说明。User documentation 有详细的教程。软件的安装主要分两步进行:

  • 1 下载地址 ftp://ftp.ebi.ac.uk/pub/software/unix/iprscan/5/ ,根据你的linux版本和发布日期来选择最适版本,软件很大最近版大约9.1G。建议下载完成后用 md5 -c 进行check再解压安装。
  • 2 构建本地PANHTER(Protein ANalysis THrough Evolutionary Relationships) 数据库,该数据库是 Gene Ontology Phylogenetic Annotation Project 的一部分。需要下载并解压到软件安装目录下的 /path of interproscan/data/ ,下载地址 ,根据需要选择需要下载的版本。同样建议下载完成后用 md5 -c 进行check再解压。软件本身自带了很多数据库,不需要安装,有CDD,COILS,Gene3D,HAMAP,MobiDBLite,PANTHER,Pfam,PIRSF,PRINTS,ProDom,PROSITEPATTERNS,PROSITEPROFILES,SFLD,SMART,SUPERFAMILY,TIGRFAM。
  • 3 软件的运行依赖java11 python3,可以再自己的环境变量里面添加,也可以修改软件的配置文件interproscan.properties。运行 interproscan.sh 测试是否成功安装,弹出help界面就是成功安装啦。


    11.png

2.NR注释

3.Swissprot注释

4.KEGG && GO注释

5.Pfam注释

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。