eggNOG数据库本地化-20250915

准备在线跑的,结果线上在维护,无奈,开始本地化

配置环境

conda create-n eggnogv2.1.13

conda activate eggnogv2.1.13

使用conda安装

conda install bioconda::eggnog-mapper

很好,没有报错

download_eggnog_data.py -f --data_dir database/eggNOG/ -d 2 --dbname 'Bacteria'   好了,报错了,下载不下来

报错截图

使用wget直接去网站上下载数据库(5.0.2)

wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/eggnog.db.gz

wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/eggnog.taxa.tar.gz

wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/eggnog_proteins.dmnd.gz

wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/mmseqs.tar.gz

wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/pfam.tar.gz

解压文件

gzip -d eggnog.db.gz

tar -zxvf eggnog.taxa.tar.gz 

gzip -d eggnog_proteins.dmnd.gz

tar -zxvf mmseqs.tar.gz #不用这个数据库的话可以不下载

tar -zxvf pfam.tar.gz #不用这个数据库的话可以不下载

使用diamond进行数据库比对

emapper.py -m diamond         #选择的注释方法{diamond,mmseqs,hmmer,no_search,cache,novel_fams}

-i PA1.faa  #你的文件,可以是基因组、氨基酸序列、核苷酸序列,如果是核苷酸序列需要加上--translate参数

--itype proteins  #{CDS,proteins,genome,metagenome}

--cpu 20  #说明你的序列内容

--data_dir /mnt/disk1_1000g/lishasha/project/obs_DATA/database/eggNOG   #eggnog数据库存放位置

--dmnd_db /mnt/disk1_1000g/lishasha/project/obs_DATA/database/eggNOG/eggnog_proteins.dmnd  #比对数据库路径

--output_dir PA1  #输出到哪个文件夹(必须是已有文件夹,否则会报错)

-o PA1 #结果文件前缀,必须要有的参数

--evalue 0.00001

--excel

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容