准备在线跑的,结果线上在维护,无奈,开始本地化
配置环境
conda create-n eggnogv2.1.13
conda activate eggnogv2.1.13
使用conda安装
conda install bioconda::eggnog-mapper
很好,没有报错
download_eggnog_data.py -f --data_dir database/eggNOG/ -d 2 --dbname 'Bacteria' 好了,报错了,下载不下来

使用wget直接去网站上下载数据库(5.0.2)
wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/eggnog.db.gz
wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/eggnog.taxa.tar.gz
wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/eggnog_proteins.dmnd.gz
wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/mmseqs.tar.gz
wget -c http://eggnog6.embl.de/download/emapperdb-5.0.2/pfam.tar.gz
解压文件
gzip -d eggnog.db.gz
tar -zxvf eggnog.taxa.tar.gz
gzip -d eggnog_proteins.dmnd.gz
tar -zxvf mmseqs.tar.gz #不用这个数据库的话可以不下载
tar -zxvf pfam.tar.gz #不用这个数据库的话可以不下载
使用diamond进行数据库比对
emapper.py -m diamond #选择的注释方法{diamond,mmseqs,hmmer,no_search,cache,novel_fams}
-i PA1.faa #你的文件,可以是基因组、氨基酸序列、核苷酸序列,如果是核苷酸序列需要加上--translate参数
--itype proteins #{CDS,proteins,genome,metagenome}
--cpu 20 #说明你的序列内容
--data_dir /mnt/disk1_1000g/lishasha/project/obs_DATA/database/eggNOG #eggnog数据库存放位置
--dmnd_db /mnt/disk1_1000g/lishasha/project/obs_DATA/database/eggNOG/eggnog_proteins.dmnd #比对数据库路径
--output_dir PA1 #输出到哪个文件夹(必须是已有文件夹,否则会报错)
-o PA1 #结果文件前缀,必须要有的参数
--evalue 0.00001
--excel