一、安装ECNet
-
(一)虚拟机使用极狐网站
引用链接:
<u>https://www.jianshu.com/p/8afdd5b48e56</u>
1.在liunx中打开/etc/hosts
2.在hosts文件尾部加上地址和IP
#GitHub Start
140.82.112.3 github.com
140.82.114.4 gist.github.com
185.199.108.153 assets-cdn.github.com
185.199.108.133 raw.githubusercontent.com
185.199.108.133 gist.githubusercontent.com
185.199.108.133 cloud.githubusercontent.com
185.199.108.133 camo.githubusercontent.com
185.199.108.133 avatars.githubusercontent.com
185.199.108.133 avatars0.githubusercontent.com
185.199.108.133 avatars1.githubusercontent.com
185.199.108.133 avatars2.githubusercontent.com
185.199.108.133 avatars3.githubusercontent.com
185.199.108.133 avatars4.githubusercontent.com
185.199.108.133 avatars5.githubusercontent.com
185.199.108.133 avatars6.githubusercontent.com
185.199.108.133 avatars7.githubusercontent.com
185.199.108.133 avatars8.githubusercontent.com
#GitHub End
3.修改完映射文件,打开cmd输入
ipconfig /flushdns #刷新dns缓存
-
(二)安装ECNet
git clone https://github.com/luoyunan/ECNet.git
cd ECNet
export PYTHONPATH=$PWD:$PYTHONPATH
二、安装依赖
conda create -n python3.7 python=3.7
conda activate python3.7 #创建一个python环境
conda install cuda -c nvidia #下载CUDA
conda install pytorch==1.4.0 cudatoolkit=10.1 -c pytorch
pip install -r requirements.txt
可能出现的问题
1.conda未安装好
解决
下载conda
wgethttps://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh
Sh /home/liyumei/Anaconda3-5.2.0-Linux-x86_64.sh
【如果在安装的时候已经选择加入的话,就不需要加入环境变量,直接source】
a.在bashrc文件末尾加入环境变量
nano~/.bashrc
export PATH=~/anaconda3/bin:$PATH
b.直接运行以下命令
echo 'export PATH=~/anaconda3/bin:$PATH' >>~/.bashrc
source ~/.bashrc
查看conda版本
conda --version
2.CUDA安装
参考链接:
linux学习之——安装cuda10.1_linux安装cuda10.1
cuda 快速入门指南 (nvidia.com)
3.pip install -r requirements.txt安装问题
解决:
需要先创建requirements.txt,方法:
sudo pip freeze > requirements.txt
重新执行命令:
sudo pip install -r requirements.txt
成功:
三、运行示例脚本
CUDA_VISIBLE_DEVICES=0 python scripts/run_example.py \
--train data/RRM_single.tsv \
--fasta data/RRM.fasta \
--local_feature data/RRM.braw \
--output_dir ./output/RRM_CV \
--save_prediction \
--n_ensembles 2 \
--epochs 100
可能出现的错误
1.缺失module
解决:
pip install tqdm
或
conda install tqdm
解决:
pip install scipy
或
conda install scipy
小结:前面1、2多次缺模板,是因为requirements.txt未运行成功,需要再次运行
pip install -r requirements.txt
2.缺乏.braw文件
解决:
可以自己在网上下载之后上传进系统,
或利用已有文件自己生成,方法参考下面运行自己数据时的使用方法
3.缺乏ecnet
解决:
export PYTHONPATH=$PWD:$PYTHONPATH
四、运行自己的数据
-
(一)HHsuite
1.安装
git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
2.下载数据库
可用数据库目录
也可使用其他数据库
mkdir databases2
cd databases2
wget https://wwwuser.gwdg.de/~compbiol/data/hhsuite/databases/hhsuite_dbs/scop95_01Mar17.tgz
tar -xvzf scop95_01Mar17.tgz
(二)CCMPred
1.安装
依赖
gcc -v
cmake -version
开始安装
git clone --recursive https://github.com/soedinglab/CCMpred.git
cd CCMpred
cmake .
make
3.可能遇到的问题
1.cmake .出错
解决:缺啥下啥
sudo apt-get install pkg-config
显示缺少libcurse library,建议安装libncurses5-dev包
yum –y install libncures5-*
如果存在,
find / -name libncurses*
cmake . -DCURSES_LIBRARY=/usr/lib/libncurses.so -DCURSES_INCLUDE_PATH=/usr/include
即可解决
还剩下两个难以找到下载方法
可以自行在浏览器官网下载相应版本的压缩包,注意应下载到正确目录下
libuuid-1.0.3
tar xvfz libuuid-1.0.3.tar.gz
cd libuuid-1.0.3
./configure --prefix=/usr/local/libuuid/1_0_3
make
make install
jansson-2.11
tar xvfz jansson-2.11.tar.bz2
cd jansson-2.11
./configure
make
make check
make install
再次cmake .发现Libuuid 失败:依旧找不到,应该是cmake版本过低
参考解决方法链接
wget https://github.com/Kitware/CMake/releases/download/v3.22.3/cmake-3.22.3.tar.gz
tar -xf cmake-3.22.3.tar.gz
cd cmake-3.22.3/
/cmake-3.22.3$ ./bootstrap
/cmake-3.22.3$ make
将默认使用的cmake改为最新下载的(在cmake-3.22.3目录下)
./cmake --version #查看当前目录下的cmake版本
pwd #查看当前路径
export PATH=/home/liyumei/ECNet/CCMpred/cmake-3.22.3/bin:$PATH
source ~/.bashrc
cmake --version
或
安装cmake & 配置cmake PATH_Superstarimage
(三)运行数据
1.hhsuite
hhblits -i /home/liyumei/ECNet/example/Sequence_WT_ANEH.fasta \
-d /home/liyumei/ECNet/hh-suite/databases2/scop95 \
-o Sequence_WT_ANEH.hhr \
-oa3m Sequence_WT_ANEH.a3m \
-n 3 \
-id 99 \
-cov 50 \
-cpu 8
将hhblits的a3m输出重新格式化为PSIKOV格式
/home/liyumei/ECNet/hh-suite/scripts/reformat.pl /home/liyumei/ECNet/hh-suite/Sequence_WT_ANEH.a3m Sequence_WT_ANEH.fas -r
Python /home/liyumei/ECNet/CCMpred/scripts/convert_alignment.py Sequence_WT_ANEH.fas fasta Sequence_WT_ANEH.psc
2.CCMPred
ccmpred /home/liyumei/ECNet/Sequence_WT_ANEH.psc Sequence_WT_ANEH.mat -b Sequence_WT_ANEH.braw -d 0
3.运行自己的数据
CUDA_VISIBLE_DEVICES=0 python scripts/run_example.py \
--train /home/liyumei/ECNet/example/37_ANEH_variants.tsv \
--fasta /home/liyumei/ECNet/example/Sequence_WT_ANEH.fasta \
--local_feature /home/liyumei/ECNet/CCMpred/Sequence_WT_ANEH.braw \
--output_dir ./output/Sequence_WT_ANEH \
--save_prediction \
--n_ensembles 2 \
--epochs 100
输出文件为:
/home/liyumei/ECNet/output/Sequence_WT_ANEH/prediction.tsv
4.可能遇到的问题
1.运行hhsuite时出错
解决:应当是无法正确识别数据库文件,只需要在指明数据库命令后继续加上数据库文件夹中文件共有的前缀名即可
将
-d /home/liyumei/ECNet/hh-suite/databases2 \
改为
-d /home/liyumei/ECNet/hh-suite/databases2/scop95 \
2.运行CCMPred时出错
解决:需要把CCMpred/bin/目录下的文件:ccmpred复制到根目录下的/bin/,就可以在命令行调用ccmpred了。
Sudo cp ./bin/ccmpred /bin/ccmpred
**3.运行数据时出错
出错,输入文件(tsv)中mutation列的字符不能超过10,否则无法识别,报错
解决方法一:删除文件中无法识别的数据
解决方法二:改写脚本,此方法过于复杂,难度较高,本人没有尝试