ECNet

一、安装ECNet

  • (一)虚拟机使用极狐网站

引用链接:
<u>https://www.jianshu.com/p/8afdd5b48e56</u>
1.在liunx中打开/etc/hosts
2.在hosts文件尾部加上地址和IP

#GitHub Start
140.82.112.3 github.com
140.82.114.4 gist.github.com
185.199.108.153 assets-cdn.github.com
185.199.108.133 raw.githubusercontent.com
185.199.108.133 gist.githubusercontent.com
185.199.108.133 cloud.githubusercontent.com
185.199.108.133 camo.githubusercontent.com
185.199.108.133 avatars.githubusercontent.com 
185.199.108.133 avatars0.githubusercontent.com
185.199.108.133 avatars1.githubusercontent.com
185.199.108.133 avatars2.githubusercontent.com
185.199.108.133 avatars3.githubusercontent.com
185.199.108.133 avatars4.githubusercontent.com
185.199.108.133 avatars5.githubusercontent.com
185.199.108.133 avatars6.githubusercontent.com
185.199.108.133 avatars7.githubusercontent.com
185.199.108.133 avatars8.githubusercontent.com
#GitHub End

3.修改完映射文件,打开cmd输入

ipconfig /flushdns #刷新dns缓存
  • (二)安装ECNet

git clone https://github.com/luoyunan/ECNet.git
cd ECNet
export PYTHONPATH=$PWD:$PYTHONPATH

二、安装依赖

conda create -n python3.7 python=3.7
conda activate python3.7 #创建一个python环境
conda install cuda -c nvidia #下载CUDA
conda install pytorch==1.4.0 cudatoolkit=10.1 -c pytorch
pip install -r requirements.txt

可能出现的问题

1.conda未安装好

conda未安装好

解决
下载conda

wgethttps://repo.anaconda.com/archive/Anaconda3-5.2.0-Linux-x86_64.sh
Sh /home/liyumei/Anaconda3-5.2.0-Linux-x86_64.sh

【如果在安装的时候已经选择加入的话,就不需要加入环境变量,直接source】


按enter

选yes

a.在bashrc文件末尾加入环境变量

nano~/.bashrc
export PATH=~/anaconda3/bin:$PATH

b.直接运行以下命令

echo 'export PATH=~/anaconda3/bin:$PATH' >>~/.bashrc
source ~/.bashrc

查看conda版本

conda --version

conda安装成功

2.CUDA安装
参考链接:
linux学习之——安装cuda10.1_linux安装cuda10.1
cuda 快速入门指南 (nvidia.com)

3.pip install -r requirements.txt安装问题

解决:
需要先创建requirements.txt,方法:

sudo pip freeze > requirements.txt

重新执行命令:

sudo pip install -r requirements.txt

成功:


三、运行示例脚本

CUDA_VISIBLE_DEVICES=0 python scripts/run_example.py \
    --train data/RRM_single.tsv \
    --fasta data/RRM.fasta \
    --local_feature data/RRM.braw \
    --output_dir ./output/RRM_CV \
    --save_prediction \
    --n_ensembles 2 \
--epochs 100

可能出现的错误

1.缺失module

tqdm

解决:

pip install tqdm
或
conda install tqdm
成功

scipy

解决:

pip install scipy
或
conda install scipy

成功

小结:前面1、2多次缺模板,是因为requirements.txt未运行成功,需要再次运行

pip install -r requirements.txt

成功

2.缺乏.braw文件

解决:
可以自己在网上下载之后上传进系统,
或利用已有文件自己生成,方法参考下面运行自己数据时的使用方法

3.缺乏ecnet

解决:

export PYTHONPATH=$PWD:$PYTHONPATH

四、运行自己的数据

1.安装

git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
成功

2.下载数据库
可用数据库目录
也可使用其他数据库

可用数据库

mkdir databases2
cd databases2
wget  https://wwwuser.gwdg.de/~compbiol/data/hhsuite/databases/hhsuite_dbs/scop95_01Mar17.tgz
tar -xvzf scop95_01Mar17.tgz

(二)CCMPred

1.安装
依赖

gcc -v
cmake -version


开始安装

git clone --recursive https://github.com/soedinglab/CCMpred.git
cd CCMpred
cmake .
make
成功

3.可能遇到的问题
1.cmake .出错


解决:缺啥下啥

sudo apt-get install pkg-config
pkg-config

显示缺少libcurse library,建议安装libncurses5-dev包

yum –y install libncures5-*

如果存在,

find /  -name libncurses*
cmake . -DCURSES_LIBRARY=/usr/lib/libncurses.so -DCURSES_INCLUDE_PATH=/usr/include

即可解决


还剩下两个难以找到下载方法
可以自行在浏览器官网下载相应版本的压缩包,注意应下载到正确目录下
libuuid-1.0.3

tar xvfz libuuid-1.0.3.tar.gz
cd libuuid-1.0.3
./configure --prefix=/usr/local/libuuid/1_0_3
make
make install

jansson-2.11

tar xvfz jansson-2.11.tar.bz2
cd jansson-2.11
./configure
make
make check
make install

再次cmake .发现Libuuid 失败:依旧找不到,应该是cmake版本过低
参考解决方法链接

wget https://github.com/Kitware/CMake/releases/download/v3.22.3/cmake-3.22.3.tar.gz
tar -xf cmake-3.22.3.tar.gz
cd cmake-3.22.3/
/cmake-3.22.3$ ./bootstrap
/cmake-3.22.3$ make
成功

将默认使用的cmake改为最新下载的(在cmake-3.22.3目录下)

./cmake --version #查看当前目录下的cmake版本
pwd #查看当前路径
export PATH=/home/liyumei/ECNet/CCMpred/cmake-3.22.3/bin:$PATH
source ~/.bashrc
cmake --version

成功


安装cmake & 配置cmake PATH_Superstarimage

(三)运行数据

1.hhsuite

hhblits -i /home/liyumei/ECNet/example/Sequence_WT_ANEH.fasta \
    -d /home/liyumei/ECNet/hh-suite/databases2/scop95 \
    -o Sequence_WT_ANEH.hhr \
    -oa3m Sequence_WT_ANEH.a3m \
    -n 3 \
    -id 99 \
    -cov 50 \
    -cpu 8
成功

将hhblits的a3m输出重新格式化为PSIKOV格式

/home/liyumei/ECNet/hh-suite/scripts/reformat.pl /home/liyumei/ECNet/hh-suite/Sequence_WT_ANEH.a3m Sequence_WT_ANEH.fas -r
Python /home/liyumei/ECNet/CCMpred/scripts/convert_alignment.py Sequence_WT_ANEH.fas fasta Sequence_WT_ANEH.psc

2.CCMPred

ccmpred /home/liyumei/ECNet/Sequence_WT_ANEH.psc Sequence_WT_ANEH.mat -b Sequence_WT_ANEH.braw -d 0
成功

3.运行自己的数据

CUDA_VISIBLE_DEVICES=0 python scripts/run_example.py \
    --train /home/liyumei/ECNet/example/37_ANEH_variants.tsv \
    --fasta /home/liyumei/ECNet/example/Sequence_WT_ANEH.fasta \
    --local_feature /home/liyumei/ECNet/CCMpred/Sequence_WT_ANEH.braw \
    --output_dir ./output/Sequence_WT_ANEH \
    --save_prediction \
    --n_ensembles 2 \
--epochs 100
成功

输出文件为:
/home/liyumei/ECNet/output/Sequence_WT_ANEH/prediction.tsv


4.可能遇到的问题

1.运行hhsuite时出错


解决:应当是无法正确识别数据库文件,只需要在指明数据库命令后继续加上数据库文件夹中文件共有的前缀名即可

-d /home/liyumei/ECNet/hh-suite/databases2 \

改为

-d /home/liyumei/ECNet/hh-suite/databases2/scop95 \

2.运行CCMPred时出错


解决:需要把CCMpred/bin/目录下的文件:ccmpred复制到根目录下的/bin/,就可以在命令行调用ccmpred了。

Sudo cp ./bin/ccmpred /bin/ccmpred

**3.运行数据时出错


出错,输入文件(tsv)中mutation列的字符不能超过10,否则无法识别,报错
解决方法一:删除文件中无法识别的数据

解决方法二:改写脚本,此方法过于复杂,难度较高,本人没有尝试

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容