1. 前唠
reago,这是一个跟基因统计有关的软件。请原谅我这个粗糙的说法吧,对于生物学,我是个外行,尽管与生物学有四年尘缘,但是我现在跟着计算机老大混日子,往事不可追。。。
闲话少叙,言归正传。
还得补一句废话:这个软件我 没跑通,所以要不要继续读下去,自己做决定(逃)
2. 概述
reago
有两个依赖,分别是infernal
、Readjoiner
,所以需要安装三个软件。只有三个?远远不止,往下看:
注意事项
- 不支持windows系统,支持linux,貌似支持mac,欢迎有志之士趟坑(windows不是python不支持,而是那两个依赖不支持)
- pyhton请使用2.7版本(可见,这个软件有些年头了,也没什么人维护,两年没更新了,有bug太正常了)
3. 安装记录
3.1 reago
- 版本:1.1
- 项目地址:github
- 环境:pyhon2.7
3.1.1基本步骤
下载压缩包,解压即可,也可以下载git,通过git 安装:
//下载git
yum install git
//安装reago
git clone https://github.com/chengyuan/reago-1.1.git
3.1.2 问题
- 问题描述: github上的README执行命令:
python reago.py filter_out/filtered.fasta sample_out -l 101
会出现如下保错:
ImportError: No module named networkx
- 原因:缺少networkx模块
networkx在2002年5月产生,是一个用Python语言开发的图论与复杂网络建模工具,内置了常用的图与复杂网络分析算法,可以方便的进行复杂网络数据分析、仿真建模等工作。
networkx支持创建简单无向图、有向图和多重图;内置许多标准的图论算法,节点可为任意数据;支持任意的边值维度,功能丰富,简单易用。
出处
- 解决方法:
- 安装pip,我默认的centerOS系统没有安装pip,安装方法:
wget https://bootstrap.pypa.io/get-pip.py
python get-pip.py
2.安装完成后,测试安装成功与否:
//如果成功会出现版本号,当前版本19.0.3
pip -V
3.安装networkx
pip install networkx
//安装完成后会出现类似如下提示
Successfully installed decorator-4.4.0 networkx-2.2
3.2 infernal
3.2.1 基本步骤
- 下载安装包
在/opt
(按个人喜好选择)目录执行:
wget http://eddylab.org/infernal/infernal-1.1.2-linux-intel-gcc.tar.gz
- 解压
tar -zvxf infernal-1.1.2-linux-intel-gcc.tar.gz
- 进入解压完的文件夹
- 运行configure
./configure
5.运行:
make
make check
make install
3.2.2 问题:
- 执行
./configure
命令失败,查看config.log,发现如下错误:
configure:2596: error: no acceptable C compiler found in $PATH
查阅文档发现是由于缺少gcc包,安装gcc:
yum install gcc
继续执行 ./configure
,成功。
注意事项
不要使用github下载源码的方式构建,因为文档中安装hmmer有 git checkout h3-master 这个命令,但是hmmer早已更新,该分支不存在,故无法成功执行。
3.3 Readjoiner
- 版本:1.5.10
- 可选安装包列表:linux
- 安装文档:无
- 下载安装包
在/opt
(按个人喜好选择)目录执行:
wget http://genometools.org/pub/nightly_builds/gt-1.5.10-Linux_x86_64-64bit.tar.gz
- 解压
tar -zvxf gt-1.5.10-Linux_x86_64-64bit.tar.gz
- 设置环境变量
根据需要进行设置,
参考
这里使用临时环境变量(shell关闭该变量就消失):
export PATH=/opt/gt-1.5.10-Linux_x86_64-64bit/bin:$PATH
4.使用
参考这里:https://github.com/chengyuan/reago-1.1
一共两个命令:
- 第一个命令:
python filter_input.py sample_1.fasta sample_2.fasta filter_out cm ba 10
这个命令执行后就阻塞了,程序没有停止,电脑呜呜地响,应该是执行什么耗资源的计算,打印一行字:
Indentifying 16S reads
然后。。。再没有然后,就这样一动不动。。。
- 第二个命令
python reago.py filter_out/filtered.fasta sample_out -l 101
跑完保错:
gt: error while loading shared libraries: libpango-1.0.so.0: cannot open shared object file: No such file or directory
gt: error while loading shared libraries: libpango-1.0.so.0: cannot open shared object file: No such file or directory
Traceback (most recent call last):
File "reago.py", line 848, in <module>
G = create_graph_using_rj(read_db, "graph")
File "reago.py", line 142, in create_graph_using_rj
f = open(output_dir + "/rj/" + graph_fn + ".set.des")
IOError: [Errno 2] No such file or directory: 'sample_out//rj/graph.set.des'
等后续解决吧