SCRATCH的安装和使用

Overview

1.下载SCRATCH-1D

2.安装SCRATCH-1D

3.验证SCRATCH-1D

4.使用SCRATCH-1D

Overview

在对氨基酸序列进行机器学习建模时,需要对氨基酸序列做特征提取,越丰富的特征通常可以带来越精准的预测结果,因此可以由原始的氨基酸序列预测出蛋白质的2级结构,水溶性等,丰富特征提取时的特征。

SCRATCH作为UCI开发的一个套件包,提供了多种不同的蛋白质预测功能,这些预测器被打包成一个集成的套件安装包SCRATCH-1D (SCRATCH  Suite of One-Dimensional Predictors)。

·SSproRelease 5.2 Protein secondary structure prediction   (3-class)

·SSpro8Release 5.2 Protein secondary structure prediction  (8-class)

·ACCproRelease 5.2 Protein relative solvent accessibility  prediction (at the 25% threshold)

·ACCpro20Release 5.2 Protein relative solvent accessibility prediction (thresholds 0% to 95%)

·PROFILproRelease 1.1 Protein evolutionary information / sequence  profiles for 1D predictors

·HOMOLproRelease 1.1 Homology-based secondary structure & solvent accessibility prediction

·1D-BRNNRelease 3.3 One-dimensional bidirectional recurrent neural networks

上面文档对于这些软件的说明非常清晰明了,这里就不再一一解释。

实际上,SCRATCH-1D还包含了一个BLAST包(BLAST也是PSIPRED运行所需要的安装包,同样由UCI开发),版本号为blast-2.2.26,32位。官方的文档中也对这个包进行了说明:

The linux 32 bit version of blast is delivered

by default in the 'pkg'sub-folder of the package for a better compatibility with most

operatingsystems. If this version of blast is not compatible with your

operatingsystem or for improved performances on 64 bit systems, please

downloadthe blast version matching your operating system at:

ftp://ftp.ncbi.nlm.nih.gov/blast/executables/release/LATEST/

and replace the version provided in the

package by the downloaded onewithout changing the installation folder name (even the release

number).

如果自带的这个BLAST包不兼容或者需要64位的版本,可以自行去上面的网站上下载。

1. 下载SCRATCH-1D

可以通过访问UCI的官方下载页面http://download.igb.uci.edu/,找到SCRATCH-1D release 1.1(linux

version, 2.7 GB)去下载,后面的installation

instructions和documentation就是本文参考的官方说明和安装文档。

2. 安装SCRATCH-1D

参照installation

instructions上面的步骤,可以很容易地安装。

1. 将下载的SCRATCH-1D_1.1.tar.gz压缩包解压,解压后文件夹为SCRATCH-1D_1.1

tar -xvzf   SCRATCH-1D_1.1.tar.gz

2. 进入SCRATCH-1D_1.1

cd SCRATCH-1D_1.1

3.运行SCRATCH-1D_1.1目录下的安装脚本install.pl

perl install.pl

这时命令行输出会提示安装成功,并给出如何验证以及运行SCRATCH-1D。

3.验证SCRATCH-1D

SCRATCH-1D_1.1中有一个doc文件夹,里面提供了一个测试输入文件test.fasta,以及正确运行程序后应该有的四个输出文件test.hom.ss

test.hom.ss8test.hom.acctest.hom.acc20

1.假设现在位于SCRATCH-1D文件夹下,首先进入doc文件夹。

cd doc

2.在这里运行SCRATCH-1D:

  ../bin/run_SCRATCH-1D_predictors.sh  test.fasta test.out 1

3.这里调用的是SCRATCH-1D/bin目录下的run_SCRATCH-1D_predictors.sh运行脚本,输入文件为test.fasta,输出文件为test.out.*的文件,最后的参数1是程序运行的线程数,如果你的电脑不少于4核,这个数字可以改为4。

4.到这里为止,本来是应该验证成功,结束。但是如果你的计算机是64位,无论是64位的mac,还是64位的linux,都会在运行SCRATCH-1D时报以下错误:

 [SCRATCH-1D_predictions.pl] generating sequence profiles... 

  chmod: /Users/wangjiawei/Bioinformatics/Softwares/SCRATCH-1D_1.1/tmp/20150917-214412-150982209579/dataset.pro:

   No such file or directory

[SCRATCH-1D_predictions.pl]  failed generating sequence profiles...

5.原因在于SCRATCH-1D的运行需要调用BLAST,上面已经提到过,SCRATCH-1D已经自带了一个32位版本的blast-2.2.26,位于文件夹SCRATCH-1D_1.1/pkg/中。

在SCRATCH-1D的运行中,需要调用SCRATCH-1D_1.1/pkg/bin/中的可执行程序blastpgp(关于blastpgp程序的详细信息请查看这里),这个32位的程序在64位系统中不兼容,所以需要手动下载一个正确的BLAST版本来替换SCRATCH-1D_1.1/pkg/中的blast-2.2.26

下面我们依然选择下载一个2.2.26版本的BLAST,对于mac和64位的linux,有两个不同的版本下载,点击网址ftp://ftp.ncbi.nih.gov/blast/executables/release/2.2.26/

  对于Mac用户:

下载blast-2.2.26-universal-macosx.tar.gz

  对于64位Linux用户:

下载blast-2.2.26-x64-linux.tar.gz

下载完之后解压缩,就会得到一个blast-2.2.26文件夹,用这个文件夹替换SCRATCH-1D_1.1/pkg/中的blast-2.2.26文件夹就可以了。

6.  到这里就真的可以正常使用了,进入SCRATCH-1D_1.1/doc/,运行SCRATCH-1D去分析doc中的test.fasta文件


../bin/run_SCRATCH-1D_predictors.sh

test.fasta test.out

7.命令行输出以下信息:


8.run_SCRATCH-1D_predictors.sh的第一个参数是要输入的fasta序列文件,test.out是输出结果的前缀,../bin/run_SCRATCH-1D_predictors.sh test.fasta test.out共产生四个结果文件,分别是test.out.ss,test.out.ss8,test.out.acc,test.out.acc20。

SCRATCH-1D同样在doc文件夹中提供了test.fasta分析结果的标准结果,可以用来检查我们自己刚才的结果是否正确,与上面四个一一对应的是test.hom.ss,test.hom.ss8,test.hom.acc,test.hom.acc20。

9.这里我们检查下生成的四个结果是否与系统提供的标准结果一致,以test.out.ss为例,我们可以手动检查test.out.ss与test.hom.ss是不是一样,也可以通过diff命令查看,diff命令会将两个文件逐行比较,并列出内容不同的行。

diff test.hom.acc    test.out.acc

10.结果输出为空,说明两者完全一致。

到这里,SCRATCH-1D的安装就结束了。

4.使用SCRATCH-1D

其实从上面的文字已经可以看出来,SCRATCH-1D是通过SCRATCH-1D_1.1/bin/中的run_SCRATCH-1D_predictors.sh脚本运行的。

任何时候,查看脚本的--help选项总是好的,进入*SCRATCH-1D_1.1/bin/,运行下列命令:

./run_SCRATCH-1D_predictors.sh   --help

系统就会列出该脚本的使用方式:

Usage : ./run_SCRATCH-1D_predictors.sh input_fasta  out_prefix    [num_threads]

非常的简单易用,只需要指定输入的fasta文件,输出文件前缀,以及一个可选的线程数,num_threads依据你电脑的实际CPU内核数指定即可。

程序的整体运行还是比较耗时的,以下面的配置为例:

2处理器2.8 GHz Intel Core i5

内存8 GB 1600 MHz DDR3

运行系统的示例文件(包含4条序列),大约花了10分钟。


参考文献:

本文转载自:  http://chris.nohup.cc/article/84/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,937评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,503评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,712评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,668评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,677评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,601评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,975评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,637评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,881评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,621评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,710评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,387评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,971评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,947评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,189评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,805评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,449评论 2 342

推荐阅读更多精彩内容