Windows本地安装blast软件并简单比对分析

整理:dayueban

主要目的是方便日常对测序数据,如编码某个蛋白的基因在物种间序列上的相似性比较。

一、软件下载和安装

blast软件网址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/

选择64位系统
  • 软件安装,下载后,点击安装,和平时安装软件的方法无异,安装位置可以是C盘或者其它盘,但是注意,一般的软件最好选择安装位置的时候路径中不要有中文,否则影响后续正常运行。

二、添加环境变量

  • 安装好后,会出现doc和bin两个文件夹,doc是文件,bin是执行程序所在的文件夹,将bin所在路径添加到所在系统环境变量,方法为:首先右键点击我的电脑——>属性——>高级系统设置——>高级——>环境变量——>系统变量——>选择path——>编辑——>新建——>copy路径:F:\bio-tools\blast\blast\bin到该位置——>确定,完成。

  • win+R打开电脑运行,输入cmd进入docs系统,进入到blast软件的bin路径,输入blastp -h,如果能出来帮助信息,说明安装成功,接下来就可以进行相应的blast比对操作了。

三、blast试运行

  • 首先blast运行比对之前,要对目标数据库进行建索引

我在NCBI里下载了两个细菌菌株的全基因组蛋白序列,一个是Eubacterium dolichum(a),一个是Eubacterium biforme(b)。其中a作为目标参考数据库,b用于比对数据。

  • 建索引
makeblastdb.exe -in db\Eubacterium_dolichum.faa -dbtype prot -out db\Eubacterium_dolichum.faa.blastdb
  • 补坑,建立索引这一步,出现了相应的报错,blast Error: mdb_env_open: 磁盘空间不足。,在网上搜索一通,找到一个解决方法,就是在用户变量里设置一个参数:BLASTDB_LMDB_MAP_SIZE=1000000

    图二

    解决了这个问题。

  • 建立好索引之后,那就是将需要比对的序列去和参考序列进行比对,得到比对结果

blastp -query F:\bio-tools\blast\data\Eubacterium_biforme.faa -db db\Eubacterium_dolichum.faa.blastdb -out db\results.txt -outfmt 6 -evalue 1e-5

参考

[1] windows下的blast+安装与使用

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。