写在前面
引物设计几乎是每个分子实验室的研究生必备的一项技能。目前,已经有许多成熟的引物设计软件供大家使用,如本地版的Primer5
以及NCBI上的Primer-BLAST
等等。
但是这些软件大部分都需要用户提供目标基因序列,才能进行设计,对新手来说,还得先学会如何获取目标基因序列(如果做的物种比较小众,绝大部分都没有现成数据库可以搜索序列,需要自己做比对鉴定)。
这里推荐一个软件PrimerServer2
,其支持用户自定义物种进行引物设计,可以根据GeneID设计任意基因的引物。此外还提供了用户友好的Web UI界面,搭建在实验室网站或基因组数据库网站,确实是个不错的选择~
一、安装
- 下载PrimerServer2
git clone https://github.com/billzt/PrimerServer2.git
- PrimerServer2是基于python3开发的软件,因此需要安装python3
- 编译安装,直接conda也不错 更方便
wget https://www.python.org/ftp/python/3.7.1/Python-3.7.1rc2.tgz
tar -zxf Python-3.7.1rc2.tgz
./configure --with-ssl
make
make install
- 安装samtools(Samtools >=1.9)
wget https://github.com/samtools/samtools/releases/download/1.15.1/samtools-1.15.1.tar.bz2
- 解压
tar jxvf samtools-1.15.1.tar.bz2
- 安装
./configure --prefix=/tools/samtools/samtools-1.15.1
make
make install
- 进入PrimerServer2文件夹
cd PrimerServer2
- 建议在虚拟环境中运行,创建虚拟环境
python3 -m venv venv
. venv/bin/activate
- 运行安装脚本,下载并安装一系列需要的环境(有点久。。。)
python3 setup.py develop
- 遇到报错,有个模块没安装上
ModuleNotFoundError: No module named 'markupsafe'
- 手动安装
#如果pip版本太低,会报错 ,需要升级再安装模块
pip install --upgrade pip
#安装markupsafe模块
pip install markupsafe
- 重新运行安装脚本,安装成功
python3 setup.py develop
二、配置示例数据
- 首先配置示例数据
primerserver-config
- 执行完之后会配置一个默认的示例
json配置文件
,需要修改文件里面的内容,指定示例数据所在目录
vim ~/.primerserver.json
{
"cpu": 2,
"templates_directory": "示例数据路径(即tests文件夹路径)",
"templates": {
"example.fa": {
"IDs": "seq1, seq2",
"description": "Example Database",
"group": "example"
},
"example2.fa": {
"IDs": "seq1, seq2",
"description": "Example Database 2",
"group": "example"
}
}
}
- 配置完成之后运行primerserver2
flask run
- 运行成功,可用浏览器访问,默认端口为5000,如果访问不了(比如租用的华为云或者腾讯云,有安全组) 需要自行开放5000端口
http://your.IP.address:5000
三、配置用户数据
- 首先创建数据目录,并将需要提取好的cds序列移动到该目录,这里以荔枝为例
mkdir litchi_data
- 建立blast databases
makeblastdb -input_type fasta -dbtype nucl -in litchi.cds.fa -parse_seqids 2>/dev/null
- 建立samtools索引
samtools faidx litchi.cds.fa
- 修改配置文件,这边只配置了一个物种的数据,如有多个物种,直接在json上依次添加多个物种信息即可,可用“group”定义分组
vim ~/.primerserver.json
- "templates_directory":数据存储路径
- "litchi.cds.longest.fa":用户数据文件名(fasta格式)
- "IDs":给出序列中的两个基因ID作为示例数据,在web UI中显示
- "description":对数据的一些描述,用户自定义
- "group":分组,如果有不同的物种数据可以自定义分组
{
"cpu": 2,
"templates_directory": "数据存储路径",
"templates": {
"litchi.cds.longest.fa": {
"IDs": "LITCHI014204, LITCHI014242",
"description": "Litchi Database",
"group": "Sapindaceae"
}
}
}
- 配置完成之后,重新运行primerserver2
flask run
- 平时用tmux将primerserver2挂在后台运行就好,方便
写在最后
疫情反反复复,大家五一出门注意安全
假期见见老友吃吃饭,舒服~