🌴GSP🌴
A tool for Genome Specific Primers design in polyploid species
简介:
在多倍体 物种中,同源基因组的基因表现出非常高的序列相似性,尤其是在编码区。这使得在多倍体基因组背景下设计基因组特异性引物来扩增单个基因组的特异序列变得困难。为多倍体物种中的重要基因开发基因组特异性引物,不仅对于研究自然群体中基因的序列多样性和关联图谱,而且对于开发基于基因的功能标记进行标记辅助育种都是非常有用和关键的。GSP是设计基因组特异性引物的有力工具,可以区分多倍体物种不同基因组的序列。此外,GSP还允许用户在多序列比对中设计特定的优先级。
目前该网站在线版似乎在维护中,无法使用!
QSP所需依赖包,bedtools、Muscle、Primer3 作者已经准备好了。
-
bedtools
: a powerful toolset for genome arithmetic
-
-
Muscle
: Multiple sequence alignment program
-
-
Primer3
: program for designing PCR primers
-
1. 安装依赖包
- cmake
wget https://github.com/Kitware/CMake/releases/download/v3.21.0/cmake-3.21.0.tar.gz
tar zxvf cmake-3.21.0.tar.gz
cd /home/manager/biosoft/cmake-3.21.0 (你的软件安装路径)
./bootstrap && make && sudo make install
如果在编译时提示参考: Could NOT find OpenSSL 的解决方法
报错提示如下
Could NOT find OpenSSL, try to set the path to OpenSSL root folder in the system variable OPENSSL_ROOT_DIR (missing: OPENSSL_LIBRARIES OPENSSL_INCLUDE_DIR)
解决方案:安装OpenSSL 的依赖即可。
sudo apt-get install libssl-dev
- Boost
apt-get update # 更新
apt upgrade # 更新
apt-get install libboost-all-dev # 安装依赖项
cd /usr/local/src # cd 到安装目录
wget https://boostorg.jfrog.io/artifactory/main/release/1.76.0/source/boost_1_76_0.tar.gz # 下载源码
tar zxvf boost_1_76_0.tar.gz # 解压文件
cd boost_1_76_0 # 进入目录
./bootstrap.sh –prefix=/usr/local/boost # 参数设置
./b2 -j8 # 编译时间较慢
./b2 install # 安装
打开配置文件,
vim /etc/profile
在/etc/profile 文件末尾添加如下内容
export CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/boost/include
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/boost/lib
source etc/profile
打开配置文件/etc/ld.so.conf,末尾添加/usr/local/boost/lib
vim /etc/ld.so.conf
/usr/local/boost/lib # 要添加的内容
sudo ldconfig # 执行配置
2. 安装GSP
下载安装
解压
cd /home/manager/biosoft/GSP
cmake ./src
make
3. 查看GSP 依赖的可执行文件 (bin文件夹下)
cd /home/manager/biosoft/QSP/bin
ls
=============================================================
-rwxrwxrwx 1 root root 1355512 Jul 20 22:20 bedtools*
-rwxrwxrwx 1 root root 1058280 Jul 20 22:20 muscle*
-rwxrwxrwx 1 root root 985836 Jul 20 22:20 primer3_core*
=============================================================
4. QSP 实战
⭐案例1 (Example 1):
根据比对结果,在多倍体中设计特异引物。
Design specific primers in polyploid based on blast result.
./GSP -r ./example/example1/blast.tab
-d ./example/example1/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./example1_result.csv \
-q 3
⭐案例2 (Example 2):
多条序列设计引物,这个比较适合小麦、棉花等同源基因的引物设计。
Design specific primers of multiple sequences.
./GSP -a ./example/example2/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./example2_result.csv
⭐案例3 (Example 3):
根据blast结果和引物参数设置设计多倍体中的特异引物。
Design specific primers in polyploid based on blast result with primer parameters setting.
./GSP -r ./example/example3/blast.tab \
-d ./example/example3/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./example3_result.csv \
-q 3 \
-t ./example/example3/parameter_for_primer
GSP 参数:
-
-r
: 比对的结果的路径。blast table result path -
-d
: 序列的路径。sequence database path (blast database path) -
-a
: fasta 文件路径,该参数仅适用于设计多个序列的特异引物。fasta file path (for design + specefic priemrs in multiple sequences only) -
-b
: bedtools的安装路径。bedtools path (default: bedtools) -
-m
: muscle的安装路径。muscle path (default: muscle) -
-p
: primer3的安装路径。primer3 path (default: primer3_core) -
-t
: primer3参数的路径。primer3 parameters file path -
-o
: 输出结果路径。output path. -
-q
: 每个序列的设计的引物数,默认3。number of hit sequences for perimer design of each query (default: 3) -
-f
: hit sequence flanking length (default: 200) -
-s
: 扩增产物最少__bp,默认200。product min size (default: 200) -
-l
: 扩增产物最多__bp,默1000。product max size (default: 1000) -
-c
: 引物中差异位点数,默认2。different site in primer (default: 2) -
-e
: 引物3'端差异位点数,默认无。different site in 3 end of primer (default: No)
注意:
- 确保所有依赖都在环境变量中,不然需要指定路径。
Make sure that the dependencies (bedtools, muscle, primer3_core) are in the $PATH. If not, they must be specified (-b, -m, -p).
- 确保所有依赖都在环境变量中,不然需要指定路径。
- 路径必须是绝对路径。Please use absolute path.
5. GSP实战
将小麦同源基因的序列存为sequences.fas,文件放在example2/
下。
由于是设计qpcr引物,所以,扩增产物最短-s
设为150,最长-l
设为300。
# 进入目录
cd /home/manager/biosoft/QSP
# 运行
./GSP -a ./example/example2/sequences.fas \
-b ./bin/bedtools \
-m ./bin/muscle \
-p ./bin/primer3_core \
-o ./MyWRKY1.tab \
-s 150 \
-l 300
结果如下所示:
注意:LEFT_PRIMER和RIGHT_PRIMER 引物方向均为5' -> 3'。