前两天使用snpeff进行基因注释,结果发现不少错误,所以就是用vep来进行注释,同样的位点,发现vep的注释是对的。
下面是使用笔记。
首先去官网上下载安装包
现在的版本是98(动物),45(植物),如果下载安装包后里面没有INSTALL.pl那就可能是版本更新了(19.11.29)
mkdir vep && cd vep
wget -c https://github.com/Ensembl/ensembl-tools/archive/release/97.zip
unzip 97.zip
cd ensembl-vep-release-97
- 在安装之前先修改cache的地址,就是将INSTALL.pl中209行得地址进行修改,动物的版本和植物的版本不一样 ,我又不知道怎么使用默认的$DATA_VERSION随着植物的版本更新而更新,所以就直接使用了现在最新的版本编号(同样如果需要下载fasta序列的话也可以进行修改)。
vi INSTALL.pl
image
修改过后进行安装
perl INSTALL.pl -c ~/reference/vep/
#有时候会报错,可以使用下面的命令
#perl INSTALL.pl -c ~/ngs/reference/vep/ --NO_HTSLIB
- 安装程序,-c 后面是你下载cache的位置,默认是$HOME/.vep,安装过程中需要安装API文件,比较费时间,可能需要安装几次才能安装上。然后就是下载cache文件,选择自己物种的编号进行下载,以玉米为例
image
但是有时需要安装一些模块
cpanm DBI
cpanm DBD::mysql
然后将cpanm的安装目录添加到环境变量中去,或者在INSTALL.pl的文件中添加一行
BEGIN { unshift @INC, '/home/free22/perl5/lib/perl5/x86_64-linux-thread-multi' }
安装好了就可以进行使用了
~/biosoft/vep --fasta~/reference/Zea_mays.AGPv4.dna.toplevel.fa --offline --species zea_mays--cache_version 39 --dir_cache ~/reference/vep/ -i maize_file.vcf -o maize_file_vep_annotate.vcf