利用snpEff软件可以对获得的snp信息进行注释,以确定该snp对于基因编码信息的影响:同义替换、非同义替换、非编码区等等
首先查看snpeff.config 文件中有无自己需要的基因组,若没有则需要自己构建,以B73_v5为例构建本地数据库。
snpEff 安装
#若无法调用Java,则需要进行Java安装
sudo apt install default-jre
#下载SnfEff软件
wget https://datasetsnpeff.blob.core.windows.net/dataset/versions/snpEff_latest_core.zip?sv=2019-10-10&st=2020-09-01T00%3A00%3A00Z&se=2050-09-01T00%3A00%3A00Z&si=prod&sr=c&sig=isafOa9tGnYBAvsXFUMDGMTbsG2z%2FShaihzp7JE5dHw%3D
unzip snpEff_latest_core.zip
cd snpEff_latest_core
B73基因组基因组等文件下载
wget https://download.maizegdb.org/Zm-B73-REFERENCE-NAM-5.0/Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.gff3.gz
wget https://download.maizegdb.org/Zm-B73-REFERENCE-NAM-5.0/Zm-B73-REFERENCE-NAM-5.0.fa.gz
wget https://download.maizegdb.org/Zm-B73-REFERENCE-NAM-5.0/Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.protein.fa.gz
gunzip -d *.gz
配置snpEff 数据库
mkdir data ./data/genomes ./data/B73_v5
# 将基因组文件放入genomes文件夹,并更改为B73_v5.fa
mv ./Zm-B73-REFERENCE-NAM-5.0.fa ./data/genomes/B73_v5.fa
# 将蛋白序列及gff文件放入B73_v5文件夹,并改名
mv ./Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.gff3 ./data/B73_v5/genes.gff
mv ./Zm-B73-REFERENCE-NAM-5.0_Zm00001eb.1.protein.fa ./data/B73_v5/protein.fa
# 更改snpEff.config 的配置信息
vim ./smpEff.config
#加入如下信息
#maize genome,version B73_v5
B73_v5.genome:maize
#运行以下命令
java -jar snpEff.jar build -gff3 -v B73_v5
对snp进行注释
将所要注射的snp vcf文件拷入snp文件夹,运行以下命令,获得注释结果
java -jar ./snpEff.jar B73_v5 ./snp.vcf > Result.out
个人学习笔记。