安装
http://annovar.openbioinformatics.org/en/latest/user-guide/download/
注册 网站发送邮件 直接邮件下载 拷贝到服务器 (需使用机构邮箱)
tar -zxvf annovar.latest.tar.gz
使用
1.数据库下载
下载软件时,会自带部分数据库,存放在humandb文件夹下,根据需要,在http://annovar.openbioinformatics.org/en/latest/user-guide/download/ 页面下载自己需要的数据库。
perl annotate_variation.pl -downdb -webfrom annovar --buildver hg19 refGene humandb/ (FASTA sequences for all annotated transcripts in RefSeq Gene)
-refGene 为表格里的 Table Name
perl annotate_variation.pl -downdb -webfrom annovar --buildver hg19 clinvar_20180603 humandb/ (最新版的clinvar数据库注释)
-clinvar_20180603 为表格里的 Table Name
2.vcf格式转换
我们输入的snp-vcf可能不能被软件识别,需使用软件里的convert2annovar.pl将输入的vcf格式转换成软件需要的格式
perl convert2annovar.pl -format vcf4 自带.vcf >软件.annovar
软件所需要的vcf文件一般包括8列,用tab键分割。
输入文件:
转换后文件:
3.简单的数据库注释
perl table_annovar.pl deaf.annovar humandb/ --outfile final --buildver hg19 --protocol refGene,clinvar_20180603 --operation g,f --vcfinput
--protocol 后跟注释数据库的准确名称(名称不对,自动报错)
--operation 后跟注释的类型
g 表示基于基因的注释(gene-based annotation)
r 表示基于区域的注释(region-based annotation)
f 表示基于筛选子的注释( filter-based annotation)
--operation 指定的注释类型顺序和 --protocol 指定的数据库顺序是一致的;
每个protocal名称或注释类型之间只有一个逗号,并且没有空白。
4.暂时我只使用了这几个功能,后期使用到其他功能,再进行添加。