08、变异文件vcf的下游分析
ANNOVAR是一个高效的注释工具(perl程序),能够利用最新的数据来分析各种基因组中的遗传变异。支持包括VCF在内的多种输入和输出文件格式。它有三种注释方法:gene-based、region-based 和filter-based
基于基因的注释(Gene-based Annotation):揭示variant与已知基因直接的关系以及对其产生的功能性影响
基于区域的注释(Region-based Annotation):这个用到的不多,揭示variant 与不同基因组特定段的关系,例如:它是否落在转录因子结合区域等
基于数据库的过滤注释(Filter-based Annotation):分析变异位点是否位于指定的数据库中,比如dbSNP、1000G、ESP 6500等数据库,计算SIFT/PolyPhen/LRT/MutationTaster/MutationAssessor等
这个工具需要edu邮箱注册才能下载。注册下载页面如下:
http://www.openbioinformatics.org/annovar/annovar_download_form.php
下载完成后上传解压到服务器上即可:
tar -zxvf annovar.latest.tar.gz
注释:
# 数据库下载
/home/ngs/Pipeline/WES/biosoft/annovar/annotate_variation.pl --downdb --webfrom annovar gnomad_genome --buildver hg38 humandb
/home/ngs/Pipeline/WES/biosoft/annovar/annotate_variation.pl --downdb --webfrom annovar refGene --buildver hg38 humandb
/home/ngs/Pipeline/WES/biosoft/annovar/convert2annovar.pl -format vcf4old 025666_raw.vcf >025666.annovar
# 将多种格式转为.annovar的程序
/home/ngs/Pipeline/WES/biosoft/annovar/annotate_variation.pl -buildver hg38 --outfile 025666.anno 025666.annovar /home/ngs/Pipeline/WES/biosoft/annovar/humandb