ANNOVAR-注释数据库

1.下载

1.需要科研机构邮箱才能申请安装包(免费)
http://download.openbioinformatics.org/annovar_download_form.php
下载annovara安装的数据库列表

#下载hg38版本的list
perl annotate_variation.pl -downdb avdblist -buildver hg38 -webfrom annovar path/to/humandb

里面是可以通过annovar直接下载的数据库

2.数据库下载

#refGene
perl ../annotate_variation.pl -downdb -buildver hg38 -webfrom annovar refGene ../humandb
#knownGene
perl ../annotate_variation.pl -downdb -buildver hg38 -webfrom annovar knownGene ../humandb
#esp6500siv2_all(only all)
perl ../annotate_variation.pl -downdb esp6500siv2_all -buildver hg38 -webfrom annovar ../humandb
#exac03
perl ../annotate_variation.pl -downdb exac03 -build hg38 -webfrom annovar ../humandb
#cosmic70
perl ../annotate_variation.pl -downdb cosmic70 -buildver hg38 -webfrom annovar ../humandb
#nci60
perl ../annotate_variation.pl -downdb nci60 -buildver hg38 -webfrom annovar ../humandb
#dgvMerged
perl ../annotate_variation.pl -downdb dgvMerged -buildver hg38 ../humandb

#avSNP
perl ../annotate_variation.pl -downdb avsnp144 -buildver hg38 -webfrom annovar ../humandb
#1000g2015aug
perl ../annotate_variation.pl -downdb 1000g2015aug -buildver hg38 -webfrom annovar ../humandb

#dbnsfp30a(SIFT, PolyPhen2, LRT, MutationTaster, MutationAssesor, FATHMM; GERP++, PhyloP, SiPhy)
perl ../annotate_variation.pl -downdb dbnsfp30a -buildver hg38 -webfrom annovar ../humandb

#clinvar_20160302
perl ../annotate_variation.pl -downdb clinvar_20160302 -build hg38 -webfrom annovar ../humandb

#dann
perl ../annotate_variation.pl -downdb dann -buildver hg38 -webfrom annovar ../humandb

处理精简一些数据库

awk -F "\t" '{print $1"\t"$3"\t"$5"\t"$6"\t0\t"$2}' humandb/hg38_wgEncodeGencodeBasicV23.txt >humandb/hg38_Gencode.txt
awk -F "\t" '{print $1"\t"$3"\t"$5"\t"$6"\t0\t"$13}' humandb/hg38_refGene.txt >humandb/hg38_refGeneName.txt

从UCSC下载
http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/

wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/wgEncodeGencodeBasicV23.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/cytoBand.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/wgRna.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/genomicSuperDups.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/gwasCatalog.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/rmsk.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/dgvMerged.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/cpgIslandExt.txt.gz

#OMIM
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/omimAv.txt.gz
wget -c http://hgdownload.cse.ucsc.edu/goldenPath/hg38/database/omim2gene.txt.gz

3.注释脚本

-protocol: 注释的数据库
-buildver: 基因组版本
-nastring:空位置用 . 填充
--otherinfo: 输入文件中第5例后面的info信息也进行输出
--operation:数据库的类型,需要与前面的-protocol顺序严格对应,且逗号分割。g为基因注释类型 ,r为区域注释类型,f为过滤注释类型
--gff3dbfile:注释使用的 gff 文件
–vcfinput:输入为vcf格式的文件,输出也为vcf格式
–vcfformat:vcf文件的格式

perl table_annovar.pl input.vcf path/to/humandb -buildver hg38 -otherinfo -nastring . -protocol GeneName,refGene,Gencode,cytoBand,wgRna,genomicSuperDups,gff3,avsnp150,cosmic70,clinvar_20180603,gwasCatalog,1000g2015aug_eas,1000g2015aug_sas,1000g2015aug_eur,1000g2015aug_afr,1000g2015aug_amr,1000g2015aug_all,esp6500siv2_all,exac03,dbnsfp33aneed,gerp++gt2,caddgt10 --operation r,g,r,r,r,r,r,f,f,f,r,f,f,f,f,f,f,f,f,f,f,f --gff3dbfile hg38_rmsk.gff --vcfinput --argument '--colsWanted 5,--transcript_function,--colsWanted 5,,,,,,,,,,,,,,,,,,,' --outfile out_put_annovar_file

4.Annoovar注释的3种形式

1.Gene-based Annotation(基于基因的注释)
基于基因的注释(gene-based annotation)揭示variant与已知基因直接的关系以及对其产生的功能性影响,需要使用for gene-based的数据库。
2.Region-based Annotation(基于区域的注释)
对位于数据库区域的位点进行注释,不关注具体的位点是否一致,变异是否一致。揭示位点与基因组特定区域的关系,例如:它是否落在已知的保守基因组区域。
3.Filter-based Annotation(基于过滤的注释)
这种注释方式需要变异位点的位置以及碱基变化精确匹配
注释脚本

perl /Apps/annovar/convert2annovar.pl -includeinfo -allsample -withfreq -format vcf4 raw.somatic.foxog_filtered.vcf > raw.somatic_converted_avinput.xls
perl /Apps/annovar/table_annovar.pl raw.somatic_converted_avinput.xls .//annovar/humandb -buildver hg19 -otherinfo -remove -outfile outdir -protocol refGene,snp142,popfreq_all_20150413,gnomad_exome,cosmic88,clinvar_20190821,ljb26_all,intervar_20170202 -operation g,f,f,f,f,f,f,f -argument -hgvs,-hgvs,-hgvs,-hgvs,-hgvs,-hgvs,-hgvs,-hgvs

splicing剪接位点:指DNA在转录时发生RNA拼接的位点。
在vcf中 在splicing位点附件发生的突变,所处区域显示为 splicing,表示这个突变位点在一个splicing附近。 在碱基变化列 c.894-1G>A表示 在转录本894位置是一个剪接位点,在 -1 位置上,也就是893位置发生了G>A突变。

如果想扩大剪接位点两侧突变检测范围 , 在-argument 参数后边对应 refGene数据库的位置 添加-splicing_threshold 10 , 如:-argument '-splicing_threshold 10 -hgvs' 引号内表示对refGene 数据库进行 -splicing_threshold 10-hgvs 两个处理,所以用引号引起来。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,874评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,102评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,676评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,911评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,937评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,935评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,860评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,660评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,113评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,363评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,506评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,238评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,861评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,486评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,674评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,513评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,426评论 2 352

推荐阅读更多精彩内容

  • annovar简介 在我们做重测序,或者比较基因组学分析的时候,我们往往在call snp或者indel的时候,需...
    云养江停阅读 5,041评论 1 17
  • 结果文件的解读 输出文件1:*.variant_function 第一个文件包含所有变异的注释,方法是在每个输入行...
    生信师姐阅读 18,580评论 2 41
  • 重新用annovar注释:先转换适合的文件格式: 再下载适合的数据库文件:下载指令如下: 下载的数据库: 数据库文...
    程凉皮儿阅读 3,611评论 0 4
  • Annovar注释结果中Func.refGeneWithVer类型 annovar注释结果中,一些列中的内容需要认...
    京古阅读 7,624评论 0 5
  • 标签(空格分隔): annovar 注释 [TOC] 介绍 参考链接 http://annovar.openbio...
    fatlady阅读 23,558评论 6 15