全外显子组数据分析笔记(五):变异注释

我用的是ANNOVAR。

如何下载

搜索ANNOVAR Documentation,进入主页。


点击here之后会出现注册界面。

完成注册留下邮箱之后,就能收到附有下载链接的邮件了,需要等一两天。
http://www.openbioinformatics.org/annovar/download/0wgxR2rIVP/annovar.latest.tar.gz,这是我收到的链接,下载解压出来就能看到这些了

简单介绍

Annovar可以实现三种不同的注释方法,Gene-based Annotation(基于基因的注释)、Region-based Annotation(基于区域的注释)、Filter-based Annotation(基于筛选的注释)

  • 基于基因的注释:确定SNP或CNV是否导致蛋白质编码变化和确定受影响的氨基酸。可灵活使用RefSeq genes, UCSC genes, ENSEMBL genes, GENCODE genes或许多其他基因定义系统。
  • 基于区域的注释:识别特定基因组区域的变异,例如,44个物种中的保守区域,预测的转录因子结合位点, segmental duplication regions, GWAS hits, ChIP-Seq peaks, RNA-Seq peaks等等许多其他的在基因组区间的注释;
  • 基于过滤的注释:鉴定特定数据库中记录的变异,例如,该变异位点是否在dbSNP中有报道,在千人基因组计划中的等位基因频率如何等等。

使用

1. 配置数据库

http://annovar.openbioinformatics.org/en/latest/user-guide/download/#additional-databases官网里面提供了该软件支持的数据库列表(都是人的数据库),有很多,并且经常更新。

也可以在终端下查看:

mkdir humandb_hg38/
annotate_variation.pl -downdb -webfrom annovar avdblist humandb_hg38/ -buildver hg38

-buildver        表示version,主要是hg19和hg38;
-downdb          下载数据库的指令;
-webfrom annovar 从annovar提供的镜像下载,不加此参数将寻找数据库本身的源;
humandb_hg38/    下载到的文件都存放于humandb_hg38/目录下

查看列表
lsx humandb_hg38/hg38_avdblist.txt
数据库文件、更新时间、文件大小

annotate_variation.pl -buildver hg38 -downdb -webfrom annovar refGene humandb_hg38/

注意这里的数据库名称,比如refGene,都是严格按照上面红框里面的名称来的。将需要的数据库按照这条命令都下载好就行了。

2. vcf to avinput

将VCF文件转化为annovar可以识别的格式

perl ~/annovar/annovar/convert2annovar.pl -format vcf4 snp.vcf > snp.avinput
perl ~/annovar/annovar/convert2annovar.pl -format vcf4 indel.vcf > indel.avinput

简单看一下二者的区别

前五列分别代表:染色体, 起始位点, 终止位点, 参考碱基和观测到的碱基;
第六列:纯合变异(Homogeneous),杂合变异(Heterogeneous);
第七列:取自vcf文件中的QUAL列,表示该位点存在突变的可能性;
第八列:取自vcf文件中INFO列的DP信息,表示该位点的覆盖深度。
ANNOVAR主要依靠前五列信息对数据库进行比对,进而注释变异。

3. 进行注释

table_annovar.pl可以一次完成三种类型的注释,需要输入avinput文件和前面配置好的数据库文件。如果是一次完成一种类型的注释,则选用annotate_variation.pl。

perl ~/annovar/annovar/table_annovar.pl ./snp.avinput \
~/annovar/annovar/humandb_hg38/ -buildver hg38 \
--protocol avsnp150,cosmic70,clinvar_20180603,dbscsnv11,gnomad_exome,esp6500siv2_all,exac03,ensGene,refGene,knownGene \
-operation f,f,f,f,f,f,f,g,g,g \
--nastring "." \
--remove \
--outfile ./snp.annovar

perl ~/annovar/annovar/table_annovar.pl ./indel.avinput \
~/annovar/annovar/humandb_hg38/ -buildver hg38 \
--protocol clinvar_20180603,exac03,ensGene,refGene,knownGene \
-operation f,f,g,g,g \
--nastring "." \
--remove \
--outfile ./indel.annovar

--protocol        逗号分隔的字符串,用来指定数据库;
--operation       逗号分隔的字符串,用来指定注释方法,r基于区域g基于基因f基于过滤;
--nastring "."    当有缺失值时,用.填充;
--remove          移除所有临时文件.

结束之后会得到这两个文件:snp.annovar.hg38_multianno.txt,indel.annovar.hg38_multianno.txt。文件名前面的snp/indel是依照输入文件snp.avinput和indel.avinput来定的,后面的annovar.hg38_multianno.txt是程序自己加的。


reference

ANNOVAR 注释软件: https://blog.csdn.net/herokoking/article/details/78790688

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354

推荐阅读更多精彩内容