WES2Neoantigen Pipeline

Part 5 VEP

简介

VEP(Variant Effect Predictor)是ENSEMBL制作的一个专门对突变数据添加注释信息的工具,但它是基于perl语言的,所以会有模块的依赖性(实际上我按照官网教程来安装VEP一直没有成功,一直显示缺少需要的模块,这里我推荐用conda安装,完全没有权限问题困扰,唯一的瑕疵就是版本更新不及时,大概是官网更新几个月之后才会有最新版)。 跟snpEFF一样,也是对遗传变异信息提供更具体的注释,而不仅仅是基于位点区域和基因。

下载安装这里就不说了,用conda安装直接搜索bioconda找到VEP包,里面给出了安装命令。

安装完软件,有一个必不可少的就是注释所需要的数据库了,VEP支持非常多的物种的注释,这里我用人类的注释来稍作解释。在这个ftp里ftp://ftp.ensembl.org/pub/选择安装好的VEP对应的版本,这里用V95为例,ftp://ftp.ensembl.org/pub/release-95/variation/VEP/这个ftp就包含了所有可用的注释文件。

这几个就是对应的人类相关的(GRCH37->hg19, GRCH38->hg38),一般选择_vep_这类。下载完解压后随便放一个地方就行,因为后面使用的时候会指定文件目录。

输入数据

BED: a simple tab-delimited format containing 3-12 columns of data. The first 3 columns contain the coordinates of the feature. If available, the VEP will use the 4th column of the file as the identifier of the feature.

GFF: a format for describing genes and other features. If available, the VEP will use the "ID" field as the identifier of this feature.

GTF: treated in an identical manner to GFF.

VCF: a format used to describe genomic variants. The VEP will use the 3rd column of the file as the identifier.

bigWig: a format for storage of dense continuous data. The VEP uses the value for the given position as the "identifier". Note that bigWig files contain their own indices, and do not need to be indexed by tabix.

以上数据均可用于VEP的输入,不过我只测试了VCF,其他文件没有测试。

主要参数

--input_file / -i

    输入文件名,如果不指定,VEP将会在尝试从STDIN读取数据

--output_file / -o

    输出文件名,可以标注为STDOUT,这将会强制打开静默模式,输出到默认输出地址,默认文件名为variant_effect_output.txt

--quiet / -q

  不输出任何警告信息

--dir_cache

指定cache文件目录,默认是$HOME/.vep/

--dir_plugins

指定插件所在目录,默认是$HOME/.vep/

--plugin

    指定使用哪个插件

--terms

输出结果的类型,默认为SO

--symbol

    在结果中加入gene symbol

--tsl

在输出结果中添加添加或转录本水平信息

--hgvs

在输出中添加基于Ensembl stable identifiers的HGVS命名法

--fasta

参考基因组文件

……

运行命令

可以直接进入安装目录来运行,

/pub5/xiaoyun/BioSoftware/Conda/envs/VEP_2/share/ensembl-vep-95.3-0/vep --input_file ***.vcf.gz --output_file ***.vcf --format vcf --vcf --symbol --terms SO --tsl --hgvs –fasta reference.hg19.fa –dir_cache /pub5/xiaoyun/BioSoftware/Conda/envs/VEP_2/share/ensembl-vep-95.3-0/ –plugin Downstream --plugin Wildtype

这条是专门用于pvacseq流程的命令,后面需要加两个插件

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351