如何使用软件自动对变异 进行ACMG打分

作者:charon , 童蒙
编辑:angelica

高通量测序的诞生为科研和临床工作者在突变位点的检测和疾病分析上带来了“福音”,随之而来的则是如何从突变中甄别出真正致病相关的基因位点、并对此实现较为全面的注释和致病性评估,这也成为当前高喊“精准医学”的一个考验。如何标准化衡量突变位点的致病性以及是否具有或者潜在具有临床意义则成为变异检测后又一个需要解决的问题。2015年,《ACMG遗传变异分类标准与指南》的发布为标准化和规范化评估和解读致病位点带来了极大便利。而今天给大家分享的CharGer软件则能实现快速进行ACMG打分。接下来跟着小编看下这个非常好用的软件怎么使用吧~

一、软件说明

软件CharGer(Characterization of Germline variants)利用数据库和注释信息,依据ACMG标准对变异分类以评估变异的致病性。数据库可以下载到本地,也可以通过ReST APIs(联网)获取信息。用户也可以自己添加致病性标准,加入到CharGer规范中,来创建自己的分类标准。CharGer 可以使用两个不同的方法进行分类,一个是标准的ACMG的变异分类体系,一个是对ACMG进行扩展,使用自定义的模块来进行打分。

image

通过对给定的输入文件,CharGer进行突变位点的注释,并且对这些注释的变异同ACMG和自定义的模型进行匹配后打分。根据得分,使用ACMG和CharGer的分类算法,得到变异的致病性检测分类。

二、软件安装

本地安装
依赖环境:python 2.7.x;pip 10.X;vertulenv
使用命令:
pip install charger

Docker安装
Dockerfile路径:Dockerfile
docker build -t charger:version dockerfile
安装结果:成功安装,软件正常运行

三、注意事项

安装后可能有3个脚本出现语法错误,需要修改

  • /usr/local/lib/python2.7/site-packages/biomine/webapi/entrez/entrezapi.py
    332和333行 entrezaip 修改为 entrezapi
  • /usr/local/lib/python2.7/site-packages/charger/charger.py
    928行 varSet 修改为 varsSet
  • /usr/local/lib/python2.7/site-packages/biomine/webapi/ensembl/ensemblapi.py
    报错 IndexError: list index out of range,需在381行添加 if len(vals) < 6 : continue

四、 程序说明

用法

charger -f <variant file> -o <output file> [options]

主要参数说明

输入文件:

可以是以下三种格式的一种,每种可以输入一个文件。

-m Standard .maf
-f Standard .vcf
-T Custom .tsv

如果使用.maf 或者.tsv作为输入,那么需要指定使用哪一列作为输入列。注意标准的.maf文件不包含蛋白注释,因此,如果需要使用的话,需要指定;对于包含VEP注释的vcf文件,CharGer可以自动处理这个信息。

输出

tsv或者html格式

-o output file

-w output as HTML (flag)

-k annotate input (flag)

--run-url-test test url when creating links

--include-vcf-details (flag)

输出文件的名称默认为charger_summary.tsv,也可以指定输出名。

数据库
-l ClinVar (flag)

-x ExAC (flag)

-E VEP (flag)

-t TCGA cancer types (flag)

当本地没有VEP数据库时,软件会调用BioMine的ReST接口去读取数据,目前可以获得release97的数据。

其他参数
-O override with ClinVar description (flag)

-D suppress needing disease specific (flag)

-z pathogenic variants, .vcf 
\# vcf文件,包含已知的致病突变。作为支持PS1和PM5的证据。

-e expression matrix file, .tsv

\# tsv文件,列为样本,行为基因。

--inheritanceGeneList inheritance gene list file, (format: gene\tdisease\tmode_of_inheritance) .txt

\# 用户编辑文件,包含已知的致病基因。作为支持PVS1, PSC1, PM4, PP2, and PPC1的证据。

--PP2GeneList PP2 gene list file, (format: column of genes) .txt

\# 每行一个基因,作为支持PP2证据。

--BP1GeneList BP1 gene list file, (format: column of genes) .txt

\# 每行一个基因,作为支持BP1证据。

-d diseases file, (format: gene\\tdisease\\tmode_of_inheritance) .tsv

-n de novo file, standard .maf

-a assumed de novo file, standard .maf

-c co-segregation file, standard .maf

-H HotSpot3D clusters file, .clusters

这些文件中的变异或者基因可以作为额外的已知信息,用于结果的判定;基因名需要是HUGO symbols。

过滤参数
--recurrence-threshold : HotSpot3D的打分阈值,默认是2
--rare-threshold : 稀有突变的频率 (default = 0.0005 (0.05%)): 
--common-threshold: 普通突变的频率 (default = 0.005 (0.5%))
打分参数

确定每个分类类别的数值,默认值如下:

标准ACMG模块:

  --PVS1 very strong pathogenicity (default = 8)
  --PS1 , --PS2 , --PS3 , --PS4 strong pathogenicity (defaults: PS1 = 7, PS2=PS3=PS4 = 4)
  --PM1 , --PM2 , --PM3 , --PM4 , --PM5 , --PM6 moderate pathogenicity (defaults: PM1=PM2=PM3=PM4=PM5 = 2)
  --PP1 , --PP2 , --PP3 , --PP4 , --PP5 supporting pathogenicity (defaults: PP1=PP2=PP3=PP4=PP5 = 1)
  --BP1 , --BP2 , --BP3 , --BP4 , --BP5 , --BP6 , --BP7 supporting benignity (defaults: BP1=BP2=BP3=BP4=BP5=BP6=BP7 = -1)
  --BS1 , --BS2 , --BS3 , --BS4 strong benignity (defaults: BS1=BS2=BS3=BS4 = -4)
  --BA1 stand-alone benignity (defaults: BA1 = -8)

用户自定义的CharGer-defined模块和评分:

  --PSC1 strong pathogenicity (defaults: PSC1 = 4)
  --PMC1 moderate pathogenicity (defaults: PMC1 = 2)
  --PPC1 , --PPC2 supporting pathogenicity (defaults: PPC1=PPC2 = 1)
  --BMC1 moderate benignity (defaults: BMC1 = -2)
  --BSC1 strong benignity (defaults: BSC1 = -6)
Pathogenicity/benignity category thresholds
Specify the option and positive whole number value to change the default value.

  --min-pathogenic-score threshold for classifying variant as pathogenic (default = 9)
  --min-likely-pathogenic-score threshold for classifying variant as likely pathogenic (default = 5)
  --max-likely-benign-score threshold for classifying variant as likely benign (default = -4)
  --max-benign-score threshold for classifying variant as benign (default = -8)

本地数据库

--exac-vcf ExAC vcf.gz

--mac-clinvar-`tsv ClinVar from MacArthur lab (clinvar_alleles.tsv.gz)`

五、软件实操

使用Demo目录下的demo.vcf

运行命令

charger -f demo.vcf -o charged.demo.tsv -D --inheritanceGeneList inheritanceGeneList.txt --PP2GeneList PP2GeneList.txt --BP1GeneList BP1GeneList.txt -l -E

结果说明

结果文件为tab键分割的文本文件,共24列。其中比较关注的列为:

HUGO_Symbol:HUGO symbol基因名
Chromosome:染色体编号
Start:起始位点
Stop:终止位点
Reference:参考序列
Alternate:变异序列
ClinVar_Pathogenicity:clinvar致病性分类
ACMG_Classification:ACMG致病性分类
CharGer_Classification:Charger软件致病性分类
CharGer_Summary:注释结果描述。

六、参考

  1. Adam D Scott, Kuan-Lin Huang, Amila Weerasinghe, R Jay Mashl, Qingsong Gao, Fernanda Martins Rodrigues, Matthew A Wyczalkowski, Li Ding, CharGer: clinical Characterization of Germline variants, Bioinformatics, Volume 35, Issue 5, 01 March 2019, Pages 865–867
    https://doi.org/10.1093/bioinformatics/bty649
  2. https://github.com/ding-lab/CharGer
  3. https://www.acmg.net

本文作者:charon , 童蒙
本文编辑:Angelica

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容

  • 一次简化基因组数据分析实战 尽管目前已经有大量物种基因组释放出来,但还是存在许多物种是没有参考基因组。使用基于酶切...
    xuzhougeng阅读 14,194评论 10 40
  • 什么是基因组变异 基因组变异是一个定义比较模糊的概念. 所谓的变异是相对于一个完美的“参考基因组”而言。但是其实完...
    xuzhougeng阅读 4,987评论 0 22
  • 刘小泽写于18.8.10,补充于18.8.14-15这之间经历了第一期授课结课,(回中山办购房手续)遥墙机场读了1...
    刘小泽阅读 9,263评论 6 41
  • 林小苑捧着一袋爆米花翘着二郎腿坐在电影院里等电影开场。在他前面一排的是拖家带口的一大家子。年长的,年幼的,小孩儿在...
    顾筱笛阅读 544评论 0 15
  • 今晚回家路上,我播放石上流师姐的晨享给老公听,因为师姐的情况,我看过她的简书及群里问的问题,了解得比较多,我跟老公...
    相信自己会越来越好阅读 208评论 0 3