如何挖掘外显子变异频率信息

转载:http://www.omicshare.com/forum/thread-2703-1-1.html

外显子虽然只占约1%人类基因组大小,但多数疾病都是由编码基因的低频或罕见突变引起,同时外显子测序容易实现>100x的深度测序,因此对外显子的研究是一种高效的发现人类疾病信息的研究手段。

市面上一般都是通过探针杂交富集外显子,然后利用二代测序获得其序列信息,最后结合公共数据库的外显子数据,解释变异与疾病之间的关联。

外显子测序分析主要包含变异挖掘与变异注释两部分,其中变异注释尤为关键。因为通过变异注释,我们可以了解突变的变异位置、频率等信息,从而结合生物学背景筛选出候选新生变异位点,以用于后期功能研究或疾病模型构建。一般来说,外显子变异注释主要分为四大类:第一类为位置注释,第二类为变异频率信息,第三类为蛋白变异信息,第四类变异基因功能类型。今天我们就对变异频率信息挖掘对大家进行简单介绍。

变异频率分析

正常人体基因组中存在大量的变异信息,其中90%以上的变异信息是高频率(>5%)的,也就是在大部分人中都存在。一般来说,高频的变异往往与疾病无关,只有部分低频的变异具有致病性。因此通过对变异进行频率分析筛选,能够有助于找出有效致病突变位点。

为达到变异筛选目的,我们一般会在几个大型的外显子变异数据库中对新发现的突变进行注释,了解其突变频率等情况。常用的数据库有dbSNP、Hapmap、COSMIC、1000Genomes projects千人基因组计划(根据人种来源,分为全部人种、东亚人、美洲人等不同子数据库)、ESP6500外显子计划、ExAC(根据人种来源,分为全部人种、东亚人等不同子数据库)。

1. dbSNP

dbSNP(https://www.ncbi.nlm.nih.gov/projects/SNP/)是NCBI与人类基因组研究所合作建立的关于单碱基替(SNP)以及短插入删除(InDel)的资源库。它的数据来源于公共实验室以及私人研究组织。

测序公司一般会在dbSNP数据库中对新发现变异进行注释,给出该变异在dbSNP中的ID,这个ID就是NCBI所赋予数据库中每个SNP的rs号。在数据库中,通过rs号的搜索,可以发现SNP的前后序列、位置信息、分布频率等。这些信息在我们判断新变异的重要性中有着重要意义。

image

2. Hapmap

人类基因组单体型数据库(www.hapmap.org)。通过注释,可以知道该变异与人类健康、疾病以及对药物和环境因子的个体反应差异相关的基因相关性,变异的ID与dbSNP的ID一致。但在16年6月,HapMap网站已经被关闭,并逐渐被1000 Genomes Project所取代。

image

3. COSMIC

全称 Catalogueof Somatic Mutations in Cancer(http://cancer.sanger.ac.uk/cosmic),是全球最大的癌症体细胞突变数据库。注释结果一般包含COSMIC中的ID,观察到突变的次数(OCCURRENCE),以及观察到变异所在的癌组织名称(如haematopoietic_and_lymphoid_tissue)。通过COSMIC突变注释,可知检测到的体细胞突变是否已被报导或观测到过,以及在哪些癌种中被报导的次数。

image

4. 1000Genomesprojects

千人基因组计划(http://www.internationalgenome.org/)。通过注释,可以知道该变异在全部参与千人基因组计划人群中的突变频率,参与人群来自于非洲AFR(African),美洲AMR(Admixed American),东亚EAS(EastAsian),欧洲EUR(European),南亚SAS(South Asian)等区域。根据不同目标研究人种,有的公司会单独对某个子数据库进行分析,例如研究中国人,会另外在东亚EAS数据库中注释突变频率。

image

5. ESP6500

国家心肺和血液研究所外显子组测序计划(NHLBI-ESP project),这个计划中的esp6500si_all数据库(http://evs.gs.washington.edu/EVS/)中包含SNP变异、InDel变异和Y染色体上的变异的所有个体中,突变碱基的等位基因频率(alternativeallele frequency)。通过注释,我们可以了解到突变在ESP6500的变异频率,并过滤突变频率大于0.01的数据。

image

6. ExAC

全称Exome Aggregation Consortium(http://exac.broadinstitute.org/),它整合了60706个无亲缘关系个体的数据,这些个体来源于大量疾病研究和群体遗传学研究,能够用做严重疾病研究的参考数据库。目前ExAC数据库中包括ALL,AFR(African),AMR(Admixed American),EAS(East Asian),FIN(Finnish),NFE(Non-finnish European),OTH(other),SAS(South Asian)。

通过ExAC的著述,可以了解该变异位点上突变碱基的等位基因频率,并可采用0.01的标准进行过滤。与1000Genomesprojects一样,有的公司会根据不同目标研究人种单独对某个子数据库进行分析,例如研究中国人,会另外在东亚EAS数据库中注释突变频率。

image

目标变异筛选(基于变异频率)

结合以上数据库,通过特定的阈值筛选,我们可以过滤很多无效变异。例如,可以过滤千人基因组数据库中频率大于0.01变异位点,以得到真正可能致病的罕见突变(rare)。也可以联合多个数据库对突变频率进行过滤,或者同时参考dbSNP中记录的SNP信息,初步判断数据库中不存在的变异为新发现变异,以增加研究价值。

不过值得注意的是,在dbSNP中没有记录的变异,有可能是新变异,也有可能是旧的符合条件的变异,更有可能是测序错误。因此在判断某一变异的价值的时候,需要结合其位置信息以及蛋白突变有害性等信息进行判断

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,366评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,521评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,689评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,925评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,942评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,727评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,447评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,349评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,820评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,990评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,127评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,812评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,471评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,017评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,142评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,388评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,066评论 2 355

推荐阅读更多精彩内容