欢迎关注公众号oddxix
如果觉得写的不错记得点个赞,谢谢支持~
1.简介
官网:http://exac.broadinstitute.org
ExAC数据库的全称是(the Exome Aggregation Consortium,外显子组整合数据库),该数据库旨在汇总和协调各种大规模测序项目的外显子组测序数据,并为更广泛的科学界提供摘要数据。所有数据均基于GRCh37 / hg19。2016年8月,Nature刊登了一篇ARTICLE,主要重点就是哈佛-麻省理工Broad研究所的科学家公布了60706名不同种族个体的外显子序列。整合了多个研究项目的外显子集合协作组(ExAC)分析了来自不同祖先的共60706位个人的高质量外显子测序数据,通过深度分析制作的人类遗传变异数据库ExAC并制定了每个序列变异的致病性的精确度量标准。研究鉴定了根据选择压力区别的突变类型;鉴定了3230个基因截短突变,其中72%的基因没有与已知的人类疾病表型建立关系。ExAC数据库可以用来过滤潜在的致病性突变,避免遗传误诊以及发现更多遗传性疾病的致病因素及根源提供了有力的工具。
1.1三大数据库数量对比
1、1000 Genomes(共2,504个,全基因组和外显子)
2、ESP(6,503个,仅外显子)
3、ExAC(60,706个,仅外显子)
从覆盖全面性来说,ESP和ExAC仅覆盖外显子,显然不如1000Genomes全面;从样品数量上来说,毋庸置疑,ExAC有6万多,而其他两个都在千级,自然是ExAC数量占优势。但是,重要的事情说三遍,要知道,人群携带率是要分人种的,欧洲人的人群携带率和非洲的,必然有差异。
ExAC中人群分布
ExAC中包含的同类群组
2.2三大数据库人种构成对比:
1、1000 Genomes:AFR: African; AMR: Ad Mixed American; EAS: East Asian; EUR: European; SAS: South Asian
2、ESP6500:AFR: African; AMR: Ad Mixed American; EAS: East Asian; EUR: European; SAS: South Asian
3、ExAC:African/African American; AMR: American; EAS: East Asian; FIN: Finnish; NFE: Non-Finnish European; SAS: South Asian; OTH: Others)
从上图,可以看出,ExAC数据库,60,706这个数字里面,European,也就是欧洲人占了最大比例,约4万;对于中国人群,参考价值最大的East Asian,东亚人(日本、台湾为主)数量最少,不到5千。
2. 搜索
网站首页
2.1基本信息
显示了基因相关信息,以及相关外部链接
2.2突变类型统计
基因突变类型统计,其中LoF包含:Nonsense, splice acceptor, and splice 突变。具体可以查看FAQ
第一列是变异类型
第二列是预期变异数目
第三列是检测到的变异数目(AF<0.0001)
-
第四列是约束指标。对于同义和错义,我们为观察到的计数与预期数量的偏差创建了一个带符号的Z分数。阳性Z分表示增加的约束(对变异的不耐受),因此该基因具有比预期更少的变体。对具有比预期更多变异的基因给予负Z分数。
2.3Gene summary
箭头1所指是突变在基因上的覆盖率
箭头2所指是在外显子上的分布
箭头3所指是CNV分布
2.4具体变异信息
第一列变异类型,第二列所在染色体,第三列染色体上的位置,第四列变异造成的氨基酸的改变情况,第四列过滤信息,第五列变异类型
2.5变异信息
点开其中的一条变异信息,可以看到,这个变异在各种人群中的突变频率,用于基因筛选。
3.注释
一般使用ANNOVAR进行exac注释
table_annovar.pl ZWJ-A_indel.avinput /home/yang.zou/database/humandb_new/ -buildver hg19 -out myanno -remove -protocol refGene,snp138,1000g2014oct_eas,exac03 -operation g,f,f,f -nastring NA -outfile ZWJ-A_inde
得到突变在各种人群中的频率。
ExAC_ALL所有人群
ExAC_AFR 非洲/非裔美国人
ExAC_AMR拉丁美洲人
ExAC_EAS东亚人
ExAC_FIN芬兰人
ExAC_NFE非芬兰欧洲人
ExAC_OTH 其他人群
ExAC_SAS南亚人
欢迎关注oddxix