基因型组织表达GTEx团队 跨人类组织的遗传调控作用
GTEx Consortium. The GTEx Consortium atlas of genetic regulatory effects across human tissues[J]. Science, 2020, 369(6509): 1318-1330.
Source: https://science.sciencemag.org/content/369/6509/1318
Abstract
① 建立了基因型组织表达(GTEx)项目,以表征人类组织对转录组的遗传效应,并将这些调控机制与特质和疾病关联性联系起来。
② 在这里,我们介绍了对版本8数据的分析,检查了来自838个死后捐赠者的49个组织的15,201个RNA测序样品。
③ 我们全面表征了顺式和反式基因表达和剪接的遗传关联,表明几乎所有基因都存在调控关联,并描述了潜在的分子机制及其对等位基因异质性和复杂性状的多效性的贡献。
④ 利用组织的多样性,我们提供了遗传效应的组织特异性的见解,并表明细胞类型组成是了解人类组织中基因调控机制的关键因素。
Introduction
the version 8 (v8) data release from the GTEx Consortium: 我们提供了遗传调控变体的目录,该变体影响49个组织中顺式和反式的基因表达和剪接,并描述了组织的模式和机制以及遗传调控作用的细胞类型特异性。通过整合GTEx数据与全基因组关联研究(GWASs),我们表征了转录组的遗传效应如何介导复杂性状关联的机制
Quantitative trait locus (QTL) discovery
所得数据为个体和组织特异性基因表达提供了广泛的调查,使人们能够全面了解遗传变异对基因调控的影响(图1B)。我们绘制了影响基因表达(eQTL)或剪接(sQTL)的蛋白质编码和长基因间非编码RNA(long intergenic noncoding RNAs, lincRNA)基因,顺式和反式的遗传基因座。具有eQTL或sQTL的基因分别称为eGenes和sGenes,相应的重要变体分别称为eVariants和sVariants。
Genetic regulatory effects across populations and sexes
① 由于外部复制数据集稀疏,因此我们开发了一种AE方法,用于验证来自相同样品的正交数据类型(17):cis-eQTL杂合的个体的等位基因失衡允许cis-eQTL效应大小的个体水平量化( 21),并且可以与在cis eQTL分析中使用的相互作用项相关联,以验证cis-eQTL关联的修饰子效应
② 为了表征性别差异的遗传效应对GTEx组织中基因表达的影响,我们绘制了性别偏向的cis-eQTLs(sb-eQTLs)。分析所有条件独立的cis-eQTL的集合,我们通过拟合线性回归模型并测试显着的基因型-性别(G×S)相互作用,鉴定出性别差异显着的eQTL
③ 我们还对人口偏向的cis-eQTL(pb-eQTL)进行了表征,其中欧洲和非洲血统的个体之间,变体对基因表达的分子影响有所不同,可控制等位基因频率,连锁不平衡(LD)和协变量的差异
Fine-mapping
所有遗传关联研究的主要挑战是将因果变体与其 LD proxies 区分开来,我们应用了三种不同的 statistical fine-mapping 方法—CaVEMaN(30), CAVIAR (31), and dap-g (32)—推断每个组织中顺式eQTL的可能原因变异
Functional mechanisms of QTL associations
来自多种分子表型的定量性状数据,与基因组的调控注释相集成,是了解遗传调控作用的分子机制和表型后果的有力方法。
Genetic regulatory effects mediate complex trait associations
为了分析调节性变体在人类性格遗传关联中的作用,我们首先问GWAS目录中的变体是否与针对QTL进行测试的所有变体相比均富含重要的QTL
① We observed a 1.46-fold enrichment for cis-eQTLs (63% versus 43%) and 1.86-fold enrichment for cis-sQTLs (37% versus 20%).
② To minimize the possible impact of cell type heterogeneity on these enrichment statistics, we excluded blood cellularity traits and repeated these analyses.
③ 这种方法没有充分利用GWAS和QTL关联统计的全部功能,也没有考虑LD污染,在这种情况下,QTL和GWAS信号的因果变量不同,但是两个因果变量之间的LD可能表明功能链接错误
因此,为进行后续分析(下),我们选择了87个GWAS,它们代表了广泛的二元和连续复杂性状,其摘要结果可在公共领域获得。
④ 为了分析顺式调节基因表达对复杂性状的介导作用(35、42),我们使用了两种互补方法QTLEnrich(43)和分层LD评分回归(stratified LD score regression,S-LDSC)
⑤尽管这些富集方法对于全基因组估计QTL对GWAS信号的贡献非常有力,但它们并不能指导单个基因座的调节机制。因此,为了对来自87个复杂性状的大约独立的LD区块(46个)的1167个基因座中的5385个重要GWAS关联进行功能解释,我们与ENLOC(32)进行了共定位以量化cis-QTL和GWAS的概率信号共享相同的因果变量。我们还评估了PrediXcan的表达或剪接的遗传调控成分与复杂性状之间的关联
⑥ 对大量基因具有多个独立的cis-eQTL,可以让我们测试一级和二级cis-eQTL对表型的介导作用-GWAS与cis-eQTL效应大小之比-是否一致。为确保一致性不受主要和次要信号之间残留的LD驱动,我们使用低共定位概率的LD匹配顺式eGenes作为对照(11、41),并观察到共定位的主要和次要cis-eQTL一致性显着提高基因(相关t检验P <10-30)
⑦ 我们计算了 each fine-mapped 和 LD-pruned cis-eVariant per tissue 在局部假信号率(LFSR)<5%的情况下的顺式eGenes数量,使用masher对组织的效应大小进行了平滑处理(11,51)。我们观察到,平均有57%的变体与每个组织的一个以上基因相关,通常在整个组织中同时出现,这表明广泛的调节性多效性。
Tissue specificity of genetic regulatory effects
① QTL的整体组织特异性(11)呈U形曲线,概括了以前的GTEx分析(9,10),其中反式eQTL的遗传调控作用往往是高度组织特异性的或高度共有的(图6C)。比顺式eQTL具有更高的组织特异性
② 接下来,我们分析了个体的多个组织之间的AE共享,这是该个体中任何杂合调节变异效应共享的度量。
From tissues to cell types
GTEx组织样品由多种细胞类型的杂种新混合物组成。 因此,从这些样品中提取的RNA和定位的QTL反映了多种遗传效应的组合,这些遗传效应可能会随细胞类型而变化,并可能掩盖特定于细胞类型的机制。
为了表征细胞类型异质性对大块组织分析的影响,我们使用xCell方法(53)从每个样品的大块表达谱中估算了64种参考细胞类型的富集。