scATAC:人类基因组的染色质可及性图谱
scATAC:人类基因组的染色质可及性图谱-1
scATAC:人类基因组的染色质可及性图谱-2
scATAC:人类基因组的染色质可及性图谱-3
result4:
Integrative analysis of adult and fetal chromatin accessibility
将成年和胎儿的染色质可及性数据进行整合
为了检查胎儿和成人阶段之间的转录调节因子和 cCRE 重塑(remodeling),我们使用相同的质量控制、聚类、 和上述注释策略,结果发现了 111 种胎儿细胞类型和 802,025 个 cCRE。 将这些 cCRE 与从成人细胞类型中鉴定出的 cCRE 相结合,我们在 222 种胎儿和成人细胞类型中绘制了总共 1,154,611 个不同的 cCRE,跨越人类基因组的 14.8%。 这些 cCRE 分别覆盖了 EpiMap和 ENCODE cCRE 注册表中 58.5% 和 69.7% 的元件。 此外,我们的 34.8% 和 51.0% 的 cCRE 分别没有被 EpiMap 和 ENCODE cCRE registry注释。
为了比较两个染色质可及性图谱中的 222 种胎儿和成人细胞类型,我们使用 SnapATAC 进行batch-correction,以获得来自胎儿和成人组织的 1,323,041 个细胞核的低维表表现(图 3A 和 3B)。
我们接下来进行系统发育分析,根据低维空间中定义的距离将胎儿和成人细胞类型分为不同的组。一般来说,属于不同谱系的细胞类型分成独立的组,并含有特定的 cCRE,这些 cCRE 富含先前表征的谱系特异性 TF 基序。然而,尽管许多胎儿细胞类型(如淋巴、骨髓和内皮细胞)聚集在树中的成人细胞附近,但一些细胞类型(如神经元和骨骼肌细胞)在成人和胎儿阶段之间存在显着差异,表明 cCRE 不同这些细胞类型在开发过程中的使用。为了更系统地量化成人和胎儿细胞类型之间染色质可及性的差异,我们比较了每对胎儿和成人细胞类型的 1,154,611 个 cCRE 列表中的标准化可及性(图 3C、3D )。
我们发现,与其他细胞类型(如神经元、神经胶质细胞和骨骼肌细胞)相比,胎儿细胞类型(如免疫细胞和内皮细胞)与成年细胞的相关性相对较高(图 3D),这与我们的系统发育分析的结果一致。总之,这些分析表明,cCRE remodel以实现发育阶段特定功能的程度在人类细胞类型之间差异很大。
为了揭示可能构成胎儿或成人特异性调节程序的特定元素,我们计算了包含相应成人和胎儿细胞类型的主要细胞群的生命阶段特异性 cCRE(图 4A)。这些元素的表征揭示了惊人的生命阶段特定的监管计划(图 4B 和 4C)。例如,骨骼肌细胞在产前和产后发育过程中显着分化,并且与大多数其他主要细胞类型相比,其生命阶段之间的整体相似性较低(图 3C 和 3D)。总共,我们确定了胎儿和成人骨骼肌细胞之间的 72,648 个差异可及 (DA) cCRE(图 4D)。
胎儿肌细胞中的 DA cCRE 与胚胎发育和对创伤的反应等生物过程相关,并富含协调正常肌生成的肌源性调节性 TF (MRF) 基序(图 4E 和 4F),突出显示这些元件在调节胎儿肌细胞的生肌特性中的作用。
另一方面,成人骨骼肌细胞 DA cCRE 与肌肉对收缩活动的适应以及胰岛素和类固醇激素反应相关的生物学过程相关,并富含 MEF 家族成员 (p = 1e 424) 和 AP-1 复合体- 包括 FOSL1 (p = 1e 274)(图 4D 和 4E)在内的 成员,表明这些元件在调节成人骨骼肌对激素暴露和负荷的转录反应中的作用。根据这些本体论结果以及在整个人类生命周期中已建立的肌球蛋白同种型表达模式,我们在编码以下标记基因的基因座上发现了 DA cCREs产前肌细胞包括 MYH3 和 MYH8,分别是胚胎和新生儿肌球蛋白的重链,以及 I 型(慢)和 II 型(快)肌细胞的标志物,分别包括 MYH6/MYH7 和 MYH1/MYH2(图4F)。总之,这些发现分别揭示了可能构成胎儿和成人骨骼肌细胞增殖能力和成熟功能的调控因素,并强调了该数据集与在生命周期不同时间点收集的用于确定生命的新兴人类细胞图谱的价值细胞类型分辨率下的阶段特异性基因调控程序。