Cross-tissue analyses of blood cells and endothelial cells:
针对血液细胞核内皮细胞的跨组织分析:
该数据集的性质为研究广泛出现的细胞类型(如血液和内皮细胞)内染色质可及性的器官特异性差异创造了机会。在我们对血细胞的第一次细胞类型注释中,我们能够区分髓细胞、淋巴细胞、成红细胞、巨核细胞和造血干细胞(图 2B)。
从所有器官中提取和重组这些血系使我们能够额外识别巨噬细胞、B 细胞、自然杀伤 (NK)/3 型先天淋巴样 (ILC3) 细胞、T 细胞和树突细胞,再次采用 RNA 辅助注释方法(分析来自多个组织的相似细胞类型需要额外的双重清洁步骤)(图 4A)。
巨噬细胞可以进一步分为与起源组织相关的组,如先前观察到的 (49),以及吞噬巨噬细胞。后一组主要在脾脏中被鉴定,其次是肝脏和肾上腺(图 S8A)。与 RNA 相比,我们没有在大脑中检测到单独的小胶质细胞簇,这可能是因为这是一种非常罕见的细胞类型 (~0.25%)(ps:我觉得microglia挺常见的。)
由于胎儿发育过程中红细胞生成的时空动态,血系中特别令人感兴趣的是成红细胞。 我们最初在肝脏、肾上腺、心脏和胎盘中检测到这种谱系(图 2B); 我们的跨组织分析还确定了浅层脾脏中的成红细胞(最初只注释了巨核细胞和骨髓细胞)。
组织血系中成红细胞的比例在肝脏中最高,这与该器官是该发育阶段红细胞生成的主要部位一致,其次是脾脏和肾上腺(图 S8A)(50, 51),对 (16) 中描述的 RNA 数据的趋势进行表型复制。
进一步研究成红细胞,我们观察到在这个发育阶段可以接近成人 b 和胎儿 g 珠蛋白基因的区域,而胚胎 e 珠蛋白基因的启动子是inaccessible(图 S8B)。成红细胞簇可以进一步细分为五个主要的 Louvain 簇,具有不同的染色质可及性,包括一个不同的成红细胞祖细胞簇(图 4A 和图 S8A)。成红细胞祖细胞簇以及相邻的早期成红细胞簇 (erythroblast_3) 中的可接近位点富含 GATA1::TAL1 以及其他 GATA 基序(图 4B)。
比较成红细胞祖细胞中各种 GATA 因子的表达水平,我们可以将 GATA1/2 命名为可能导致这种基序富集的 TF(图 S8C)。其他红细胞簇,对应于红细胞生成的后期阶段,显示 NFE2/NFE2L2 (erythroblast_1) 和 NFYB/KLF1 因子 (erythroblast_2/4) 的基序富集,但 GATA 基序可访问性明显缺乏富集。一项关于小鼠造血系统的 scRNA-seq 研究报告称,在红细胞生成早期诱导 GATA2,随后 GATA2 减少但 GATA1 表达稳定 (52)。
相比之下,对体外培养的大量人类红细胞群进行的一项研究显示,从祖细胞到分化的成红细胞,GATA1 表达降低,以及晚期成红细胞中 KLF1 和 NFE-2 水平增加(53)。在这一点上,我们的观察与大量体外人类数据一致,并表明可能存在表观遗传不同的分化成红细胞亚群(亚群 1、2 和 4),其中可及性景观由非 GATA 因素塑造(图 4B) )。例如,GYPA 上游的远端调节元件,被疟原虫用作红细胞入侵受体 (54),在 erythroblast_1 种群中最容易接近,并且包含一个类似于 NFE-2 基序的基序(图 4C)
造血干细胞 (HSC) 和成红细胞亚群的伪时间分析证实了 HSC 到成红细胞转变中祖细胞和早期成红细胞的顺序; 晚期成红细胞簇表现出相似的中位数假时间,表明它们可能代表分化的成红细胞的亚群,而不是一系列状态(图 S9、A 和 B)(55)。
该分析还指定了在红细胞生成过程中打开或关闭的候选调节元件( S9C)。 一些最高的 HSC 或红细胞祖细胞特异性峰(图 S9C)也可以在胎儿 - 但不是成人 - 肾上腺组织(56-58)的大量 DNase 谱中获得,在正常哺乳动物发育过程中支持肾上腺作为胎儿造血的场所(图 S9D)(16)。
另一种普遍存在的细胞类型是血管内皮,它需要跨器官执行组成性和高度特化的功能,例如肺中的气体交换或肾脏中的液体过滤。没有任何 TF 被描述为专门在血管内皮细胞中表达,这表明内皮特异性转录组由几个在内皮中重叠表达的 TF 组合控制(59)。与此一致,在我们对 JASPAR 基序的分析中,我们未能观察到任何单一的、强烈的内皮细胞富集(图 3B)。
然而,对 2000 个最内皮特异性峰的从头基序发现揭示了类似于 ERG [E-26 转化特异性 (ETS) 相关基因] 和 SOX15 [SRY(性别决定区 Y)的基序的背景基因组序列的富集。 –框 15](图 S7)。在我们的线性回归方法中,这些基序的权重可能没有那么强,因为它们不限于内皮细胞(ERG 基序富含巨核细胞,SOX15 富含多种细胞类型),这些 TF 的表达也不限于该细胞类型(图 S10A)。与此一致,ERG 被描述为内皮功能的主要调节剂 (60),但也驱动转分化为巨核细胞。
我们在 15 个器官中的 13 个中检测到内皮细胞,除了轮廓更浅的小脑和眼睛(图 2B)。 与成红细胞相反(图 S8A),尽管采用严格的迭代过滤步骤去除残留的污染双细胞,但提取内皮细胞和重新聚类显示出根据组织来源的显着分离(图 S10B)。 与此一致,我们还观察到胎儿组织中内皮基因表达的组织特异性方面 (16) 和先前发现在成年小鼠内皮细胞中表现出组织特异性染色质可及性的区域 (13)。 为了排除组织特异性信号的技术来源,我们选择了在 13 个组织中的每一个中确定的 20,000 个最具内皮特异性的峰,将它们合并为 94,023 个不同的峰,然后基于这些峰对提取的内皮细胞进行聚类(图 4D)。 细胞继续按组织聚类,类似于我们使用所有峰时(图 S10B)。
进一步支持内皮调节景观中的组织特异性差异,来自几乎所有器官的内皮细胞在这些峰内表现出特定的 TF 基序富集(图 4E)。许多富集基序的 TF 在 RNA 数据中匹配组织的内皮细胞中的表达也最高(图 4E)(16)。这些分析仅限于存在于 JASPAR 脊椎动物数据库中的 TF 基序,并且其他 TF 出现差异表达 (16)。
最后,最接近差异表达基因的可及性峰值在 ATAC 数据中大约一半的研究的器官的匹配组织中具有更高的内皮特异性评分(图 S10C)。例子包括 FOXF1,它在肺内皮中特异性表达和接近,其启动子近端区域包含一个 FOXA2 基序和 CLEC1B,它都在肝内皮中特异性表达,并含有一个含有 GATA 基序的候选调节元件,显示出肝内皮特异性的可及性(图 4F)。
一些(但不是全部)富集的基序也富集在同一组织的其他细胞类型中。虽然我们不能排除导致该信号的残留污染,但这也可能反映了潜在的生物学,例如,由于heterogeneous origins。
总的来说,这些发现表明内皮细胞中染色质可及性和基因表达的一般程序,内皮细胞是一种广泛分布的细胞类型,需要同时满足光谱的和器官特异性功能,也是由组成型 TF 的组合介导的,作为可能推动additional specialization的组织特异性 TF。 这些分析还强调了将组织间的从头基序和线性回归方法结合起来以指定塑造单个细胞类型染色质景观的关键调节因子的优点。