Construction of a human cell landscape at single-cell level
2020年发表在nature上,这篇文章是我两个月之前看的了,现在整理发出来
通讯作者:郭国骥教授 浙江大学医学院。
Highlight
•Determined the cell-type composition of all major human organs and constructed a scheme for the human cell landscape (HCL).
•Performed a single-cell comparative analysis of landscapes from both human and mouse to reveal the conserved genetic networks.
•Found that stem and progenitor cells exhibit strong transcriptomic stochasticity, while the differentiated cells are more distinct.
•Established a ‘single-cell HCL analysis’ pipeline that helps to define human cell identity.
这篇文章的目的是绘制一个完整的人类单细胞图谱。文章使用单细胞mRNA测序来确定所有主要人体器官的细胞类型组成,并构建了一个人类细胞景观图谱(HCL)。揭示了许多组织的单细胞层次结构。文章也对人类和小鼠的图谱进行了单细胞比较分析,揭示了两物种间保守的遗传网络。另外发现,干细胞和祖细胞表现出很强的转录随机性,而在分化的细胞中则更加特异。在技术方面,文章建立了一个“单细胞HCL分析”pipeline,帮助确定人类细胞的分型。
Results
Fig.1 | Constructing an HCL using Microwell-seq
文章思路较为清晰简单,较容易理解。流程如图所示。对来自胎儿和成人的60个组织和7种培养的细胞类型,包括诱导性多能干细胞(iPS)、胚状体细胞、造血细胞和胰腺细胞等进行单细胞测序,方法采用Microwell单细胞转录组测序技术,并按照之前发表过的pipeline进行后续数据分析,最后总共获得70万2968个细胞 。
首先文章绘制了人类组织数据集的图谱,这里不包括培养的细胞。上面这个TSNE图的每种颜色代表细胞分成的cluster,一共102个cluster,在图中用序号标出,下面的TSNE图的颜色代表着细胞来自的组织,并在右侧进行了注释。上下对照来看可以得出,动脉、气管、胸膜、食道、输卵管等组织,形成明确的成年基质细胞的cluster,包括cluster4 (C4)、C18、C27、C70。还有其他的显著由多组织构成的cluster包括胎儿基质细胞群、内皮细胞群、巨噬细胞群和胎儿上皮细胞群等。然后对102个cluster进行了聚类,以系统进化树的形式呈现。并且结合bulk与单细胞数据的相关分析,证明了这个单细胞图谱在关于基因和细胞类型方面的覆盖度很广。
文章对每个特定的器官都进行了TSNE和基因表达分析,发现了在人体组织细胞中未曾发现的的异质性。文章展示了肾脏和肺部的具体分析。胎儿肾器官分为了21个细胞亚型,成年肾器官分成22个细胞亚型,包括上皮细胞、内皮细胞、基质细胞和组织驻留免疫细胞等。在胎儿肾脏中发现了新的s型体细胞(FC1、FC9和FC15),在成人肾脏中发现了新的IC-tran-PC细胞类型(AC19)。在肺中,确定了22个胎儿cluster和25个成人cluster,在胎儿肺中发现了远端祖细胞(FC4)和近端祖细胞(FC9),以及在成人发现了肺泡2型细胞(AC1)、肺泡1型细胞(AC3)等独有的细胞亚型,尤其是肺泡双能/中间细胞(AC14)同时表达KRT8、细胞周期蛋白基因,以及来自肺泡1型2型的谱系标记。
文章对这两种器官构建配体-受体图,以揭示肾脏和肺组织的细胞与细胞间相互作用。正如图所示,内皮细胞和基质细胞位于这两种器官细胞互作网络的中心。研究人员猜测,在胎儿组织中,基质细胞和内皮细胞与上皮细胞祖细胞相互作用以支持组织发育。然而,在成年期,猜测它们与免疫细胞如T细胞和巨噬细胞进行相互作用。
Fig.2 | Immune activation of non-immune cells in the HCL.
值得注意的是,文章在包括膀胱和肾脏在内的多种成人组织中发现了表达MHC II类基因如HLA-DPA1和HLA-DRA的内皮细胞群(图2a)。内皮细胞标记物PECAM1 (CD31)和MHCII类标记物HLA-DR的免疫荧光检测进一步证实了成人膀胱内抗原呈递内皮细胞的存在(图2b)。这种特异性的抗原呈递信号提示内皮细胞具有潜在的免疫功能。为了评估非免疫细胞在人类区域免疫中的参与情况,文章对内皮细胞、上皮细胞和基质细胞进行了跨阶段跨组织比较,以了解其免疫相关基因的表达情况(图2c)。在大约一半的成人组织中发现了MHC II类+内皮细胞、白介素表达的基质细胞和CXCL+上皮细胞(扩展数据见图6e和f)。发现了非免疫细胞的广泛免疫激活为 组织特异性免疫 提供了一种新的细胞调控机制。
为了描述内皮细胞的整体细胞层次结构,文章整合了不同组织的内皮细胞数据并鉴定了14个主要的细胞簇。在tSNE图中,cluster2 3 9包含多个胎儿组织,包括心脏、皮肤和肾脏。C8、C11、C12和C13内皮细胞具有组织特异性,而C6和C10则由不同的成人器官共享。重要的是,有一组内皮细胞包括C1、C5和C7,它们具有高表达的免疫相关基因。C1内皮细胞广泛存在于成人器官,如膀胱、肾脏、动脉、甲状腺、网膜等;它们表达HLA-DRA、CD74和HLA-DRB1。C5内皮细胞来源于成人子宫,高表达CXCL8、IL6等。C7内皮细胞来源于成人肾脏,高表达HLA- DQA1、HLA-DPA1和EMCN。以类似的方法,文章对基质细胞也进行了跨组织分析,确定了人类图谱中基质细胞层次结构中的四个免疫活性cluster(C5、C8、C12和C15)。
然后,文章想要通过评估胎儿期和成人期组织细胞类型的相似性来研究人体器官的发育。在肾脏和肺中,上皮细胞、基质细胞、内皮细胞和免疫细胞的基因表达模式在这两个阶段之间存在相关性;组织内的免疫细胞和基质细胞在器官发生过程中较早出现。
为了可视化整体谱系发展的过程,文章使用PAGA方法对胎儿和成人HCL数据进行了轨迹分析。获得了一幅显示胎儿祖细胞对成年成熟细胞类型的预测图(扩展数据图8c和d)。在这幅图上,定义了36个细胞cluster,排列成10多个谱系分支。重要的是,胎儿细胞位于图谱的中心并且它们之间的距离更近。成体细胞从中间密集区向不同方向扩散。然后在成年阶段高度分离。此外,研究人员用SLICE算法计算单细胞熵表示转录组的稳定性,胎儿期的单细胞熵比成体期的单细胞熵大,说明胎儿期的细胞具有更高的转录可塑性,而成体期的细胞则具有更稳定的转录组。
文章中用现有的数据构建了一个单细胞人类细胞图谱分析的pipeline。可以将测序结果匹配到构建的人类细胞图谱的reference上,做相关分析,以分辨细胞类型。研究人员并用这套pipeline进行了一项分析,发现,在第24天的分化培养中,许多细胞与已知的胰腺细胞类型有很强的相关性(图3b),红色代表匹配的相关性高,灰色相反。C3、C5、C8细胞在基因的表达上可以看出有向不同细胞分化的趋势。然而在这个pipeline的结果中较难区分开。
然后使用这个pipeline分析来自H9/OP9共培养的造血细胞。只有含有内皮细胞和红细胞的C7和C11细胞在成熟的人类细胞类型中具有较高的评分(图3c)。少数C7和C11细胞在H9/OP9共培养体系中表现出较低的转化效率。没有发现任何与人类造血干细胞和祖细胞相关的细胞。
接下来,我们检查了从胚胎干细胞分化的第20天胚状体细胞也就是EB细胞的单细胞数据。EB的单个细胞被分成15个不同的cluster,根据reference匹配,cluster分别映射到间充质细胞、神经元细胞、室管膜细胞和免疫细胞。但是也有几个cluster无法被识别。发育轨迹和RNA velocity分析表明,未定义的细胞簇位于分化层次的根部,RNA变化率较高,而已定义的细胞类型位于轨迹的末端,转录组相对稳定(图3d)。在分化20天后,许多EB细胞似乎仍处于原始未确定状态,而有些细胞则经历了这种高变化率状态并表现出稳态。这种体外干细胞分化层次结构模拟了体内胎儿-成体细胞类型(扩展数据图8c和d)。并且还发现,利用CD34+脐带血和CD34+外周血的单细胞数据,人类造血分化系统也具有类似的模式。
单细胞转录组学为细胞类型的跨物种分析提供了机会。可以在人类和小鼠之间做个比较细胞景观。研究人员构建了老鼠细胞图谱,将分析参数调成和人类图谱一致。从数据中提取同源基因以进行跨物种分析。102个人类和104个小鼠细胞类型之间的correlatio热图显示,同源基因表达的细胞类型相似性超过了物种间的差异,特别是对于免疫细胞和上皮细胞(图4a)。Circos图显示,哺乳动物主要细胞类型的基因表达模式是保守,图中所示的都是相关评分大于0.9的连线,种间约95%的细胞类型具有很强的相关性(图4b)。
然后文章研究了构成哺乳动物细胞类型保守性的遗传网络。我们使用SCENIC算法从HCL和MCA数据中提取TF调节子。在哺乳动物细胞结构中鉴定了140个同源TF,分为15个主要模块(图4c);例如,M1与神经元、M6/8/11/13/15与免疫细胞、M7与内皮细胞、M9与基质细胞类型相关。这些模块不仅富含家族特异性的转录因子,而且还含有保守的结合基序,从而导致谱系建立中协调的模块激活(图4c)。
虽然文中也发现了一些特异的TF,但是大部分的TF还是保守的。例如,少突胶质细胞的SOX10调节子和神经元的SOX11调节子是人类和小鼠共享的(图4d)。发育相关的SOX4调控子支配着聚在一起未分离的胎儿细胞cluster;但又同时在人类和小鼠中广泛而随机的分布(图4e)。这点与所见的基因表达谱一致,干细胞和祖细胞调控子缺乏谱系特异性和稳定性。然而,已经分化细胞的调控子似乎连接得更特异且;他们可以通过持续的自我强化达到稳定状态。
总体来说文章的思路就是,使用Microwell-seq对不同人体组织进行大量的单细胞转录组分析。然后研究在人类各组织器官之间的异质性。由于还有胎儿的数据,于是研究了胎儿到成人之间细胞亚型的转变。用目前测得的人类数据设计了自己的pipeline,并用培养的细胞验证。最后构建了小鼠的细胞图谱,并在跨物种之间进行了比较。
这个景观图谱研究的优势在于对胎儿和成人组织类型的广泛覆盖。在于细胞数量的多而且组织丰富,并且为其他人研究单细胞的细胞分型构建了很方便的pipeline,在我们的研究中可以尝试获得细胞分型的验证。同时这篇文章思路简单清晰,从胎儿到成年的时间跨越,从小鼠到人类的物种跨越都有研究,研究十分广泛,是一篇对人类细胞总结的研究。