这几年单细胞图谱的研究比较风靡,在人类和模式动物里面陆续构建了景观全图谱(landscape),用于探索不同组织不同细胞类型的异质性。最近,我们就重点解析一下最近几年发表的几个paper是如何构建这个全图谱以及如何应用全图谱的。
今天要解读的这个文章是:Construction of a human cell landscape at single-cell level。
2020年发表在nature上。通讯作者:郭国骥教授,浙江大学医学院。
这篇文章的主要目的是绘制一个完整的人类单细胞图谱。
文章使用单细胞转录组测序来确定主要人体器官的细胞类型组成,并构建了一个人类细胞景观图谱(HCL:Human Cell Landscape),从而揭示了许多组织的单细胞层次结构。文章也对人类和小鼠的图谱进行了单细胞比较分析,揭示了两物种间保守的遗传网络。另外发现,干细胞和祖细胞表现出很强的转录随机性,而在分化的细胞中则更加特异。
==============实验设计==============
对来自胎儿和成人的60个组织和7种培养的细胞类型,包括诱导性多能干细胞(iPS)、胚状体细胞、造血细胞和胰腺细胞等进行单细胞测序,方法采用Microwell单细胞转录组测序技术。
=============结果解读=============
作者按照之前发表过的pipeline进行单细胞数据的分析,最后总共获得702,968个细胞,一共102个cluster 。图1B和C是tSNE图,分别按细胞类型以及样品组织来源着色。图D则是每个cluster的进化树以及包含的subcluster的数目。上下对照来看可以得出,动脉、气管、胸膜、食道、输卵管等组织,形成明确的成年基质细胞的cluster,包括cluster4 、18、27、70。还有其他的显著由多组织构成的cluster包括胎儿基质细胞群、内皮细胞群、巨噬细胞群和胎儿上皮细胞群等。
接着作者对每个组织器官都进行了单独的分析,也可以发现了在人体组织细胞中未曾发现的一些细胞异质性。文章highlight了肾脏和肺部的详细分析结果。
在分析不同器官的过程中,作者发现在包括膀胱和肾脏在内的多种成人组织中发现了表达MHC II类基因如HLA-DPA1和HLA-DRA的内皮细胞群(图2a)。内皮细胞标记基因PECAM1 (CD31)和MHCII类标记基因HLA-DR的免疫荧光检测进一步证实了成人膀胱内抗原呈递内皮细胞的存在(图2b)。这种特异性的抗原呈递信号提示内皮细胞具有潜在的免疫功能。为了探索这些非免疫细胞在免疫过程中的作用,文章又对内皮细胞、上皮细胞和基质细胞进行了跨阶段跨组织比较,以了解其免疫相关基因的表达情况(图2c)。在大约一半的成人组织中发现了MHC II类+内皮细胞、白介素表达的基质细胞和CXCL+上皮细胞(附图6)。发现了非免疫细胞的广泛免疫激活,从而为组织特异性免疫调控提供了一种新的机制。
接着,作者又对内皮细胞进行了更为详细的分析。文章整合了不同组织的内皮细胞数据并鉴定了14个主要的细胞簇(图2d)。从tSNE图中可以看出,有一些cluster具有组织特异性(8,11,12,13),有些cluster则是不同组织共享的(6,10)(图2d,2e)。用类似的方法,作者也对其它的细胞类型做了相似的分析,例如基质细胞。
因为文章中的样品,有胎儿期的,也有成人期的。所以作者尝试通过比较胎儿期和成人的细胞类型来探索人体器官的发育。在肾脏和肺中,上皮细胞、基质细胞、内皮细胞和免疫细胞的基因表达模式在这两个阶段之间存在相关性(附图8a和8b)。组织内的免疫细胞和基质细胞在器官发生过程中较早出现。
为了可视化整体谱系发展的过程,文章使用PAGA方法对胎儿和成人HCL数据进行了轨迹分析。获得了一幅显示胎儿祖细胞对成年成熟细胞类型的预测图(附图8c和d)。在这幅图上,定义了36个细胞cluster,排列成10多个谱系分支。重要的是,胎儿细胞位于图谱的中心并且它们之间的距离更近。成体细胞从中间密集区向不同方向扩散。然后在成年阶段高度分离。此外,研究人员用SLICE算法计算单细胞熵表示转录组的稳定性,胎儿期的单细胞熵比成体期的单细胞熵大,说明胎儿期的细胞具有更高的转录可塑性,而成体期的细胞则具有更稳定的转录组。
接下来,作者还查看了第20天胚状体细胞,利用发育轨迹和RNA速率对各个方面进行了准确性的阐述(图3d,3e,3f)。
除了人类单细胞数据的不同对比,作者还尝试在不同物种,尤其是哺乳动物之间进行对比。在这个文章中,作者尝试利用人类的单细胞数据和小鼠进行对比,从而从跨物种的角度看不同细胞类型的单细胞level的特征。利用相同的分析方法,作者构建了小鼠的单细胞图谱。相关性分析发现,同源基因表达的细胞类型相似性超过了物种间的差异,特别是对于免疫细胞和上皮细胞(图4a)。Circos图显示,哺乳动物主要细胞类型的基因表达模式是保守,结果显示种间约95%的细胞类型具有很强的相关性(图4b)。
然后作者利用SCENIC方法分析了人类和小鼠单细胞图谱的TF调控特征。对比发现,一共鉴定了140个同源TF,分为15个主要模块(图4c)。例如,M1与神经元、M6/8/11/13/15与免疫细胞、M7与内皮细胞、M9与基质细胞类型相关。这些模块不仅富含家族特异性的转录因子,而且还含有保守的结合基序(图4c)。作者highlight了其中保守的转录组因子例如:SOX10和SOX11(图4d)。进一步的分析发现发育相关的SOX4调控子支配着聚在一起未分离的胎儿细胞cluster,但又同时在人类和小鼠中广泛而随机的分布(图4e)。