距今100多年前,Ramon y Cajal开启了探索大脑中单个细胞卓越多样性和异质性的历程。将这种多样性进行分类并有条不紊地普查,是一项数代人持续努力的工作。如今,如发表在Nature杂志上的10篇论文所示,BRAIN Initiative Cell Census Network(BICCN)的研究人员运用尖端的单细胞和空间基因组学技术,全面揭示了脊椎动物神经科学领域广泛应用的实验室模型——小鼠(Mus musculus)大脑中的细胞类型。通过整合这些数据集,研究人员成功绘制了具有高分子和空间分辨率的成年小鼠脑神经元和非神经元细胞类型的综合图谱。
圣地亚哥·拉蒙·卡哈尔(Santiago Ramón y Cajal,1852——1934年)是西班牙神经学家、病理学家、艺术家,他醉心于脑研究,绘制了复杂、美丽、精确的脑内部工作原理图。时至今日,在神经科学领域,这些图仍然被用来展示构成记忆和人类思维基础的神经架构。
卡哈尔首先假设脑中的神经元相互接触,但并不连接。这一假设直到20世纪50年代才得到科学证明。这种学说被称为神经元理论,它认为脑中的每个神经元都是独立的,神经元通过突触进行交流。1906年,卡哈尔和高尔基共同获得了诺贝尔生理学或医学奖。卡哈尔是第一位获得该奖项的西班牙科学家。

具有广泛应用的综合资源

这个综合图谱汇集了小鼠大脑各部分超过3200万个细胞的单细胞转录组学、表观组学和空间转录组学特征。这些数据系统地揭示了整个大脑中各细胞类型的分子遗传多样性,以及它们之间的连通性。
借助单细胞和单核RNA测序(scRNA-seq和snRNA-seq)技术,研究人员分析了1300多万个细胞和细胞核,涵盖了数百个单独解剖的脑区域。他们提出了全面的、分层组织的转录组细胞类型分类方法,包括整个大脑中的数十个细胞类型、数百个亚型和5300多个细胞集群。这种分类方法发现了8000多个细胞类型标记基因,其中至少包括2000个组合标记基因可以区分所有已识别的细胞类型。
通过此次研究,我们对单个脑区的相对分子多样性、特定细胞类型所使用的神经递质和神经肽、不同神经解剖结构中细胞类型的相关变异有了更全面、定量和明确的认识。同时,我们还获得了一组转录因子基因,这些基因描绘出整个大脑中细胞类型之间的层次关系。
构建转录组和空间图谱

鼠全脑细胞类型的高分辨率转录组学和空间图谱[1]
构建图谱的过程涉及整合约700万个细胞的单细胞RNA测序数据集(其中大约400万个细胞通过了质量控制),以及约430万个细胞的MERFISH空间转录组数据集。这个图谱按照四个层次进行分类,包括34种细胞类型、338个亚型、1201个超类和5322个集群。图中所有神经元和非神经元细胞类型都标注了详细的解剖位置、神经递质、神经肽、转录因子以及其他标记基因表达,共计确定了8460个标记基因。研究结果表明,转录因子是成年小鼠脑细胞类型分类的关键决定因素,并确定了定义所有脑区细胞类型的组合转录因子。
鼠全脑的分子定义和空间解析细胞图谱[2]
通过利用MERFISH技术对约1,000万个细胞中的1,100多个基因进行空间转录组分析,研究揭示了整个小鼠脑空间组织中的5,000多个转录差异集群,这些集群属于338个亚型。在将MERFISH产生的细胞图谱映射到Allen Mouse Brain Common Coordinate Framework [3]后,研究人员可以系统地量化每个脑区域和解剖结构中的细胞类型组成和结构。通过转录组定义细胞类型的空间分布,研究划分出100多个分子水平定义的脑区,并确定了许多脑区的空间梯度。整合MERFISH和scRNA-seq数据后,研究人员能在整个转录组范围内(超过20,000个基因)推算出整个脑MERFISH图像中每个细胞的基因表达谱。高分辨率的细胞空间图谱以及与每个细胞相关的转录组表达谱,使得研究人员能够推断数百个细胞类型对之间的特异性相互作用,并预测这些细胞-细胞相互作用的分子基础(配体-受体)和功能影响。
成年小鼠脑的分子细胞结构[4]
通过整合约600万个snRNA-seq图谱和一个全脑Slide-seq数据集(在440万个10微米像素上全面量化全基因组表达),研究人员成功实现了细胞类型在单个脑区的系统空间定位。研究发现,在进化较为古老的脑区,尤其是中脑、后脑和下丘脑,细胞类型的多样性令人瞩目。实际上,在中脑和下丘脑中发现的细胞类型甚至超过了整个端脑。在研究相关细胞类型在不同结构中的分布时,研究人员发现,投射神经元(向脑其他部位发送远距离连接)比常驻中间神经元更具区域独特性。为了加大对研究相对较少的细胞类型的功能研究力度,研究人员鉴定了可以唯一确定这些细胞类型所需的最小基因集,从而能够构建新的基因工具,对这些细胞进行特异性捕获。
小鼠中枢神经系统的分子分辨率空间图谱[5]
运用原位空间转录组学方法STARmap PLUS,研究人员成功构建了具有分子分辨率的小鼠中枢神经系统空间图谱。该图谱包含了109万个高质量单细胞数据,以194×194×345 nm3的分辨率对1022个基因的表达以及重组腺病毒的转导进行了分析。在将这些数据与scRNA-seq数据集整合后,可以对空间映射的单细胞中的约12000个基因进行填补,并对单细胞基因表达进行聚类,最终绘制出230种分子水平细胞类型的空间图谱。通过聚类空间单细胞,研究人员构建了空间生态位基因表达,定义了106个分子组织区域。此外,研究还对先前建立的解剖学定义进行了完善,例如解剖学上前后脑皮层之间分子组织区域组成的差异、齿状回颗粒层的背腹分离以及小脑小叶之间颗粒层的空间表达梯度等。
剖析表观遗传景观和基因调控元件

成年小鼠脑单细胞DNA甲基组和三维多组学图谱[6]
研究人员利用单核甲基化组和多组学测序技术,从成年小鼠全脑的117个解剖区域生成了301,626个甲基化组和176,003个染色质构象-甲基化组联合图谱。通过迭代聚类并与配套的全脑转录组和染色质可及性数据集整合,研究人员构建了一个基于甲基化数据的细胞分类法,其中包括4,673个细胞群和274个跨模式标注的亚类。这项研究在整个基因组中发现了260万个不同的甲基化区域,这些区域代表了潜在的基因调控元件。通过全脑细胞类型比较,可以建立起包含转录因子、调控元件及其潜在下游基因靶点的调控网络。最后,基因内DNA甲基化和染色质构象模式预测了在全脑SMART-seq数据集中观察到的可变基因异构体表达。
成年小鼠脑染色质可及性的单细胞分析[7]
通过对来自117个解剖切片的230万个单个脑细胞的染色质可及性进行检测,绘制了一个全面的成年小鼠脑候选顺式调控DNA元件(cCRE)图谱。该图谱包括约100万个cCREs及其在1482个不同脑细胞群中的染色质可及性,为小鼠基因组的最新注释增加了44.6万个新的cCREs。研究人员推断了260多种小鼠脑细胞亚型的基因调控网络,并开发了深度学习模型,仅通过DNA序列就能预测不同脑细胞类型中基因调控元件的活动。
神经元表观基因组学与远端投射的全脑对应关系[8]
Epi-retro-seq将单细胞表观组和细胞类型与33,034个神经元的长距离投射联系起来,这些神经元从32个不同区域解剖出来,投射到整个小鼠脑的24个不同靶点(225个来源-靶点组合)。该数据集可以量化投射到不同目标脑区的神经元之间的基因差异,标注分子水平细胞类型及其投射目标,并通过投射丰富的细胞类型构建基因调控网络。
哺乳动物新皮层的保守和分化基因调控程序[9]
研究人员利用单细胞多组学分析方法,对人类、猕猴、狨猴和小鼠初级运动皮层的基因调控程序进行了研究,生成了20多万个细胞的基因表达、染色质可及性、DNA甲基化组和染色体构象图谱。数据显示,三维基因组的进化反映了基因调控特征的保守性和差异性。转录因子表达的差异与物种特有的表观基因组景观相对应。值得注意的是,在脑皮层细胞中,近80%的人类特异性cCREs是由转座元件造成的。利用机器学习方法开发的基于序列的cCRE预测器表明,从啮齿动物到灵长类动物,基因组调控规则高度保守。表观遗传学保守性与序列相似性相结合,有助于识别功能性顺式调控元件,并提高我们解释导致神经系统疾病和性状的基因变异的能力。
脊椎投射和视网膜的研究提供了更多的见解

小鼠全脑脊髓投射神经元转录组分类法[10]
通过病毒介导的逆行标记和snRNA-seq技术,我们构建了脊髓投射神经元(SPNs)的联合解剖和转录组图谱。脊髓投射神经元是一种特殊类型的神经元,它们通过轴突直接连接大脑和下游脊髓电路。这一分类法包括3个分支、13个亚类和76种类型,这些类型分布在脑皮层、下丘脑、中脑、桥脑背侧被盖体、桥脑网状结构和小脑深核。我们将全脑MERFISH数据集(由Allen Institute生成)与这一分类法整合,成功地将76种脊髓投射神经元类型映射到其解剖位置。研究结果表明,脊髓投射系统包括三个不同但互补的组成部分(或"分部"),每个部分具有独特的转录组学和解剖学特性。第一部分由皮质脊髓神经元、红脊髓神经元和小脑脊髓神经元组成,这些神经元仅具有兴奋性,转录相对单一。第二部分是网状结构中高度异质性的兴奋性和抑制性网状脊髓神经元。第三类是调节性脊髓投射神经元,它们表达慢作用神经递质和/或神经肽,分布于整个下丘脑、中脑和脑干。
脊椎动物视网膜神经细胞类别和类型的进化[11]
尽管脊椎动物的脑结构差异较大,但视网膜的基本结构几乎没有变化。通过比较17种脊椎动物的细胞类型,研究者发现了许多跨系统发育的同源细胞类型。许多与小鼠视网膜细胞类型分化有关的转录因子在进化上具有高度保守性,这表明这些发育机制具有古老的起源。研究还发现了被称为"侏儒"的视网膜神经节细胞(RGC)类型,这种细胞占人类RGC的90%。这些类型被认为是灵长类动物的特有创新,这限制了在视网膜疾病小鼠模型等中对它们进行分析的能力。然而,本次进化比较揭示了小鼠的同源细胞,称为α-RGCs。值得注意的是,这些细胞体积较大,仅占小鼠RGC的2%;追踪它们的进化过程表明,它们可能会随着视觉皮层的扩大而变得更小更多,而视觉皮层是人类视觉处理的主要中心。这种对应关系表明,视网膜和脑皮层的平行进化为灵长类提供了高敏锐度的视觉。
这些资源将如何发挥作用?

由于细胞特性的非凡多样性尚未被系统地鉴定,学界对于细胞类型的定义尚未达成共识。然而,本研究中描述的各细胞类型的转录组、表观组和空间特性之间的高度对应性,为脑细胞类型的组织定义提供了一个强有力的框架。随着其他细胞特性的不断探索和确定,它们可以被分层到这个框架上,从而增强我们对“细胞类型”这一概念的信心。然而,在大多数情况下,我们对转录组特性如何映射到生理、形态、连接和功能特性仍知之甚少。借助这些研究中描述的细胞类型的初始分子和空间框架,进一步研究将这些不同特性联系起来,将有助于实现对细胞类型的更统一定义。
全脑转录组、表观基因组和空间细胞类型图谱为整合和拓展现有的大量知识奠定了基础,推动了对脑细胞和回路功能、发育和进化的深入研究,类似于研究基因功能和基因组进化的参考基因组。这些健康成人脑图谱还为研究不同生理(如发育)和疾病条件下分子特性和细胞功能的动态变化提供了基线。细胞类型的分子和空间特性将有助于创建针对特定细胞类型的靶向工具,用于标记和操纵,从而探测和控制其在体内的功能。这些工作将有助于从机理上深入理解哺乳动物脑中细胞类型和回路的成因、功能,以及它们在疾病中的功能障碍。
小鼠脑细胞图谱为其他物种和不同发育时期生成类似的全面而详细的细胞类型图谱提供了起点。由于人脑含有大约2000亿个细胞,而小鼠脑只有大约1亿到1.5亿个细胞,因此需要大量资源才能在此基础上继续发展。但是,一旦我们掌握了这些数据,比较人类与模式生物之间细胞类型的保守性和分化将对我们理解人类脑功能和疾病产生深远影响。
细胞类型图谱的在线资源


Allen Brain Cell (ABC) Atlas – Mouse Whole Brain
https://portal.brain-map.org/atlases-and-data/bkp/abc-atlas
CZ CELLxGENE Discover
https://cellxgene.cziscience.com/collections/0cca8620-8dee-45d0-aef5-23f032a5cf09
Macosko lab Brain Cell Data Viewer
https://braincelldata.org/
Ecker lab online platform: Whole Mouse Brain Cell & Genome Atlas
https://mousebrain.salk.edu/
Ren lab webportal for chromatin accessibility
http://catlas.org/catlas_hub/
Epi-Retro-Seq web application
http://neomorph.salk.edu/epiretro/
参考文献
[1] Yao, Z., van Velthoven, C.T.J., Kunst, M. et al. A high-resolution transcriptomic and spatial atlas of cell types in the whole mouse brain. Nature 624, 317–332 (2023).
[2] Zhang, M., Pan, X., Jung, W. et al. Molecularly defined and spatially resolved cell atlas of the whole mouse brain. Nature 624, 343–354 (2023).
[3] Wang Q, Ding SL, Li Y, et al. The Allen Mouse Brain Common Coordinate Framework: A 3D Reference Atlas. Cell. 2020;181(4):936-953.e20.
[4] Langlieb, J., Sachdev, N.S., Balderrama, K.S. et al. The molecular cytoarchitecture of the adult mouse brain. Nature 624, 333–342 (2023).
[5] Shi, H., He, Y., Zhou, Y. et al. Spatial atlas of the mouse central nervous system at molecular resolution. Nature 622, 552–561 (2023).
[6] Liu, H., Zeng, Q., Zhou, J. et al. Single-cell DNA methylome and 3D multi-omic atlas of the adult mouse brain. Nature 624, 366–377 (2023).
[7] Zu, S., Li, Y.E., Wang, K. et al. Single-cell analysis of chromatin accessibility in the adult mouse brain. Nature 624, 378–389 (2023).
[8] Zhou, J., Zhang, Z., Wu, M. et al. Brain-wide correspondence of neuronal epigenomics and distant projections. Nature 624, 355–365 (2023).
[9] Zemke, N.R., Armand, E.J., Wang, W. et al. Conserved and divergent gene regulatory programs of the mammalian neocortex. Nature 624, 390–402 (2023).
[10] Winter, C.C., Jacobi, A., Su, J. et al. A transcriptomic taxonomy of mouse brain-wide spinal projecting neurons. Nature 624, 403–414 (2023).
[11] Hahn, J., Monavarfeshani, A., Qiao, M. et al. Evolution of neuronal cell classes and types in the vertebrate retina. Nature 624, 415–424 (2023).