2021年11月25日,美国明尼苏达大学实验室医学和病理学系的研究人员在 Nature Communications 杂志上发表了“Single-cell analysis identifies dynamic gene expression networks that govern B cell development and transformation”的研究。该研究利用单细胞测序技术精确地描述了 B 细胞发育的不同阶段,发现了前 B 细胞前期分化的几个阶段,包括一个前 BCR 依赖阶段和两个前 BCR 非依赖阶段,表现出不同的增殖方式。前 BCR 依赖阶段分化过程的特征是转录因子 EBF1 的运动调节以及与 RNA 结合蛋白 YBX3 发生相互变化,而前 BCR 非依赖阶段与趋化因子和细胞因子受体的变化相关,提示这些阶段可能涉及骨髓中前 BCR 非依赖阶段亚群的差异定位。最后,研究了与不同急性 B 淋巴细胞白血病(B-ALL)亚型相关的 B 细胞发育节点以及它们与预后的关系,证明 YBX3 与人类 B-ALL 不良预后相关。
研究背景
流式细胞术和各种表面和细胞内标记物描绘了 B 细胞发育的不同阶段。然而,这些标记不足以充分划分不同的亚群,导致不能完全理解 B 细胞发育轨迹中 B 系转录因子表达动力学以及在增殖和分化交替周期下转录程序的编排,捕捉 B 细胞从一个阶段分化到下一个阶段的过渡状态尤为困难。此外,B 细胞正常分化过程中的干扰可导致 B 细胞急性淋巴细胞白血病(B-ALL)的发生。最近对 B-ALL 亚型的表征显示了不同的转录特征,表明 B 细胞的转化有多个起源点或受不同的信号通路驱动。因此,了解正常的 B 细胞转录程序可以确定转化发生的阶段以及 B-ALL 如何利用 B 细胞完成发育途径。
研究思路
研究结果
1. 利用单细胞转录和蛋白标记测序技术识别 B 细胞的发育阶段
为了将转录信息与 B 细胞阶段定义的表面标志物的表达相结合,研究联合使用了单细胞 RNA-seq 和 CITE-Seq。选取两只野生型 C57BL/6 小鼠骨髓,分别用识别 CD45 和 MHC I 类的独特寡标记抗体进行标记,进一步用 CITE-Seq 抗体对细胞染色并富集早期 B 细胞(图1a)。对转录数据进行处理,得到了7454个细胞,14个细胞群(图1b)。通过测定代表不同时期的典型基因的表达水平,发现增殖细胞(G1PM、S和G2/M期)聚集在远离静止细胞(G0/G1)的地方,表明循环状态是变化的主要来源(图1c)。同样,Mki67 基因表达水平在 G1PM、S 或 G2/M 期细胞中较高(图1c)。与单细胞转录数据相比,CITE-seq 数据具有更高的敏感性,被标记为 CD43+ 的细胞组成了大部分的循环细胞,符合之前报道的循环祖 B 细胞的特征(图1d)。
2. 前祖 B 细胞和祖 B 细胞的转录特征
对前祖 B 细胞分析发现这些细胞表达早期 B 系相关基因,如 Flt3、Il7r 和 Cd79a(图2a)。这些细胞同时也高表达髓系相关转录因子 Runx2、Irf8 和 Tcf4,以及浆细胞样树突状细胞标记物 Bst2,而在祖 B 细胞阶段,这些基因的表达被抑制(图2b)。进一步评估了前人报道的抑制 Ebf1 靶基因(包括 Tyrobp、Clec12a、Cd300a、Cd7、Chdh 和 Mycl)的表达,发现这些靶基因在前祖 B 细胞中高表达,而在祖 B 细胞中表达较低,进一步将前祖 B 细胞与祖 B 细胞区分开来(图2c,2b)。之后使用先前显示可富集 B 细胞祖细胞的 CD93 ADT 抗体表达来确定 B 细胞偏向的非定向祖细胞在这个群中的存在。结果显示在该群中,CD93 表达中位数以上的细胞富集了 B 细胞分化相关基因,如 Ebf1、Cd24a 和 Vpreb1(图2d)。传统上被描述为 c-KIT+ 细胞的祖 B 细胞表达了 Kit 基因。此外,祖 B 细胞表达了 Bcl-2 家族基因 Bok 和干扰素刺激基因 Ifitm2 和 Ifitm3(图2e)。最后,Ebf1 正向调节了前 BCR 替代轻链基因 Vpreb1 和 Igll123 的表达。与不表达 Ebf1 的前祖 B 细胞相比,祖 B 细胞高表达 Vpreb1 和 Igll1(图2f)。证实了一些与前祖 B 细胞向祖 B 细胞过渡相关的基因表达模式,同时识别出高度特异性的祖 B 细胞标记,如 Bok。
3. 前 B 细胞增殖包括前 BCR 依赖和前 BCR 非依赖的增殖阶段
对前 BCR 依赖的增殖簇进行转录特征分析发现前 BCR 依赖的细胞适度表达了 Vpreb1 和 Igll1,上调表达神经颗粒素 Nrgn 和一种调节 Slc7a5 和 Slc3a2 翻译的 DNA/RNA 结合蛋白 Ybx3(图2f, 3a)。Myc 在表达 Ybx3、Slc7a5 和 Slc3a2 的前 BCR 依赖细胞中表达最高,但 Ebf1 的表达显著减少,转录因子 Pax5 的表达基本不变,Ikzf1 被适度诱导(图3a, 3b)。与 Ebf1 低表达相一致的是,Ebf1 的靶基因如 Cd79a 和 Cd79b32 以及前 BCR 信号负调节因子 Il7r 的表达在前 BCR 依赖期显著降低(图3c)。对前 BCR 依赖细胞群中前100个差异上调基因进行 LISA 和 GSEA 分析发现 Myc 是前 BCR 依赖的增殖过程中关键的转录调控因子(图3d)。进一步分析了包含 Ebf1 结合位点的差异调控基因,发现 EBF1 在 Nrgn 和 Myc 的启动子、Myc 增强子以及 Slc7a5 和 Slc3a2 的启动子区有明显或潜在的结合位点(图3e)。对野生型和 Pax5+/− ×Ebf1+/−白血病前体 B 细胞进行 RNA-seq,发现 Slc7a5 和 Slc3a2 以及 Ybx3 随着 Ebf1 基因表达的降低而上调,表明 EBF1 介导了前 BCR 相关基因表达的抑制(图3f)。
对其余循环细胞的特征分析发现,这些细胞具有中等水平的 ADT-CD43 表达,表明它们正在向静止的 CD43lo/−小前 B 细胞阶段过渡。这些细胞群中的一些细胞表达前 B 细胞的 marker 蛋白 CD25(图4a)。然而,与前 BCR 依赖的细胞群不同的是,这些细胞高表达 Bach2(一种抑制抗原受体信号传导的转录因子),而低表达 Ybx3 和 Myc(图3a, 4b, 4c),表明这些前 B 细胞的增殖不依赖于前 BCR 信号。对前 BCRi I 中前 BCR 依赖和非依赖的细胞之间的差异表达基因进行比较,发现前 BCR 非依赖的细胞高表达高 Il7r 和 Ebf1(图3b, c, 4d)。对前 BCR 非依赖 2个亚群分析发现,前 BCRi I 高表达组蛋白基因(图4d),而前 BCRi II 在表达细胞运动相关的肌动蛋白(Actg1)、动力蛋白(Dynll1)和胸腺素(Tmsb4x 和 Tmsb10)基因的细胞中富集(图4e)。有趣的是,随着前 B 细胞到达 前 BCR 非依赖阶段,Cxcr4 的表达进一步被诱导(图4b)。CXCR4 的表达会促进前 BCR 非依赖细胞靶向 CXCL12 表达的细胞,这些细胞也经常在骨髓中高表达 IL7。因此,前 BCR 非依赖细胞可能依赖于 CXCR4/IL7R 信号,并可能受 MIF/CD74/CD44 和 IGF1/IGF1R 信号轴介导,以有效地从前 BCR 依赖状态过渡到前 BCR 非依赖状态。
4. B 细胞分化和成熟
静止 IgM- 细胞中 Rag1 和 Rag2 的高表达,表明前 B 细胞和祖 B 细胞发生了 V(D)J 重组(图5a)。Igkc 在所有细胞亚群中都有表达,但除了循环前 B 细胞和前 BCR 依赖的 B 细胞外,Iglc1、 Iglc2 和 Iglc3 只在一个细胞亚群中表达(图5a)。IgM+ 细胞被分成三个簇:未成熟 B 细胞、循环未成熟 B 细胞和成熟 B 细胞。循环未成熟 B 细胞表面高表达 IgM,未成熟 B 细胞表达 Ms4a1 和表面蛋白(CD20),而成熟 B 细胞表达 Ms4a4c、H2-Aa、Sell 和 Ltb(图5b)和表面蛋白 IgM 和 CD43(图1d)。
5. B 细胞发育的拟时序和模块分析
归一化细胞周期相关基因之后将转录组数据重新聚类并使用阶段定义 marker 确定了 B 细胞发育的13个不同阶段。未成熟 B 细胞被分成两个细胞群,前 BCRi II S 和 G2/M 被合并为一个细胞群,进行拟时序分析识别跨越发育轨迹变化的基因模块(图6a, b)。对这些基因模块进一步分析表明,B 细胞的早期阶段(包括前祖 B 细胞和祖 B 细胞)在细胞粘附过程中显著富集,而这些信号在前 B 细胞中减弱(模块1和模块8,图6c, d)。此外,循环祖 B 细胞和前BCR 依赖细胞富集涉及代谢过程的基因(模块6),提示在 B 细胞发育过程中主要检查点后的代谢重编程。最后,对转录因子、表观遗传修饰因子(图6e)、细胞因子、趋化因子及其相应受体(图6f)的表达评估表明 B 细胞发育过程中表达动力学存在差异。
6. 阶段特异性基因表达网络与人 B-ALL 亚型和预后相关
为了识别与人类 B-ALL 亚型相关的 B 细胞发育途径,研究使用 Seurat 和 Monocle 分析中识别的差异上调基因,将每个阶段的转录网络与不同的人类 B-ALL 亚型进行比较(图7a)。结果表明富集在祖细胞、前 BCR 依赖和前 BCR 非依赖亚群中的人类 B-ALL 亚型(BCL2/MYC、IKZF1、N159Y 和 KMT2A 亚型),都与高风险不良预后相关,而具有其他 B 细胞分化阶段特征的基因如 ETV6-RUNX1 和 ZNF384 的 B-ALL 亚型,则预后良好(图7a)。进一步聚类检验结果显示,B 细胞增殖与分化阶段的差异具有统计学意义(图7b,左),与 B 细胞增殖相关的高风险白血病明显不同于与 B 细胞分化相关的低风险白血病(图7b,右)。前 BCR 模块基因 YBX3 和 NRGN 在 BCL2/MYC、IKZF1、N159Y 和 MEF2D B-ALL 亚型中显著高表达,但并非所有前 BCR 基因都具有这种模式,表明与正常发育的 B 细胞相比,B-ALL 具有转录异质性(图7c)。通过检测 YBX3 的表达与 B-ALL 预后的相关性发现 YBX3 表达高于中位数以上的儿童 B-ALL 预后较差,而成人 B-ALL 患者生存率无显著差异(图7d)。确定了在 B 细胞发育过程中受调控的 B 细胞基因表达网络(图7e),并特别证明 YBX3 与人类 B-ALL 不良预后相关。
研究结论
研究主要从机制上探讨了 B 细胞发育过程与高风险白血病的关系。通过激活不同的增殖模块,导致高风险白血病和不良预后。在前 BCR 依赖白血病中,使用靶向 YBX3 或前 BCR 相关模块的诊断方法也许能进一步改善这些高危 B-ALL 患者的预后。
参考文献
Lee, R.D., Munro, S.A., Knutson, T.P.et al. Single-cell analysis identifies dynamic gene expression networks that govern B cell development and transformation.Nat Commun12, 6843 (2021). https: //doi.org/10.1038/s41467-021-27232-5.