星形胶质细胞作为大脑中最丰富的神经胶质细胞,在调节神经元功能和可塑性中发挥关键作用,其基因表达异常与阿尔茨海默病等神经退行性疾病密切相关。复杂性状相关的遗传变异常位于远端增强子区域,但这些增强子在特定细胞类型中的功能状态及靶基因仍不明确。新南威尔士大学生物技术与生物分子科学学院、细胞基因组未来研究所和RNA研究所团队通过CRISPRi(干扰)文库筛选结合单细胞RNA测序,构建了人类原代星形胶质细胞的增强子-基因调控资源库,揭示了调控星形胶质细胞核心功能及AD相关基因的关键增强子。此类大规模、高通量的功能性基因组学研究,离不开成熟的CRISPR文库设计、构建与筛选服务平台的支持。在这方面,海星生物凭借其丰富的经验与技术积累,可为科研人员提供从sgRNA设计、慢病毒文库制备到功能性筛选验证的一站式解决方案,助力类似本研究的复杂调控网络解析工作。
一、研究方法
细胞模型:研究使用胎儿脑来源的正常人星形胶质细胞(NHA),并通过稳定表达dCas9-KRAB构建了用于CRISPRi筛选的细胞系。通过转录组和染色质可及性分析,证实该细胞系保持了胎儿期星形胶质细胞的特征(图1b,c)。
候选增强子筛选:从PsychENCODE计划预测的脑活跃调控区域出发,结合NHA自身的ATAC-seq数据(染色质开放区域)以及多个独立的星形胶质细胞/神经细胞ATAC-seq数据集,筛选出位于基因间区、在染色质开放状态且位于包含高表达基因的拓扑关联域(TAD)内的979个候选增强子区域(图1d-g)。
CRISPRi筛选与单细胞RNA测序:针对每个候选增强子,设计并合成了至少2条sgRNA,构建了包含2478条sgRNA的文库。以MOI=5将文库转导至NHA-dCas9-KRAB细胞中,7天后进行单细胞RNA测序(scRNA-seq)。通过分析每个增强子被抑制的细胞与对照细胞之间,在增强子500kb范围内所有基因的表达差异,来鉴定功能性的增强子-基因。
计算分析与模型构建:利用筛选获得的“金标准”数据(158对功能性EGPs),研究团队训练了一个新的随机森林预测模型——EGrf,用于在全基因组范围内预测星形胶质细胞中的增强子-基因调控关系。
多层次验证:对筛选得到的关键EGPs,使用NanoString数字RNA计数、qRT-PCR甚至蛋白质印迹(Western Blot)在不同细胞系中进行独立验证,确保了结果的可靠性。
二、核心研究结果解析
结果1:CRISPRi文库筛选鉴定星形胶质细胞功能性增强子-基因对
阳性对照中125个启动子中的122个被显著沉默,阴性对照未出现P值膨胀,证实筛选体系可靠(图1d、e)。
筛选鉴定出145个增强子调控116个基因,形成158个调控对,其中84.1%导致基因表达下调,平均绝对log2倍变化为0.22(图2a);多数增强子调控单个基因,部分基因可被多个增强子调控,最多达5个增强子共同调控一个基因(图2b)。功能性增强子富集于K562细胞中经实验验证的增强子和星形胶质细胞超增强子区域,且EGPs极少跨越TAD边界,符合增强子调控的基因组特性(图2c);NanoString验证20个调控对,18个显示显著效应,且与单细胞筛选结果高度相关(r=0.86)(图2d)。
结果2:功能性增强子的基因组与转录特征
50%的调控相互作用发生在50kb内,76%发生在200kb内,虽增强子调控最近基因的概率显著高于随机水平(OR=11.7),但仅38.6%的调控对靶向最近基因,29.1%的增强子会跳过高表达基因调控远端基因(图3a、b);功能性增强子与转录活性密切相关,73.1%的功能性增强子存在转录活性,且更可能为双向转录(OR=1.8),转录水平显著高于非功能性候选增强子(图3c-e);48%的功能性增强子在不同细胞类型中染色质状态存在显著差异,34%在细胞类型和发育阶段中均有差异,其中星形胶质细胞富集模块M3中的功能性增强子,其H3K27ac水平在星形胶质细胞中显著高于其他细胞类型(图3f、g)。
结果3:星形胶质细胞特异性调控网络解析
增强子调控基因显著富集于"趋化"、"细胞迁移"、"创伤响应"等星形胶质细胞核心功能(图4a),以及星形胶质细胞特异性、成熟调控、衰老相关和IL-1α+TNF+Clq诱导的激活相关基因,而管家基因显著匮乏(图4a、b);功能性增强子更易被星形胶质细胞中表达的转录因子结合,83个转录因子在功能性增强子中结合富集(FDR<0.05),包括参与星形胶质细胞激活的FOXK1和介导星形胶质细胞成熟的RUNX2(图4c)。
构建包含18个星形胶质细胞特异性基因、19个星形胶质细胞特异性增强子及36个星形胶质细胞特异性转录因子的调控网络,72%的预测转录因子-增强子相互作用得到ChIP-seq数据支持,且均在星形胶质细胞富集组分中检测到(图4d、e)。
结果4:AD相关基因的增强子调控机制
增强子调控基因在AD相关基因集中显著富集,特别是在ROSMAP队列中,158个调控对中的100个涉及与AD神经病理或认知功能相关的基因(图5a、b)。
鉴定出调控LGALS3(编码Galectin-3,介导星形胶质细胞-小胶质细胞串扰)的三个增强子,其中两个具有星形胶质细胞特异性染色质开放状态;同时鉴定出调控11个其他AD差异表达基因的功能性增强子,这些增强子可为细胞特异性靶向调控提供靶点(图5b、c)。
通过NanoString验证16个调控AD相关基因的增强子,均证实其调控效应,包括三个调控LGALS3的增强子(图5c)。
结果5:非编码变异的功能注释与预测模型构建
研究者将CRISPRi发现的调控相互作用与多个大脑eQTL数据库(GTEx,mmQTL等)进行比较。结果发现,仅有17%的CRISPRi EGPs能被任何eQTL数据捕获;高达40%的情况下,eQTL将同一增强子与CRISPRi发现的不同基因相关联(图6b,c)。例如,调控星形胶质细胞关键基因ID3的两个增强子,虽被实验验证且位于超级增强子区,却未被任何大脑eQTL数据捕获(图6b)。这表明,CRISPRi功能筛选能揭示大量eQTL研究由于统计效力、细胞类型异质性或罕见变异等原因所遗漏的调控关系,为解读非编码区变异提供了宝贵的新资源。
基于CRISPRi筛选数据训练的EGrf模型,在星形胶质细胞中预测准确性(AUPRC=0.57)显著高于现有模型(如ABC、rE2G-DNase);应用EGrf在全基因组范围内预测出1348个高特异性EGPs,其中5个预测调控AD相关基因的增强子经CRISPRi验证,4个证实有效(图7a-d)。
三、研究意义
该研究通过CRISPRi文库筛选首次构建了人类原代星形胶质细胞的增强子-基因调控资源库(AstroREG),揭示了星形胶质细胞特异性调控网络,鉴定出调控AD相关基因的关键增强子,为理解神经退行性疾病机制提供了全新视角。研究同时开发了适用于星形胶质细胞的增强子-基因预测模型,显著提升了细胞特异性调控关系的预测准确性,为非编码基因组功能注释提供了重要工具。
未来,在反应性星形胶质细胞、与神经元共培养的星形胶质细胞等不同功能状态下进行类似筛选,将进一步丰富我们对大脑基因调控网络的理解。此外,结合CRISPRa(激活)或碱基编辑等技术,将能更全面地解析增强子功能及特定序列变异的影响。海星生物作为基因编辑领域的专业服务商,拥有成熟的CRISPR-KO、CRISPRa、CRISPRi文库构建与筛选、敲除和点突变等经验,能够为神经科学、疾病机制等前沿研究提供从方案设计到数据产出的全方位技术支持,助力科学家更快、更准地解锁非编码基因组的奥秘。
参考文献:Green N F O, Sutton G J, Pérez-Burillo J, et al. CRISPRi screening in cultured human astrocytes uncovers distal enhancers controlling genes dysregulated in Alzheimer’s disease[J]. Nature Neuroscience, 2025: 1-14.