CRISPR筛选是一种高通量的功能基因组学技术,利用CRISPR-Cas系统系统性地扰动基因组中的基因,以鉴定它们在特定生物过程或表型中的作用。它基于CRISPR-Cas系统精确编辑DNA的能力,该系统最初源自细菌的免疫系统。以下是其原理的详细分解:
1. CRISPR-Cas的核心机制
CRISPR(成簇规律间隔的短回文重复序列)筛选依赖于Cas酶(通常来自链球菌的Cas9)和引导RNA(gRNA)来靶向特定的DNA序列。其关键步骤包括:
-
gRNA设计:gRNA是一种短RNA分子,包含两个部分:
- 一个20个核苷酸的序列(spacer),与目标DNA互补配对。
- 一个骨架序列,与Cas酶结合。
gRNA通过与目标DNA的碱基配对,将Cas酶引导至特定的基因组位点,前提是存在一个邻近原型间隔序列基序(PAM),例如Cas9需要的NGG序列。
DNA切割:一旦结合,Cas9在目标位点(通常在PAM上游3–4个核苷酸处)引入双链断裂(DSB)。
-
DNA修复:细胞通过以下方式修复DSB:
- 非同源末端连接(NHEJ):一种易出错的修复过程,常引入小的插入或删除(indels),导致基因敲除,破坏编码序列。
- 同源定向修复(HDR):在筛选实验中较少使用,但在提供供体DNA模板时用于精确编辑。
在CRISPR筛选中,NHEJ诱导的基因敲除最为常见,因为它能破坏基因功能,允许研究者研究功能丧失的效应。
2. CRISPR筛选的类型
CRISPR筛选可根据研究目的进行调整,主要包括以下类型:
CRISPR敲除(CRISPR-KO):标准方法,gRNA靶向蛋白编码区域,产生功能丧失突变,用于鉴定关键基因或与特定表型(如药物抗性)相关的基因。
CRISPR干扰(CRISPRi):使用催化失活的Cas9(dCas9)与转录抑制因子融合,抑制基因表达而不改变DNA序列。这种方法是可逆的,适用于研究敲除会导致细胞死亡的必需基因。
CRISPR激活(CRISPRa):dCas9与转录激活因子融合,上调基因表达,用于功能获得研究。
碱基编辑筛选:较新的系统使用碱基编辑器(如胞嘧啶或腺嘌呤碱基编辑器)引入单核苷酸变化,允许在不引入DSB的情况下进行精确突变研究。
每种方法以不同方式修改基因功能,灵活地探究基因的作用。
3. gRNA丰度变化的原理
在CRISPR筛选(特别是池式筛选)中,gRNA(引导RNA)被用来靶向特定基因,引起基因功能扰动(通常是敲除)。通过比较筛选前后细胞群体中gRNA的丰度变化(即gRNA的相对数量),研究者可以推断哪些基因对特定表型(如细胞存活、药物抗性)有重要影响。gRNA丰度的变化分为富集和耗竭两种情况,分别反映了基因功能丧失对细胞选择性影响的不同结果。
以下是详细原理:
3.1 CRISPR筛选的基本流程回顾
为了理解gRNA丰度的变化,先简要回顾池式CRISPR筛选的工作原理:
- 初始状态:一个包含数千到数百万个gRNA的文库被导入细胞群,每个gRNA靶向一个特定基因。低感染复数(MOI)确保每个细胞通常只接收一个gRNA,从而将细胞的表型与其靶向基因关联。
- 选择压力:细胞群接受某种选择压力(如药物处理、特定生长条件),导致某些细胞存活或增殖,而其他细胞死亡或增殖受限。
- gRNA丰度测量:通过下一代测序(NGS)技术,在筛选前后提取细胞的基因组DNA,扩增并量化gRNA的丰度。丰度变化反映了特定gRNA(及其靶向基因)对细胞表型的影响。
富集和耗竭是基于筛选后gRNA相对丰度的变化来定义的:
- 富集:某些gRNA在筛选后变得更常见(丰度增加)。
- 耗竭:某些gRNA在筛选后变得更少见或消失(丰度减少)。
3.2 富集gRNA的原理
富集指的是在筛选后,某些gRNA的相对丰度显著高于初始状态。这表明敲除这些gRNA靶向的基因赋予了细胞某种选择优势,使这些细胞在选择压力下更有可能存活或增殖。
机制:
- 选择优势:当某个基因被敲除后,细胞在特定选择压力下获得生存或增殖优势。例如,在药物抗性筛选中,敲除某些基因可能使细胞对药物不敏感,从而在药物处理后存活下来。
- 细胞富集:携带这些gRNA的细胞在选择压力下存活并增殖,而其他细胞死亡或增殖受限。因此,这些gRNA在最终细胞群体中的比例增加。
- 测序结果:通过NGS测序,富集的gRNA在筛选后样本中的读数(reads)显著高于对照样本(筛选前或未受选择压力的样本)。
示例:
- 药物抗性筛选:假设研究者用一种抗癌药物处理细胞群。如果敲除某个基因(如抑制药物代谢的基因)使细胞对药物产生抗性,携带该基因gRNA的细胞会在药物处理后存活并增殖。这些gRNA在最终样本中的丰度会显著增加,表明该基因与药物抗性相关。
- 生物学意义:富集的gRNA指向的基因通常是负向调控表型的基因,敲除它们增强了细胞在特定条件下的适应性。
3.3 耗竭gRNA的原理
耗竭指的是在筛选后,某些gRNA的相对丰度显著低于初始状态。这表明敲除这些gRNA靶向的基因导致细胞在选择压力下存活或增殖能力下降,通常是因为这些基因对细胞存活或表型至关重要。
机制:
- 选择劣势:当某个基因被敲除后,细胞在选择压力下失去存活或增殖能力。例如,敲除一个对细胞存活必需的基因会导致细胞死亡或生长受限。
- 细胞耗竭:携带这些gRNA的细胞在选择压力下被淘汰(死亡或停止增殖),而其他细胞继续存活。因此,这些gRNA在最终细胞群体中的比例减少甚至消失。
- 测序结果:通过NGS测序,耗竭的gRNA在筛选后样本中的读数显著低于对照样本。
示例:
- 必需基因筛选:在细胞存活筛选(不加额外选择压力)中,敲除某些基因(如DNA修复或代谢通路中的关键基因)会导致细胞死亡。携带这些gRNA的细胞在筛选后逐渐消失,因此这些gRNA的丰度显著降低,表明这些基因对细胞存活至关重要。
- 生物学意义:耗竭的gRNA指向的基因通常是正向调控表型的基因,敲除它们削弱了细胞的适应性。
3.4 定量分析gRNA丰度变化
gRNA丰度的变化通过以下步骤定量分析:
- DNA提取与测序:从筛选前(T0)和筛选后(T1)的细胞群中提取基因组DNA,扩增gRNA序列并进行高通量测序。
- 读数比较:计算每个gRNA的测序读数(reads),并将其归一化到总读数,得到相对丰度。
-
富集/耗竭计算:
- 富集:T1样本中gRNA的相对丰度显著高于T0(通常用log2倍变化或统计显著性p值评估)。
- 耗竭:T1样本中gRNA的相对丰度显著低于T0或接近零。
- 统计分析:使用工具如MAGeCK或BAGEL,基于gRNA丰度变化计算基因水平的显著性,考虑多条gRNA的一致性以减少假阳性。
- 富集与耗竭的生物学意义
- 富集gRNA:指示敲除该基因赋予细胞竞争优势,可能与抑制性基因(如肿瘤抑制基因在癌症研究中)相关。例如,在药物筛选中,富集gRNA可能指向药物代谢或信号通路的负调控因子。
- 耗竭gRNA:指示敲除该基因导致细胞劣势,通常与必需基因(如细胞周期、DNA修复或代谢通路中的基因)相关。例如,在存活筛选中,耗竭gRNA可能指向细胞存活必需的核心基因。