Crisp编辑的原理
Crisp基因敲除: 非同源末端连接方式(NHEJ)对断裂的DNA进行修复,修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变
Crisp基因敲入: DNA修复模板进入到细胞中,基因组断裂部分会依据修复模板进行同源重组修复(HDR),从而实现基因敲入。
基因抑制、基因激活(Repression or Activation):
Cas9的特点是能够自主结合和切割目的基因,通过点突变的方式使Cas9的两个结构域RuvC-和HNH-失去活性,形成的dCas9只能在sgRNA的介导下结合靶基因,而不具备剪切DNA的功能。
因此,将dCas9结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;
将dCas9结合到基因的启动子区域也可以结合转录抑制/活化物,使下游靶基因转录受到抑制或激活。因此dCas9与Cas9、Cas9 nickase的不同之处在于,dCas9造成的激活或者抑制是可逆的,并不会对基因组DNA造成永久性的改变。
多重编辑 Multiplex Editing:将多个sgRNA质粒转入到细胞中,可同时对多个基因进行编辑,具有基因组功能筛选作用。多重编辑的应用包括:使用双Cas9nickases提高基因敲除的准确率、大范围的基因组缺失及同时编辑不同的基因。通常情况下,一个质粒上可以构建2~7个不同的sgRNA进行多重CRISPR基因编辑
1.Crisp会寻找有PAM序列的位点(没有PAM序列的不会被编辑)
| Cas9及变异体 | PAM序列(5’到3’的序列) |
|---|---|
| SpCas9 | NGG |
| SpCas9 VRER变异体 | NGCG |
| SpCas9 EQR变异体 | NGAG |
| SpCas9 VQR变异体 | NGAN或NGNG |
| SaCas9 | NNGRRT |
| Cpf1 | TTN |
常用的PAM序列格式是: NGG(这里的N代表任意碱基)
2.Crisp-Cas9通过gRNA来识别要编辑和处理的位点
靶DNA序列:5'--[20-nt Spacer Sequence]-NGG-3'
gRNA的spacer序列:5'-[20-nt Guide Sequence]-3' (与靶DNA链反向互补)
Crisp-Cas9的载体的结构一般如下
启动子 → [Spacer序列] + [gRNA骨架序列] → 终止子
spacer序列是靶DNA(染色体上的一段DNA序列)的反向互补序列长度为20个碱基左右,
spacer序列在gRNA骨架序列的5'上游,gRNA骨架用于和cas9蛋白结合。
靶DNA序列(protospacer)是基因组上pam序列的前20bp,从5'到3’的序列。例如:
5' ... A T G C A T A C C G T A G C C T A C C T G G ... 3'
[无关序列] [<--- Protospacer (23nt) --->] [PAM]
此处的PAM序列是TGG(NGG),则对应的protospacer序列是5' ... A T G C A T A C C G T A G C C T A C C 3',
把protospacer的序列反向互补,即得到spacer序列5' - G G T A G G C T T A A C C A T A C G T A - 3'。
关键概念
- spacer序列是载体上的序列,载体上spacer后面是gRNA骨架序列,载体上不必有pam序列或其反向互补序列。
- Protospacer是目的基因的一段序列,序列的最后必须是pam序列。spacer序列反向互补+pam序列即为protospacer序列。