RNA-DNA杂合链是在转录、DNA 复制和 DNA 修复过程中产生的,是这些进程的关键中介体。当RNA-DNA杂合链在双链DNA中稳定形成时,游离在外的一条DNA链组成称为R-loop的三链结构。R-loops在基因组中广泛存在并富集在活性转录基因上。R-loops在调节基因表达和染色质结构方面具有重要作用,但同时也对基因组稳定性构成威胁,尤其是在DNA复制期间。为了保持基因组稳定,细胞已经进化出一系列机制来防止异常R-loops的积累。尽管R-loops会导致DNA损伤,但它们也被DNA损伤所诱导,充当DNA修复的关键中间体,例如在转录偶联修复和RNA依赖性的DNA断裂修复中。当R-loops的调节出现问题时,病理性R-loops就会积累,从而导致神经退行性变和癌症等疾病。
R-loops和RNA-DNA杂合链的来源以及它们的功能在各细胞、染色体和序列中是不同的。本节将讨论R-loops和RNA-DNA杂合链如何在整个基因组的转录、DNA复制和DNA修复过程中自然形成。 R-loops也在基因组的特定区域分布,如端粒、着丝粒和线粒体DNA (mtDNA) 中。
共转录性R-loops
在DNA 转录过程中,新生RNA在RNA聚合酶的活性位点内非常短暂地与DNA模板退火,产生短暂的、瞬时的RNA-DNA杂合链。当新生的RNA在RNA聚合酶后面短暂地重新退火到模板上时,会形成R-loops结构。在由RNA聚合酶Ⅱ (Pol Ⅱ) 转录的基因中,共转录性R-loops主要分布在基因的启动子和转录起始位点(TSSs) 以及转录终止位点 (TTSs) 。“启动子”处的R-loops参与转录激活;在靠近富含G的序列的“终止子”上,Pol Ⅱ暂停位点处形成的R-loops有助于转录终止和基因抑制性染色质的形成。在免疫球蛋白基因上,R-loops也分布于高度重复、富含GC的开关区域中,从而助于“类开关重组”进程。
Pol Ⅱ转录增加及Pol Ⅱ暂停都与R-loop积聚有关。Pol Ⅱ转录增加产生更多可以形成 R-loops的RNA,而Pol Ⅱ暂停增加了RNA与DNA模板杂交的机会。具有活性的核糖体DNA(rDNA)重复序列被Pol Ⅰ高度转录并积聚R-loops,而这在正常条件下也会干扰Pol Ⅰ转录——高水平的R-loops,特别是在18S基因的5’区域,与Pol Ⅰ停滞堆积有关。核糖体DNA基因之间的基因间间隔区(intergenic)的Pol Ⅱ转录也会产生限制Pol Ⅰ转录的R-loops,这与核仁结构相关。由Pol Ⅲ转录的5S rRNA基因在正常条件下也易于形成R-loops,而其他Pol Ⅲ基因,如tRNA基因,仅在没有RNase H的情况下才会积聚R-loops。
端粒和着丝粒R-loops
含有端粒重复的RNA(TERRA)是一种长的非编码RNA(lncRNA),由Pol Ⅱ从端粒和亚端粒区域转录产生。TERRA含有UUAGG重复序列,可与富含C的端粒DNA链杂交。在人类细胞中,TERRA与端粒结合,与许多端粒结合蛋白和染色质调节剂相互作用,例如端粒重复结合因子2(TRF2)和ATRX,这对端粒维持很重要。在人类细胞的端粒处检测到TERRA生成的R-loops。最近的一项研究表明,由UUAGGG重复组成的RNA足以通过RAD51重组酶介导的机制以intrans形成端粒R-loops,并且端粒R-loops的形成增加了端粒的脆弱性。总之,端粒R-loops允许TERRA与端粒相联并维持端粒,但同时也诱导产生基因组不稳定性。TERRA和端粒R-loops的适当调控可能对端粒的正常功能很重要。
与端粒类似,着丝粒也由Pol Ⅱ转录。在人类细胞中检测到着丝粒和着丝粒周围卫星DNA的RNA转录物。α-卫星重复序列的RNA转录物与着丝粒相关,它们会形成incis的R-loops。着丝粒RNA是组蛋白H3样着丝粒蛋白A (CENPA)和着丝粒蛋白C (CENPC)与着丝粒结合所必需的,这使得这些RNAs成为着丝粒的重要结构成分。在有丝分裂中的染色体上很容易检测到着丝粒R-loops。丝氨酸/苏氨酸蛋白激酶ATR在有丝分裂过程中以R-loop依赖性方式招募到着丝粒上,ATR通过CHK1促进Aurora B的激活。这种ATR激活的有丝分裂特异性和着丝粒特异性机制确保了精准的微管-着丝粒附着和忠实的染色体分离。尽管着丝粒R-loops对于着丝粒的组装和功能很重要,但它们也是复制压力的来源。在S期,需要CENPA抑制着丝粒的转录和R-loops形成,从而保护着丝粒免受DNA损伤。因此,着丝粒R-loops对着丝粒具有双面影响,并且着丝粒R-loops及其相关蛋白的水平可能在细胞周期中错综复杂地变化。
DNA复制时产生的杂交链
与复制相关的RNA-DNA杂合链最主要来源是滞后链复制,在此期间DNA聚合酶-α (Polα)-引物复合物每约200个核苷酸合成一个8-10个核苷酸长度的RNA引物。然而,这些杂合链在冈崎片段成熟过程中通常会被去除,此时RNA引物和由他们产生的DNA延伸被DNA Pol δ置换,并且由此产生的flaps被flaps内切酶1 (FEN1) 去除。基于RNA引物的RNA-DNA杂合链也可能在绕过DNA损伤和通过Polα-primase或DNA定向引物酶/聚合酶蛋白(PrimPol)重新启动过程中产生,尽管在这种情况下去除RNA-DNA杂合链的机制要少得多。在DNA复制过程中经常产生的另一种RNA-DNA杂合链是错误掺入的核糖核苷酸。细胞中高浓度的核糖核苷酸导致它们被复制性DNA聚合酶错误掺入,估计速率为每7.6kb 一次。错误掺入的核糖核苷酸被认为是最常见的基因组病变,需要核糖核苷酸切除修复 (RER) 才能将其去除。
DNA损伤诱导产生的杂交链
在人类细胞中,DNA双链断裂 (DSBs) 位点处能够检测到RNA-DNA杂合链。这些杂合链是通过在DSBs的ssDNA突出末端上的RNA-DNA杂交或通过RNA侵入dsDNA形成的。几种类型的RNA有助于DSBs的退火杂交。据报道,Dicer和Drosha产生的小RNA在DSBs周围形成杂合链。DNA损伤诱导的lncRNAs (dilncRNAs) 也在DSBs处形成杂交链。dilncRNAs的合成与MRE11-RAD50-NBS1(MRN) 复合物募集到DSBs的Pol Ⅱ有关。Pol Ⅲ也有助于DSBs处的RNA合成。这些发现表明,DSBs处RNA从头合成促进了RNA-DNA杂合链的形成。然而,在特定位点诱导DSBs后对RNA-DNA杂交链的全基因组图谱显示,杂交链水平的增加主要发生在转录活性区域,这表明预先存在的RNA转录物在损伤诱导的RNA-DNA杂交链形成中起主要作用。相应地,当由特定染色体位点的活性氧 (ROS) 诱导DSBs和单链断裂 (SSBs) 时,杂交链仅在存在局部转录的情况下才能检测到。有人提出DSBs和SSBs引发Pol Ⅱ暂停会导致R-loops的形成;但DSBs和SSBs如何暂停Pol Ⅱ尚不清楚。在活性转录基因中R-loops上暴露的ssDNA也可能允许从头合成RNA,从而有助于在DNA损伤位点形成RNA-DNA杂合链。
线粒体R-loops
R-loops也在mtDNA中积累,它由具有不同核苷酸组成的重(H)链和轻(L)链组成。 在mtDNA的控制区域(即控制RNA和DNA合成的非编码区)检测到的R-loops,其中RNA的3′末端与重链合成的起始位点(ori-H)重合。在ori-H处形成R-loops取代ssDNA并启动RNA引导的重链合成。在新生的重链延伸到ori-L外后,轻链的合成从ori-L开始,从而完成mtDNA完全复制。RNaseH1对线粒体中的R-loops加工和DNA复制至关重要。尽管R-loops对mtDNA复制很重要,但高水平的R-loops会导致mtDNA不稳定。由解旋酶SUV3和核糖核酸酶组成的线粒体降解复合物可防止线粒体中病理性R-loops的积累。
基因编辑时产生的R-loops
除了天然存在的R-loops和RNA-DNA杂合链之外,R-loops还可以在CRISPR-Cas进行基因组编辑期间人为生成。在CRISPR–Cas系统中,Cas蛋白与小向导 RNA (gRNA) 形成复合物识别并切割目标DNA序列。在识别目标DNA期间,gRNA侵入dsDNA并形成RNA-DNA杂合链。由Cas9和gRNA形成的RNA-DNA杂交链长约16-20个核苷酸。Cas9-gRNA-dsDNA复合物的晶体结构表明,RNA-DNA杂合链大部分埋藏在Cas9蛋白内部。这些RNA-DNA杂合链的形成取代了DNA的非靶标链,并将RNA-DNA杂合链和ssDNA分别定位在Cas9的HNH和RuvC核酸酶结构域的活性位点附近。CRISPR-Cas系统通过形成此类R-loops来识别目标DNA的能力也使它们能够介导碱基编辑(base editing)和先导编辑(prime editing)。其他Cas蛋白也使用R-loops来识别和切割目标。
参考文献:Petermann, E., Lan, L. & Zou, L. Sources, resolution and physiological relevance of R-loops and RNA–DNA hybrids. Nat Rev Mol Cell Biol 23, 521–540 (2022). https://doi.org/10.1038/s41580-022-00474-x