近三十年来,R-loop 与类别转换重组 (class switch recombination, CSR) 密切相关,CSR 是产生抗体同种型的过程,通过在重组序列中引发转录偶联的突变而进行。 R-loop 在体外和体内的转换重组序列的转录过程中形成,并且有确凿的证据表明 R-loop 是有效类别转换所必需的。 R-loop 的经典模型假定它们通过产生稳定的、长的单链 DNA 来提高突变率,这些 DNA 作为激活诱导脱氨酶 (activation induced deaminase, AID) 的底物,AID 是在 ssDNA 上启动 CSR 级联反应的酶。 尽管合乎逻辑且令人信服,但该模型尚未得到体内证据的支持。 事实上,一些报道表明 R-loop 可能不参与招募 AID 到重组序列区域,这意味着 R-loop 可能在 CSR 中发挥其他意想不到的作用。 在这里,我回顾了迄今为止该领域的主要发现,并提出了有助于阐明 R-loop 在 CSR 中的精确功能的假设。
抗体,即免疫球蛋白(Immunoglobulin, Ig),其同种型(isotype)是指免疫球蛋白类型或亚型的重链遗传变化或差异, 是同一物种内所有个体共同具有的Ig抗原特异性结构。同种型的区分主要是在抗体恒定区(C区),有重链恒定区(CH)和轻链恒定区(CL)之分。 在哺乳动物中,有五种重链同种型:IgA(α)、IgD(δ)、IgE(ε)、IgG(γ)和IgM(μ)。IgA在呼吸道或肠道中分泌,充当粘膜免疫的主要介质,是抵御感染的第一道防线。IgD占免疫球蛋白库的比例不到1%,通常存在于B细胞的细胞膜上,IgD同种型的表达水平与B细胞活化状态相关。IgE通常存在于嗜碱性粒细胞和肥大细胞中,IgE抗体与I型即时超敏反应有关。IgG是血清中最丰富的抗体,占总免疫球蛋白库的70-85%,通常以单体形式存在,根据功能不同可分为4个亚类 IgG1、IgG2、IgG3和IgG4。IgM是B细胞发育过程中表达的第一种免疫球蛋白,是初次免疫应答中的主要抗体;IgM能够以单体或五聚体的形式存在,与B细胞表面结合的是单体形式,在分泌形态中则是五聚体形式。
1. Introduction
R-loop 是新生 RNA 与其模板 DNA 稳定杂交时形成的结构,导致非模板 DNA 链被挤出为长而稳定的单链 DNA (ssDNA)。 近年来,有大量出版物证明了 R-loop 在基因组中的广泛存在,对各种生物过程都有影响。 例如,R-loop 与染色质调节因子的募集、异染色质形成和转录终止有关。 重要的是,过多的 R-loop 与 DNA 断裂形成增加、复制叉停滞以及转录-复制复合物之间的碰撞有关,所有这些都可能导致基因组不稳定。 为了应对这种不稳定,已发现几种蛋白质可以防止 R-loop 形成或快速消除 R-loop ,例如 Senataxin、Xrn2、TDRD3/TOP3b 复合物、BRCA2 和 exosome 复合物。 事实上,在某些癌症和神经系统疾病中观察到 R-loop 抑制因子的突变,并且与 R-loop 形成增加相关。
尽管最近的这些发现加深了对 R-loop 的理解,但这篇综述将重点关注在 B 淋巴细胞免疫球蛋白重链 (immunoglobulin heavy chain, IgH) 基因座多样化的背景下, R-loop 生物学在其中的作用。 具体而言,R-loop 与类别转换重组 (CSR) 过程有关,CSR 导致产生各种抗体同种型,这些抗体同种型在体液免疫反应期间发挥关键效应子功能(图 1)。 CSR 由突变酶激活诱导脱氨酶 (AID) 启动,该酶在 IgH 基因座的富含 G 的重复开关序列中具有高密度的热点motif(图 1)。 发生转录后,这些转换序列形成 R-loop ,同时 AID 对 ssDNA 进行共转录作用。 这产生了一个模型,其中提出了 R-loop 以通过为其提供丰富的 ssDNA 底物来增强 AID 活性。 然而,正如我在下面讨论的那样,这个模型没有得到经验证据的支持,并且关于 R-loop 在 AID 生物学和 CSR 中的作用仍然存在挥之不去的疑点。
2. CSR 中的转录
CSR 与转录相关的第一个迹象是,有文献报道观察到伴随 CSR 出现了来自相应转换区域的非编码转录产物。 这些发现得到了后续几项研究的证实和扩展,这些研究得出的结论是,CSR 是通过转换区和恒定区的转录所引发的。 此外,大量研究已经得出重要结论,即转录对于抗体多样化过程中 IgH 可变区和转换区的突变至关重要。 这自然导致该领域研究转录在 CSR 中的作用,以及这些非编码转录产物是否参与诱变或 CSR 机制的其他方面。
3. IgH 转换区域 R-loop 的发现
转录的 IgH 转换区域产生 R-loop 的初步证据来自体外转录实验,用细菌聚合酶转录 IgH switch α (Sα) 序列的过程中检测到 RNA/DNA 杂交链,表明转录的 RNA 稳定地结合到模板 DNA 上。 此处最引人注目的观察结果是,仅当转换序列以其生理方向转录时才会观察到这些不寻常的结构,因此清楚地指示序列组成是 R-loop 形成的重要决定因素。 通过 Sμ、Sγ2b 和 Sγ3 序列的体外转录,研究人员也得出了关于转换区中 R-loop 的形成和方向依赖性的类似结论。 尽管当时对 R-loop 的生物学知之甚少,而且 AID 尚未被发现,但这些发现仍然为转换区的转录状态提供了一个关键的见解,并表明转换区序列组成可能与 CSR 的功能相关。
R-loop 存在的关键体内证据来自 Lieber 及其同事在 2003 年的工作,他们使用亚硫酸氢钠修饰的方法进行 DNA 测序,证明了在刺激之后的原代小鼠 B 细胞中发生 CSR ,其 Sγ3 和 Sγ2b 区域存在长 ssDNA 片段。 ssDNA 延伸几乎完全在转换区域的富含 G 的非模板链上检测到,长度达到 > 1 kb,这清楚地暗示这些基因座中存在 R-loop。 这些数据坚定地证明了 R-loop 是 CSR 的稳定中间体,它是通过转换区 DNA 与其新生 RNA 的结合而产生的,最近使用过表达 RNaseH (一种特异性降解 RNA/DNA 杂交体中 RNA 的酶 )的转基因小鼠证实了这一结果。 此外,非洲爪蟾转换区缺乏哺乳动物转换区上广泛的 G 丰度,因此被预测不会形成 R-loop,但实际上已发现同样可能含有 R-loop,因为它们具有 GG 二核苷酸基序,这些基序似乎足以引发 R-loop 形成。
4. CSR 效率 与 R-loop 频率相关
Alt 及其同事早期支持 R-loop 在 CSR 中的功能作用,他们证明在小鼠中反转 12 kb Sγ1 序列(这将无法形成 R-loop )会导致 CSR 显著降低至 IgG1。 此外,用能够形成 R-loop 的人工 1 kb 富含 G 的序列替换 Sγ1 可以部分挽救失败的 CSR,而其反转序列则不能。 随后,使用 T7 聚合酶进行的体外转录分析表明,可以形成 R-loop 的 dsDNA 模板比不能形成 R-loop 的模板更适合作为 AID 的底物。 最近,Lieber 小组对 R-loop 在 CSR 中的作用进行了优雅而系统的研究,其中小鼠 B 细胞系 CH12 中的 IgH Sα 序列被具有不同 R-loop 形成强度和 AID 热点密度的人工序列所取代。 他们发现,在没有 R-loop 形成的情况下,高密度的 AID 热点会导致 CSR 效率低下,但 AID 热点密度和 R-loop 形成强度的结合会产生最高的 CSR 效率。 总之,这些研究强烈表明 R-loop 在 CSR 中具有生理作用。
5. IgH 转换区诱变是否需要 R-loop?可能不会
ssDNA 作为 AID 底物的发现形成了一种模型,即 R-loop 提供的 ssDNA 作为 AID 稳定的底物,从而导致更高的突变率,进而提高 CSR 效率。 然而,这个想法的直接证据仍然缺乏。 在前人的研究中,没有进行 AID 招募和突变分析,所以我们不知道观察到的 CSR 和 R-loop 强度之间的相关性是否与 AID 招募增加、突变频率或其他一些机制直接相关。
为了解决 R-loop 在抗体多样化中的作用,经常采用通过过表达 RNaseH 的方法扰动 R-loop 频率,然后使用 DRIP (利用 S9.6 抗体来免疫沉淀 RNA/DNA 杂交体) 进行检测。 使用这种方法,在激活的 CH12 B 细胞系中过表达或短期逆转录病毒表达 RNaseH ,发现其对转换区突变频率没有任何影响。然而,虽然一项研究没有发现表达 RNaseH 的稳定 CH12 细胞系中的 CSR 缺陷,但另一项研究却报道 RNaseH 逆转录病毒感染后 CSR 降低约 50%。 另外,RNaseH 在转基因小鼠中的过度表达导致模板链上的突变略有增加,但并未改变 CSR 频率。
除了转换区外,Ig 可变区也是 AID 的有效靶标,可导致体细胞超突变和抗原结合多样化。 然而,可变基因不富含 G,预计不会形成 R-loop。 实际上,对超突变的人类 Ramos 细胞研究并未报道 IgH 可变区中的 R-loop 形成,并且 RNaseH 表达不会改变可变基因的体细胞超突变速率。 相比之下,由 AID 介导的基因转换的禽类 B 细胞系 DT40 在 IgK 基因的可变区中含有 R-loop; 然而,突变率也不受 RNaseH 介导的 R-loop 耗竭的影响。 在所有这些研究中,作者得出结论,AID 的靶向和活性不需要 R-loop。
然而,必须指出的是,关于 RNaseH 过表达和 DRIP 研究的解释有两个注意事项。 首先,在这些条件下,R-loop 并未完全消除。 事实上,即使在表达 RNaseH 的转基因 B 细胞中,RNaseH mRNA 水平被测量为比野生型高 100 倍以上,IgH Sμ 基因座中的 R-loop 频率只降低了 70%,β-肌动蛋白基因中的 R-loop 频率也只降低了 0%。 其次,DRIP 检测仅能够检测到 R-loop 在bulk水平中的相对稳态存在,但无法提供有关单个 R-loop 长度或 R-loop 形成动力学的信息; 事实上,DRIP的检测结果可能是上述所有这些因素的组合。 因此,无法断定 RNaseH 表达后 DRIP 信号的减少是否反映了 R-loop 形成的减少、R-loop 长度的减少、更短暂的 R-loop 形成或这些的某种组合。 可以进行一种额外的检测手段,例如基于亚硫酸氢钠的检测,它能够检测 R-loop 的长度,能够辅助更好地了解 R-loop 扰动与 RNaseH 的影响。 由于上述这些限制,可以从以上研究中得出结论,R-loop 频率显然与突变率无关,但不能得出 R-loop 在 AID 靶向中没有作用的结论。
也就是说,Alt 小组最近的一项研究使用了一种完全不同的方法,为 R-loop 不参与 AID 靶向定位的观点提供了强有力的支持。 他们生成了一种转基因小鼠,其 IgH 可变区被一种核心转换区组件所取代,该组件与正常序列生理方向一致或相反。 在任何一个方向上,他们都观察到同样高的突变率和相似的突变特征。 这些结果得出三个结论:(1) CSR 的诱变步骤与转换区方向无关; (2) 由于 R-loop 只在生理性的、序列正常方向上有效形成,因此 R-loop 可能对 AID 活性没有贡献; (3) 由于非正常方向的转换区域在支持 CSR 方面受到显著损害,AID 活性的方向独立性强烈表明 R-loop 在 CSR 中起着与 AID 活动无关的其他作用。
6. R-loop 通过调节 IgH 位点的 DNA 复制影响 CSR
根据 R-loop 在 CSR 中的替代作用,最近的一项研究表明 R-loop 参与促进供体和受体转换区域的远程接触(synapsis),这对于 CSR 的最后一步末端连接阶段至关重要。 具体来说,据报道,CSR 效率取决于转换区域中复制起点的活动,并且 R-loop 有助于规范早期 S 阶段的这些起点。 事实上,在基于 shRNA 的复制解旋酶、Mcm 复合体亚基耗竭以及基于 RNaseH 的 R-loop 耗竭时,实验观察到复制起点的建立缺陷。 此外,这两种扰动都会导致远程转换区域接触受损和不依赖于 AID 活性的 CSR 缺陷。 这一发现首次表明,转换区 R-loop 在诱变下游的 CSR 中具有额外的功能。 所有这些研究的一个假设是,增加的 R-loop 强度会导致复制原点激活的增加,从而影响 CSR 的效率。 这个假设可以使用转换区域替换系统进行测试,其中 R-loop 强度与 CSR 效率密切相关。
7. IgH 转换区域 DNA 中的 G-四链体及其相对于 R-loop 的功能意义
值得注意的是,在哺乳动物转换区域的背景下,富含 G 的非模板 ssDNA 和相应的新生 RNA 也可以形成 G-四链体 (G4)(图 1)。 实际上,Sen 和 Gilbert 大约在 30 年前就提出了在 IgH 转换区形成 G4 结构。 G4 是四链结构,通过鸟嘌呤之间的 Hoogstein 碱基配对形成平面四重奏(G-四重奏),可以与相邻的此类平面堆叠(图 1)。 此外,转换区域的体外转录也揭示了 G loop 的形成,当非模板 ssDNA 因新生 RNA 和模板 DNA 链之间的碱基配对而游离,折叠成 G4 构型时会产生G loop(图 1)。
转换区 DNA 和 RNA 中 G4 结构的存在对 CSR 有两个影响。 首先,在多项全基因组研究中,G4 DNA 与活跃的复制起点密切相关,并且在体外,起点识别复合物 (ORC) 与含有 G4 的 ssDNA 和 RNA 有效结合,但与 dsDNA 结合不佳。 因此,G4 DNA 密度可能有助于 CSR 效率,部分是通过增加复制起点的频率,从而增强重组转换区域之间的远程接触。 尚不清楚 G4 DNA 是否可以独立于转换区域中的 R-loop 形成,或者是否需要稳定的 R-loop 形成来稳定 G4 DNA。 因此,确定 RNaseH 处理对转换区 G4 DNA 的影响非常重要。
其次,形成 G4 RNA 结构的剪接内含子 IgH 转换区转录本可以结合 AID 并对其进行突变。 事实上,尽管酶活性正常,但无法结合 G4 RNA 的 AID 突变体 (G133V) 无法支持有效的 CSR。 由于 AID-G4 RNA 关联是剪接后事件,因此这种 AID 靶向模式似乎与 R-loop 无关。 鉴于此,出现的一个重要问题是富含 G4 的序列是否足以用于 CSR 的 AID 靶向和突变进程,以及 R-loop 是否在该过程中发挥任何作用。 通过将 G4 形成与 R-loop 形成分开,例如,通过用形成 G4 结构但不形成 R-loop 的序列替换开关区域,反之亦然,可以分别确定每个结构对 AID 靶向、突变和复制起点规范的贡献。
8. Conclusions
经过近三十年的研究,我们了解到 R-loop 是 CSR 的稳定中间体,更重要的是,R-loop 频率与 CSR 的效率相关。 因此,我们可以得出结论,R-loop 在 CSR 中发挥着重要作用。 然而,与原始的假设相比,多项不同的研究一致表明,R-loop 不太可能在 CSR 的初始 AID 依赖性诱变阶段发挥作用。 在 CSR 的背景下,所有这些研究的主要结论是 R-loop 在 CSR 中具有独立于 AID 的其他作用,例如在最近显示的转换区域接触中。未来的研究应该旨在阐明这种独立于 AID 的 R-loop 功能。 像这样的思路一样,几乎没有探索 G4 DNA 在转换区域中的作用,因此值得更加认真的研究,因为在稳定的 R-loop 形成的背景下,这些结构在功能上与 CSR 相关是合理的。
参考文献:Pavri R. R Loops in the Regulation of Antibody Gene Diversification. Genes. 2017; 8(6):154. https://doi.org/10.3390/genes8060154