一、融合基因定义
融合基因:是指两个基因的全部或一部分的序列相互融合为一个新的基因的过程。其有可能是染色体易位、中间缺失或染色体倒置所致的结果。
基因融合是由原本两个独立的基因形成的杂合基因,一般发生在基因组层面,根据融合断点位置的不同,有些基因融合会发生转录有些则不发生转录,除了基因组上会发生融合外,在转录本层面也会发生基因融合现象;当然需要补充的是有一些基因会和基因间区发生融合,理论上基因间区断点融合不太可能起作用,但是已有研究发现基因间区断点融合是可能被激活的。
二、基因融合检测技术
目前常见的基因融合检测分子病理检测方法包括:荧光原位杂交(FISH)、逆转录聚合酶链式反应(RT-PCR)、免疫组织化学(IHC)、二代测序技术(NGS)等。其他技术平台,如数字PCR、Nanostring 等也逐渐成熟,有待进入临床应用积累更多的临床实践经验。
2.1 FISH(荧光标记原位杂交)
荧光原位杂交技术(FISH):FISH检测是利用荧光基团标记DNA探针,再将标记的DNA探针与样本DNA进行原位杂交,最后在荧光显微镜下对荧光信号进行计数,以此作为诊断的依据。探针是FISH检测灵敏度和准确性的关键。FISH检测的准确性来源于探针的设计。FISH能否应用于某一领域也取决于是否具有相应的探针。用于FISH检测的探针必须具备很高的特异性,能特异性地识别特定的基因或染色体上特定的片段。而且FISH的探针必须能经受原位杂交的处理而不变性。荧光基团的标记也直接影响了检测的灵敏度和原位杂交结果的检测方式。目前使用最广泛的是利用特殊荧光标记的碱基通过模板合成出特异性强的荧光标记的探针链。目前为止,FISH技术已经十分成熟,目前已经能够实现全染色体,部分染色体的单标记,以及染色体的多重标记检测。当前为了增加FISH的准确性,目前多采取多色标记。目前检测基因融合的FISH探针长度一般在400 kb-5 Mb之间。
2.2 IHC(免疫组织化学)
IHC基于蛋白层面检测基因融合,利用抗原‐抗体特异性结合的原理,通过化学反应使标记抗体的显色剂显色来确定组织细胞内抗原(多肽和蛋白质),对其进行定位、定性及相对定量的检测技术;
IHC与目前的现有分子检测方法相比更经济、更快速,但是结果判读时存在一定的主观性,对弱阳性结果的判断需要进一步用FISH等技术来验证。
2.3 RT-PCR(逆转录聚合酶链式反应)
RT-PCR可以在RNA水平上高度敏感地检测融合转录本,不过只能检测一些已知的基因融合形式,无法检测未知融合,这种方法受到 RNA 质量的影响较大,所以有可能造成一些假阴性的结果。
2.4 DNA or RNA 测序
合基因作为结构变异(SV)的一种类型,采用DNA测序分析融合基因的策略主要包括:双端序列配对法(pair-end method),该方法总体思路是首选将双端序列比对到基因组上,然后评估双端配对序列的距离和方向是否和建库信息一致。
RNA测序检测融合基因主要有两种分析策略,(1) 基于序列比对的方法,寻找不一致序列(discordant pair reads)和覆盖断裂点的序列(junction/split reads)从而识别出融合事件。(2) 基于拼接比对的方法,首先组装出新的转录本,然后比对到基因组,从而鉴定出与染色体重排一致的融合转录本。
2.5 Nanostring
Nanostring技术是数字化基因分析系统,是最新的多重基因定量检测技术。该技术可直接检测条形码探针标记的单个mRNA转录子,并通过数字计数进行定量。它仅需100 ng的RNA即可对逾800个特异的mRNA转录子进行准确的定量。该方法除了检测已知融合方式,还能发现未知融合方式。有文章报道NanoString和FISH检测在检测肺癌ALK、ROS、RET 基因融合方面一致性可高达100%。技术准确性层面NanoString应用于临床检测具有可行性。NanoString技术平台自动化程度非常高,通过机器就可以直接读数,并且单次反应能够同时检测800多条序列,高通量检测可以大大节约临床标本,针对单个基因的检测成本也大大降低。但是目前国内由于设备未能普及,另外还有融合探针的合成、试剂性能验证、NMPA 批准等因素,短期内应用于临床尚不现实。