大家搜索三维基因多组学联合分析的时候,会搜到 Hi-C,RNA-seq ,ChIP-seq,ATAC-seq,BS-seq,3C,4C,SV promoter,enhancer等核心关键词,这张字符云几乎涵盖了三维基因组学全部内容。
那么大家会有一个问题,我们为什么要做多组学联合分析,我们知道针对一个生物学问题,比如像这头大象,我们不同的组学只能反应一个侧面的内容,比如说RNA-seq只能反应基因的表达信息,ATAC-seq只能染色质的开放程度,只有综合不同的侧面,我们才有可能接近生物学问题的本质
比如说,像探索癌症发病机制,那么从一维结构的角度呢,我们可以查看那些位置发生了结构性的变异,从转录组的角度,我们可以知道对于癌症而言,哪些基因的表达发生了变化,从蛋白质组的话,我们可以查看哪些蛋白的蛋白水平发生了变化,从核酸组的角度,我们可以看一下,对于癌症的发生,它的染色质开放程度是否发生了变化,而从表观组的角度,我们看一下,对于癌症的发生,它的组蛋白修饰是否发生了变化。而从三维基因组的角度,我们可以看一下它的调控网络是否发生了变化。工欲善其事,必先利其器,在进行联合分析之前呢,我们先简单回顾一下各个组学的内容。
Hi-C:全基因组构象捕获技术,通过在酶切位点末端添加生物素,利用生物素和链亲和素特异性富集获取嵌合片段,从而构建全基因组互作图谱。Hi-C广泛用于构建全基因互作图谱和鉴定功能性互作元件(loop)。
RNA-seq(转录组测序技术):将细胞内某一类型(或全部)的RNA逆转录成DNA,通过高通量测序的方法测定其序列并统计其表达水平的一项技术。主要是为了寻找差异表达的基因集合或者差异不明显但表达趋势比较一致的功能基因集。
结构变异(SV)是一类可引起累及多系统的遗传性疾病或肿瘤的重要变异,包括染色体缺失、插入、重复、倒位、易位等,较之于序列变异(SNV, InDel等)影响了更多的基因组序列。
全基因组重测序技术WGS:主要用结构变异的检测,而且大量研究表明一维结构的变异容易导致三维结构上调控的紊乱从而导致基因表达的异常,进而导致疾病表型的发生(如肢体畸形)。