通过RNA-seq,发现目标基因在处理组与对照组之间显著差异表达,与试验预期结论一致。于是很开心地通过qPCR进行进一步的验证,结果却傻眼了,qPCR并未显示出基因表达在两组间存在差异?
或者反过来的情形,已经通过qPCR检测到目标基因在处理组与对照组之间的表达水平存在很大差异,但是却发现RNA-seq的基因表达定量并无明显区别,是RNA-seq不准确吗?
想必很多老师或同学们碰到过类似的困惑,qPCR和RNA-seq的基因表达定量分析结果并非完全一致,一种方法识别显著差异表达时而另一组却未显示显著差异。
这个时候,通常会认为是其中一个出了岔子。比方说,考虑到RNA-seq是一种高通量的方法,有时可能会产生假阳性的问题,就更倾向于相信qPCR的定量结果。那么,真实情况确实是这样吗?
不可否认,RNA-seq的灵敏度不如qPCR高,但是,这并不一定代表RNA-seq的结果不可信。如果我说,qPCR检测到基因表达量的显著改变,而RNA-seq却显示差异不大时,这两种结果其实都是正确的,您是不是很惊讶呢?
好了不卖关子了,接下来就让小编带您了解产生这种结果的原因在哪里,为什么说两种结果都是正确的。
首先,您需要知道qPCR和RNA-seq在基因表达定量上的区别。
做qPCR试验时,我们要设计一段引物序列扩增基因的特定区域。为了保证qPCR的效率和准确性,通常扩增区域不会很长,也就大约200bp左右的区域。而我们知道,真核生物基因的长度其实是远大于200bp的,所以qPCR对基因表达定量的结果只是代表了某特定基因的“局部表达水平”。
而RNA-seq作为一种高通量的方法,能够覆盖几乎所有的外显子区域,所以理论上能够实现全长基因水平的定量。因此在RNA-seq数据分析时,获得的基因表达定量值实际上综合考虑了该基因中所有外显子区域的表达水平,结果代表了某特定基因的“整体表达水平”。
所以这就是两种方法的区别,qPCR的定量是在基因的局部区域测量的,RNA-seq的定量是在基因的全长区域测量的。因此,qPCR和RNA-seq在基因表达定量上的区别,就会导致它们在估算基因表达水平改变时的产生冲突,但是并不代表着其中一种方法的结果有误。尽管RNA-seq存在偏倚,但就目前的技术来看,假阳性结果其实概率很低了。
如果您存在困惑,让我们来举个例子说明,这是个很有意思的现象。
对某基因的某段外显子区域作了敲低或过表达处理,通过qPCR测定这段外显子区域时,发现敲低组确实低表达了,过表达组也确实高表达了。毫无疑问,qPCR的检测结果肯定是正确的,这点大家都没疑问吧。
但是,通过RNA-seq评估该基因表达时,发现3组的表达水平无明显变化。RNA-seq有错吗?非也,因为它实际定量的并不是基因中这段敲低或过表达的外显子区域,而是全长基因的表达水平。在图中我们看到,尽管这段敲低或过表达的外显子区域的表达水平确实变化明显,但是该基因中其它外显子区域的表达水平却没有受到影响,当综合考虑所有外显子区域的表达计算该基因的整体表达值时,也就得到了3组间无明显差异的结果了。
因此,对于RNA-seq的基因表达定量结果,如果存在疑问,不妨使用IGV等基因组浏览器查看测序序列和基因组比对的BAM文件,单独找到这段基因的特定区域查看局部表达水平(而不再是整体表达水平),应该就能看到和qPCR相似的结果了。
类似地,如果RNA-seq获得了基因表达的差异,而qPCR没有检测到差异,可能恰好设计的qPCR引物扩增了一段无明显表达变化的外显子区域中。这种情况下,也可以使用IGV等基因组浏览器查看测序序列和基因组比对的BAM文件,找到该基因中变化明显的外显子区域,然后针对该区域的序列重新设计qPCR引物,应该就能检测到显著的区别了。