1.检测原理
在测序未普及前,芯片是最常使用的大规模筛查工具,如人基因表达谱芯片,一次实验就可以对人类已知的2~3万个基因进行筛查,找出关键差异基因。我们知道,芯片是基于探针与目标序列杂交结合的原理进行检测。由于探针序列是根据目标序列进行设计,是确定的,因此,芯片是个相对封闭的系统。换句话说,芯片只能对已知的序列进行检测。
①芯片探针与目标序列杂交
在整个芯片实验过程,目标序列未经历PCR扩增(见上图),因而检测到的杂交信号与目标序列的丰度保持良好的线性相关性,更适合做定量分析。
测序顾名思义是测定序列信息。因此,测序是个相对开放的系统,测序过程既会测到数据库已报道的序列,也会获得尚未被报道的序列。换句话说,不管被检测物种是否有参考序列信息,都可以开展测序实验。测序是目前快速获取物种序列最有效的方式。
②Illumina边合成边测序
在整个测序实验中,目标序列需要经历多次的PCR信号放大(如建库,如生成cluster,见上图),因此灵敏度更高,但也由于PCR过程的不均衡性,使得基于测序数据进行定量与真实丰度存在偏差。
2.检测场景
通过了解检测原理,我们可以知道,芯片和测序有相同也有不同的检测场景。比如研究参考序列较丰富物种的表达谱,虽然用芯片和测序都可以,但是用芯片进行定量会更为准确。又比如参考序列较少的物种,要做定量分析,选择测序就更为合适,既能测定序列又能做定量分析。如果想发现新的转录本,或者研究基因表达的可变剪接等,选择测序准没错。也有一些研究,会将两者结合,先用测序获得序列信息,再用芯片进行定量分析,发挥两种手段各自的优势。
3.实验周期
相比于测序,无论是实验过程还是数据分析过程,芯片都更为成熟和简单。因而芯片的实验周期通常约为测序的一半时间或者更短。
4.数据易用度
大多数研究者比起实验过程,更关心是否能拿到所需的实验数据,以及这些数据是否能马上上手使用。
做过测序的朋友,还记得你第一次看测序报告和数据的感受吗?当时是不是整个人都不好了?没事,大家都是这样过来的。因为测序产生的数据实在是太多,报告中有一半甚至更多的篇幅,是在说序列本身的故事。而这些对不是以研究序列结构为主的大部分研究者而言,无异于天书。花一周甚至几周理解测序报告和数据的含义是常有的事。如果遇到科研时间有限的研究者,可能几个月过去了,报告都没翻上几页。当然一旦你花了功夫,摸清了测序结果的门路,以后再做就会轻车熟路。
相比于测序,能用芯片做研究的朋友,简直是幸福到没朋友。看芯片结果,我们不用在序列上纠结,因为这些序列来自数据库,是确定的。即使是第一次看报告,也能马上找到自己感兴趣的数据。研究者只会把注意力放在筛选到的差异基因上,又因为序列是来自数据库,注释信息详细,参考资料丰富。当确定了感兴趣的基因,就可以马上开展下游的功能研究,因而能明显加快研究成果的发表。
芯片目前常用于医学研究中,说明在医学研究中,芯片相比于测序是更多被采用的。这其实和医学研究需要确定性是相关的,无论是筛选诊断标志物还是研究调控机理,都需要针对确定的基因展开研究。
回归研究的原点,能高效解决科学问题的,就是好手段。不论测序还是芯片,它俩只是两种检测手段,研究者应根据不同的研究需求去使用,而不是只用测序或是芯片。很多情况下,芯片因其稳定性,更短的实验周期,更易用的实验结果,更有利于医学研究者在少量的科研时间中发现关键基因,加速成果发表。
一些针对测序数据的在线数据库是否同样可以应用于芯片数据。比如:IPS(免疫表观评分) ;GDSC(R包中的PRophetic估算半数抑制浓度IC50);CMap(候选小分子药物)上下调重叠基因,预测药物诱导逆转特定的基因药物。