欢迎关注公众号:oddxix
单细胞mRNA测序一直是科学家关注的一个热点。目前市场主要有2种建库方法,分别是Clontech公司推出的SMART法,和EpiCentre公司推出的TargetAmp方法。
要实现单细胞mRNA测序,需要解决2个难题。
第一个难题:PCR偏差
第一个难题就是一个人类细胞当中,它的总RNA量大约只有10pg左右(1pg=10-12g),中的mRNA的量大约只有0.2个pg。要把那么少的mRNA转变成约零点几个μg(1μg=10-6g)以上的核酸文库,这意味着核酸的扩增量要达到几百万倍以上。如何能在这个核酸扩增过程当中不引入太多的PCR偏差,就一直是个大问题。
PCR偏差,就是在PCR扩增过程当中,某些片段被大量扩增,而大部分片段被扩增的量很少,甚至根本就没有被扩增。结果就导致高通量测序,只能测到这所有样本当中很少一部分的片段序列。
PCR偏差会随着PCR循环的次数的增多而指数放大。那么,在这种情况下,一方面要把核酸扩增几百万倍,甚至更多的倍数;另一方面,又想得到均一覆盖的文库,这就是单细胞mRNA建库当中,所要解决的第一个大难题。
第二个难题:去除核糖体RNA
第二个难题是如何能尽可能高效地得到“mRNA”的文库,而不是含了大量“rRNA”序列的文库。因为rRNA在总RNA当中占了95%,甚至更高的比例,而mRNA在总RNA当中只占2~3%的比例。如果不加区分地进行逆转录,再扩增、建库很可能测序得到的绝大部分序列都是rRNA的序列。
但是 rRNA序列不能给我们带来有效的生物信息,它是无用的。而只有测到mRNA的序列,才是我们想要的信息,这样,如何能够选择性地把mRNA转化成测序文库,并且避免把rRNA带到测序文库中来,这就是单细胞mRNA测序当中,要解决的第二个大难题。
接下来,我们就来介绍SMART方法和TargetAmp方法,是分别如何解决上述2个大难题的。
SMART方法
我们先来介绍Clontech公司推出的SMART方法。SMART方法的全称是Switching Mechanism at 5’ End of RNA Template。这张图就是SMART方法的原理图。
SMART方法最核心的技术,就是设计了2个特殊的引物。再配合用MMLV逆转录酶进行逆转录。
我们先来看这个逆转录的起始引物。它哪,先是一段通用序列,未来这个通用序列会用作PCR扩增的引物识别序列,中间是一长串的T,这些T是专门识别mRNA的3’末端的Poly(A)尾巴序列。它会和这些Poly(A)尾巴互补结合,引物的最末端有一个定位的结构,这个定位的结构,就是在它的3’末端的倒数第2个碱基是一个非T的简并碱基。
图中用V来表示这个碱基。V碱基就是或A、或C、或G,但是非T的这样一个(简并)碱基。最后1个碱基则是简并碱基N,也就是A/C/G/T都有可能。引物的这个末端结构,就是让它正好结合在mRNA的3’端连到Poly(A)尾巴的这个连接处,而不会结合到mRNA的别的地方。这样就保证了逆转录的起始位置正好是mRNA的3’端的序列终止位置。
我们再来看这个MMLV逆转录酶,这个酶有个特点,就是它在转录到mRNA的5’端末端的时侯,会在新合成的cDNA的3’末端,多加出几个C碱基来。
再接下来,这个上游引物会发挥它的作用。这个上游引物,它有一个特点,它的3’端是3个非脱氧的G碱基,也就是核糖核酸的、RNA的G碱基,而不是DNA的G碱基,这个引物可以与刚才新合成的cDNA的3’端的那几个C碱基发生互补杂交,然后引导这个MMLV酶再次发挥聚合作用,以刚才那条新合成的cDNA为模板,复制的结果,就是得到双链的cDNA。
这个双链cDNA,两端都已经接好了我们人工设计的PCR引物序列,然后,就加入常规的PCR引物,进行常规的PCR扩增,常规PCR扩增,得到大量DNA。然后可以象常规的DNA建库那样,超声打断、建库、上机测序了。
我们回顾一下这个过程,可以看到这个方法的3个巧妙点。
- 第1点,是先用一个定位引物,保证cDNA的合成是从mRNA的3’最末端开始的,同时让合成出的cDNA在下游连上了一个通用PCR序列。
- 第2点,是利用MMLV逆转录酶会在新合成的cDNA的3'端,多加上几个C碱基的特点,再用有3个G碱基的上游引物进行第二链的合成。这就保证只有完整的第一链cDNA也就是那些带多个“C”的cDNA(第一链)才能被合成出cDNA的第二链,这也就保证了双链cDNA是全长的cDNA。
- 第3点,就是要保证PCR扩增的效率的一致性那我们知道,PCR扩增效率的最主要的影响因素是引物的序列,现在因为cDNA的5’端和3’端的都分别引入了统一的引物序,所以,这就去除了因为引物序列的不同。而引起PCR效率不同的,这个最主要的偏差因素。这也就在较大程度上保证了PCR扩增效率的一致性,减少了PCR偏差。
经过实验发现,用SMART方法,对于1个细胞,也就是10pg总RNA的RNA进行建库测序,RPKM为10的这些基因,有60%是被测序测到的;对RPKM为100的基因,有90%可以被测序测到。而且被测到的几率,波动很小。这说明SMART方法是一个有效的单细胞mRNA测序方法。
TargetAmp方法
接下来,我们介绍第2个单细胞mRNA建库的方法--TargetAmp方法,这个方法是由Illumina公司旗下的EpiCentre公司开发的。这个就是TargetAmp的原理图。
首先是用T7-Oligo(dT)的引物进行cDNA合成。这个引物,在5’端有设计了一个T7启动子序列。3’端是多个的T碱基,这一串T碱基可与mRNA的poly(A)尾巴相结合,作为逆转录的起始引物,经过逆转录,得到第一链的cDNA。同时这条cDNA链上,被引入了一个T7启动子。
然后用RNase H酶把cDNA:RNA双链产物中的这个RNA链消化掉,接着再合成出第二条cDNA链来,这个双链的cDNA就可以作为转录的模板。利用链上的T7启动子,转录出大量的反义RNA来(antisense-RNA,aRNA)。
接着,将这些反义RNA进行纯化。再用随机引物进行逆转录,得到第二轮的cDNA,接着,再用T7-Oligo(dT)这个引物,粘到第二轮的cDNA的Poly(A)尾巴上,再合成出双链DNA来。
这个双链的cDNA再经过第二轮的转录,又得到第二轮的反义RNA,这些第二轮的反义RNA的量,足可以达到微克级。再经过一轮逆转录,就可以得到几个微克的cDNA。那么几个微克的cDNA,就足以进行建库、测序之用了。
我们来看TargetAmp方法的巧妙之处:它不是用PCR来扩增核酸,而是用转录的方法来增加核酸的量。因为扩增那么多(倍)的核酸,如果用PCR,要用几十个循环,那么PCR不同的扩增子的扩增效率,即使一开始是很小的差异,也会在几十个循环中,被指数放大,变成一个很大的差异。那么TargetAmp方法用转录的办法,而且统一都用T7这个统一的启动子,它转录的启始效率,大体上就保持了一致。它的每一轮转录,都把核酸的量扩大几千倍。经过这样两轮的扩增,就把核酸的量扩大了几百万倍。这样,一方面它得到了高达几微克的核酸。足够用于建库,同时又避免了PCR过程,也就避免了PCR扩增偏差。
单细胞mRNA测序方法,在循环肿瘤细胞研究、胚胎发育研究、和神经活动研究方面,有着广泛的应用。随着高通量测序的费用不断地降低,它正变成科研中越来越普及的研究手段。相信有更多单细胞mRNA建库方法,和更新的技术应用会不断地被开发出来