作者:白介素2
主要建库方法包括:Clontech公司的SMART法以及Epicentre公司推出的TargetAmp法。
单细胞测序的难题:细胞中的RNA含量少,mRNA含量仅有约0.2pg(1pg=110^-12g),第一个难题是核酸的扩增量要达到几百万倍。核酸扩增过程可能会引起偏差,这是一直以来需要解决的问题,PCR偏差指的是扩增过程中某些片段被大量扩增,而大量片段扩增量很少,这样就会导致后续的测序没有意义。第二个难题*是如何尽可能高效的得到 mRNA文库,而不是含有大量 rRNA的文库 (rRNA占比总RNA95%的比例)。
SMART(Swiching Mechanism at 5' End of RNA Template) 方法: 设计特殊的序列识别 mRNA polyA尾巴,引物的末端特殊结构发挥定位到 polyA尾的作用, 配合 MMLV逆转录酶合成第一链,这个酶的特殊之处在于会在合成的 cDNA末端多加出几个 C碱基,刚好可以结合上游引物,在 MMLV酶再次发挥聚合作用,引导合成第二链,这样就得到了双链的cDNA序列,并且附带了人工设计的引物,接下来只需要加入常规的PCR引物进行扩增,继而进行常规的 超声打断,建库,上机测序。SMART建库技术对单个细胞测序,RPKM为10的基因60%是被测到的,RPKM为100的基因有90%可以测到。
TargetAmp方法:使用T7-Ologo(dT)的引物进行cDNA合成,与mRNA的polyA尾巴结合,作为逆转录的起始引物,得到第一链cDNA,且该cDNA链上引入了一个T7启动子,应用 RNase:H酶 将cDRNA:RNA链中的RNA链消化掉,再继续合成cDNA第二链。以得到的双链cDNA链为转录模板转录出 反义RNA链,纯化后再用随机引物进行纯化得到第二轮的cDNA, 再次使用 T7-Ologo(dT)引物连接到cDNA的polyA尾巴,再次进行逆转录,合成双链DNA,转录为反义RNA(达到微克级),再经过一轮逆转录就足够用于建库测序了。特点:通过转录扩增核酸的量,而不是PCR。
10Xgenomics系统分析单细胞表达: 该系统可以完成一群细胞当中,每个单细胞的RNA表达情况的定量分析。还可以完成染色体的单倍体长片段的组装。10X工作原理是先预制凝胶微珠(gel beads),微珠上种上特定的DNA片段,DNA序列的第一段是 Barcode(总共包含400万种,与微珠一一对应)。第二段是 UMI(unique multiplex index)序列,UMI是一段随机序列,每一个DNA都有自己的UMI序列,其作用是在经过PCR再深度测序得到的reads,可以看出哪些reads是来自于一个原始cDNA分子的, 可以将起始于1个cDNA分子的reads简并为一个cDNA。 简单的理解即,Barcode是微珠的ID, UMI是DNA分子的ID,UMI后的序列是 poly(dT序列),其作用是与mRNA的polyA尾结合,作为逆转录的引物,逆转录为cDNA。芯片液流管系统使得细胞包裹到有微珠的小液滴当中,细胞悬液中约有65%的细胞会完成包裹,这些细胞会在后续分析中给出信号。得到乳浊液之后使细胞破膜,游离出mRNA, 使其与逆转录酶,凝胶微珠上的核算引物,底物等相接触,mRNA与微珠上带标签的DNA分子结合,在逆转录酶的作用下逆转录为cDNA(cDNA也带有了特有的Barcode标签),抽提出带有标签的cDNA分子,再把这些cDNA分子加上接头,经过PCR扩增,做成illumina测序文库,上机测序,测序完成之后进行数据分析。每一次测几百到几千个细胞,通过Barcode拆分数据,可以把测序得到的reads归属到一个一个细胞,再通过UMI对reads进行简并之后,就可以看到一个细胞被读到了多少基因。
参考内容:陈巍学基因