1. 单细胞RNA-seq概述
RNA-seq 允许以高效且经济高效的方式分析样本中的转录本。这是 00 年代末的一项重大突破,此后变得越来越流行,很大程度上取代了微阵列等其他转录组分析技术。其成功的部分原因在于 RNA-seq 允许对样本中的所有转录本进行无偏采样,而不是仅限于一组预先确定的转录本(如微阵列或 RT-qPCR)。
通常,RNA-seq 用于由细胞混合物组成的样本,称为批量 RNA-seq,并且具有许多应用。例如,它可用于表征健康/患病、野生型/突变体或对照/处理样品中组织之间的表达特征。或者在进化研究中,使用不同物种组织样本的比较转录组学。除了用于转录本定量之外,它还可以用于在模型和非模型生物体中查找和注释新基因、基因亚型和其他转录本。
然而,使用bulk RNA-seq,我们只能估计细胞群中每个基因的平均表达水平,而不考虑该样本中各个细胞的基因表达的异质性。因此,它不足以研究异构系统,例如异构系统。早期发育研究或复杂组织(例如大脑)。
为了克服这一限制,开发了新的方案,允许在单细胞水平应用 RNA 测序 (scRNA-seq),并于 2009 年首次发表(Tang et al. 2009)。这项技术从 2014 年左右开始变得更加流行,当时新的方案和较低的测序成本使其更容易获得。与批量方法不同,通过 scRNA-seq,我们可以估计细胞群中每个基因的表达水平分布。
这使我们能够回答新的生物学问题,其中转录组中的细胞特异性变化很重要。例如,发现新的或稀有的细胞类型,识别健康/患病组织之间的差异细胞组成或了解发育过程中的细胞分化。这项技术最具标志性的用途之一是构建基因图谱(见下框),它提供了生物体细胞多样性的全面概要,在健康和基础研究方面有许多应用。
2. 样品制备方案
一般来说,典型的 scRNA-seq 包括以下步骤:
- 组织解剖和细胞解离以获得细胞悬浮液。
- (可选)可以选择细胞(例如,基于膜标记、荧光转基因或染色染料)。
- 将单细胞捕获到单独的反应容器(例如孔或油滴)中。
- 从每个细胞中提取 RNA。
- 将 RNA 反转录为更稳定的 cDNA。
- 扩增 cDNA(通过体外转录或 PCR)。
- 准备具有足够分子接头的测序文库。
- 测序,通常使用双端 Illumina 方案。
- 处理原始数据以获得每个细胞的基因计数矩阵。
- 进行一些下游分析。
3. 细胞捕获
用于捕获细胞的策略决定了实验的通量(即我们分离了多少细胞)、测序前如何选择细胞以及除了转录本测序之外可以获得哪些类型的附加信息。三种最广泛使用的方法是基于微量滴定板、基于微流体阵列和基于微流体液滴的方法。
微量滴定板方法依赖于使用例如移液、显微切割或荧光激活细胞分选(FACS)将细胞分离到板的各个孔中。基于孔的方法的一个优点是可以在文库制备之前拍摄细胞照片,从而提供额外的数据模式。例如,可以识别并丢弃受损细胞或找到含有双联体的孔(具有两个或更多细胞的孔)。当使用自动 FACS 分选时,还可以将细胞大小和任何使用的标签的强度等信息与孔坐标相关联,从而与下游分析中的单个细胞指数相关联。这些方法的主要缺点是它们通常通量低,并且每个细胞所需的工作量可能相当大。
荧光激活细胞分选 (FACS) 可用于任何捕获方法的上游,以选择细胞亚群。一种常见的使用方法是用区分活细胞和死细胞的染料对细胞进行染色(例如由于膜破裂),从而使细胞悬浮液中富含活细胞。
微流控阵列平台,例如 Fluidigm 的 C1,提供了一个更加集成的系统,用于捕获细胞和进行文库制备所需的反应。因此,它们比基于微量滴定板的方法提供更高的通量。通常,微流体平台仅捕获约 10% 的细胞,因此如果处理稀有细胞类型或输入量非常小,则微流体平台不适合。还必须注意阵列捕获的细胞尺寸,因为纳米孔是针对特定尺寸定制的(因此这可能会影响复杂组织中细胞的无偏采样)。而且,芯片相对昂贵,但由于反应可以在较小的体积内进行,因此可以节省试剂费用。
微流控液滴方法提供最高的通量,是当今最流行的方法。它们的工作原理是将单个细胞与珠子一起封装在纳升大小的油滴内。珠子上装载有构建文库所需的酶和其他成分。特别是,每个珠子都包含一个独特的条形码,该条形码附加到源自该细胞的所有测序读数上。因此,所有的液滴都可以被汇集起来,一起测序,并且随后可以根据这些条形码将读数分配给原始细胞。 Droplet 平台的文库制备成本相对较低,约为 0.05 美元/细胞。相反,测序成本往往成为限制因素,典型的实验覆盖率很低,仅检测到几千个不同的转录本。
4. 转录本定量
转录本定量有两种类型:全长转录本定量和基于标签的转录本定量。全长协议试图在整个转录本中实现统一的读取覆盖,而基于标签的协议仅捕获 5' 或 3' 末端。量化方法的选择对于数据可用于何种类型的分析具有重要影响。
为单细胞准备全长文库与批量 RNA-seq 中的操作基本相同(下图),并且仅限于基于板的方案,例如 SMART-seq2。尽管理论上全长方案应该提供均匀的转录本覆盖,但有时整个基因体的覆盖可能存在偏差(如下所示)。
使用基于标签的方案时,仅对转录本的末端之一(3' 或 5')进行测序。基于标签的协议的主要优点是它们可以与独特的分子标识符(UMI)结合,这有助于提高转录本定量的准确性。这种改进的原因与文库制备过程中的 PCR 扩增步骤有关,该步骤会为每个分子创建多个重复副本。由于这种扩增是指数级的,分子在最终文库中的表现可能不公平,从而导致由于这些 PCR 重复而高估其表达。为了解决这个问题,细胞条形码被独特地标记为随机核苷酸序列(UMI),因此它对于单个分子来说是唯一的。该 UMI 是测序读数的一部分,然后可以在量化转录本丰度时通过计算加以考虑。目前大多数 scRNA-seq 协议都是基于标签的,包括流行的基于液滴的 10x Chromium 协议,如下图所示。基于标签的协议的一个缺点是,仅限于转录本的一端,它降低了我们将读数与转录本明确对齐的能力,并且难以区分不同的亚型(Archer et al. 2016)。
基于 5' 和 3' 标签的协议之间的区别在于转录本的哪一端被测序。尽管 3' 协议更常用,但许多协议现在允许从任一端进行测序(例如 10x Chromium 支持两端)。 5'端测序的优点是我们可以获得有关转录起始位点(TSS)的信息,从而可以探索细胞间是否存在不同的 TSS 使用情况。
本文由mdnice多平台发布