单细胞测序技术是一个以细胞生物学和分子生物学为中心的多学科技术,一个完整的单细胞测序实验流程包括组织取样、细胞悬液制备、单细胞细胞标记分离、核酸捕获、测序文库构建、上机测序以及生信分析。由于单细胞实验所需的样本通常较为珍贵,加之实验过程涉及的仪器耗材和实验步骤较多,而每一名实验人员都希望最终能获得一份高质量的单细胞数据,发表一篇优秀的学术文章。因此,在整个单细胞实验流程中,我们可以设置多个质控点,以保证每一阶段实验的质量,为最终拿到高质量单细胞测序数据提供保障。
那么,在进行单细胞测序中有哪些质控点需要注意呢?下面我们以单细胞转录组实验为例,一起打卡单细胞建库测序过程中的“优质连环扣”。
组织样品质控环节
在单细胞测序实验过程中,样品采集与保存是实验成功的基础,也是保证实验成功的第一步。一个合格的组织样品需同时满足:①离体时间较短,通常小于72 h;②保存温度2-8 ℃;③样本质量大于100 mg,象形的比喻是“黄豆粒”大小的组织块。因此,我们需要将离体的组织尽快进行细胞悬液制备及下游单细胞实验,以保证组织细胞中的核酸信息不发生变化。
然而在具体实践中,由于取样场所条件的不同,很难实现第一时间组织解离和单细胞实验。为了能保持细胞活性,可以考虑使用组织保存液对组织短时间保存,预留出时间将组织样本运输到中心实验室。新格元根据这一需求开发了sCelLive®组织保存液,可以保存组织72小时的活性,且不影响细胞内转录本变化。
细胞悬液质控环节
取得合适的组织样品后,要对组织样品进行解离以获得单细胞悬液。目前解离方式有多种多样,如机械研磨、酶促解离等。为了帮助实验人员更好解离样品,新格元同时推出sCelLive®组织解离液可搭配Python®自动化组织解离仪,从而快速的将组织解离成单细胞悬液并保持细胞的活性。
对于组织解离出来的细胞悬液,其质控主要采取对细胞悬液进行台盼蓝染色观察为主。若组织块消化完全,显微镜下观察细胞无成团或聚集现象,细胞悬液即为达标;同时单细胞实验要求细胞悬液符合以下标准:①细胞活性>85%;②细胞总数> 20000;③杂质或红细胞占比小于20%
对于离心重悬后的获取到的细胞悬液,如果红细胞占比大于20%,则需要进行红细胞裂解步骤,裂红后细胞悬液需通过镜检判断红细胞是否裂解彻底,若红细胞数量依然大于20%,则需要二次裂红处理;若红细胞占比小于10%可以直接清洗重悬镜检。
文库构建环节
优质的单细胞悬液经微流控芯片分离和分子标签磁珠核酸捕获之后,即可获取到单细胞的mRNA,并经过经反转录扩增(RT-PCR)得到单细胞的cDNA,我们可以通过cDNA的长度推测单细胞mRNA的捕获质量。
为满足二代测序对测序文库长度的要求(通常采用PE150测序),质检合格的cDNA需要进行片段化(Fragment)打断成约500bp左右的片段,并经过末端修复、加接头、PCR扩增、片段分选等常规NGS建库操作得到cDNA文库。
纯化后cDNA和核酸文库可以用Qubit及生物片段分析仪检测其浓度和片段大小。一个合格的cDNA应同时满足以下条件:①Qubit检测总量>30ng;②质检主峰片段大小应在 900-2000bp左右;③ 1000bp-5000bp占比大于15%;④300bp以下片段占比小于40%;一个合格的核酸文库应同时满足以下条件:①Qubit检测总量>100ng;②质检主峰400bp-700bp之间;③900bp-5000bp占比<10%。
NGS下机数据分析环节
文库构建完成并成功上机测序象征着单细胞测序即将进行到数据挖掘阶段。根据高通量测序原理,测序过程中产生的代表碱基信息的光学信号经碱基识别(base calling)分析转化为碱基信息(reads)。在单细胞测序核酸捕获与文库构建过程中,我们添加了带有独特细胞标签的Barcode Beads用来标记细胞身份,因此需要根据标签序列将对应的样品进行拆库定量。FASTQ是大多数测序平台下机后的原始数据文件格式。
在单细胞数据分析过程中,我们同样需要对下机的原始数据(raw data)进行一系列严格的质控标准,即去除低质量序列,保留好的序列以保证最终分析获得的数据结果真实、可靠。在此基础上,单细胞测序质控包括:read1 barcode质控、read2质控、比对质控、细胞质控。这些质控过程已被整合到新格元的Celescope®可视化分析软件中,该软件可以对下机数据进行自动标签纠错和参考基因组比对,进而生成表达矩阵和单细胞质控结果。
下面是单细胞测序质控报告中一些关键参数希望大家注意:
>Uniquely Mapped Reads:与基因组专一比对的reads数,主要范围70%-90%。
>Fraction Reads in
Cells:带有细胞相关barcodes且唯一比对到转录组的reads(百分比较低意味着细胞中濒死或死亡细胞RNA比例较高),主要范围>50%。
>Median UMI per Cell:每个细胞相关barcodes的UMI计数中位值,与测序深度有关。
>Median Gene per Cell:每个细胞相关barcode中检测到的基因中位数,与测序深度有关。
>Mean Reads per Cell:常用来表示测序深度,有效reads(valid reads)的数量除以估计的细胞数(Estimated Number of Cells)。
>Saturation:即测序饱和度,其大小和测序深度有关,也和文库复杂度有关,一般测90G之后>60%。
实验示例
我们以小鼠黑色素瘤PDX模型样本和GEXSCOPE®海量单细胞转录组试剂盒为例,进行完整的单细胞建库测序实验。
首先在得到样品后,我们使用组织解离液获取到细胞悬液,并通过微流控芯片获取到高质量的cDNA和核酸文库,最终获得的单细胞下机数据经Celescope®可视化分析软件进行分析。
可以看到,此次实验获得了9446有效单细胞,细胞活性91%,单细胞获取情况良好。cDNA片段大小在1000-2000bp保证得到cDNA全长;转库组文库片段大小在400-900bp,符合高通量测序要求;中值基因3427个,中值UMI 13323个,测序质量良好。
以上就是单细胞测序过程中的重点质控环节。当然,影响测序成功的因素还有很多,大家在做实验的过程中能够按照操作规范进行,也可以多积累属于自己实验的实验小技巧~