【工作环境:R.studio】
1.Bulk RNA-seq(大量RNA-seq)、scRNA-seq、snRNA-seq的区别?
(转录组测序即RNA-seq分为bulk、single cell、single nucleus三种测序技术)
传统的转录组测序技术(bulk RNA-seq)是基于群体细胞,每个样本包含成千上万个细胞,所以最终反映的是基因在群体细胞中平均表达水平,从而掩盖了不同细胞之间的表达异质性。
单细胞测序不同于传统的高通量测序,它是对于一个细胞群中的某一个细胞进行测序分析。单细胞转录组测序就是对单个细胞转录组水平进行测序,它的优势是准确地分析每一个细胞的基因表达,能准确区分细胞群体,并进行细胞分类间比较,以及能找到稀有的细胞的表达情况。进行单细胞测序前,首先需要分离单个的细胞,不同类型的单细胞转录组测序技术,使用的细胞分离技术可能不一样。(细胞分离技术分类汇总见: https://blog.csdn.net/AIPuFu/article/details/100174499)
而单细胞测序技术与单细胞核测序技术的区别在于单细胞测的是细胞质+细胞核的遗传信息,而单细胞核如其名,测的是细胞核内的遗传信息。因为单细胞测序技术存在一些弊端。只能够取样于新鲜组织,而一些临床的冷冻的样本,无法得到利用。在解离的过程中,一些细胞这种应激的条件下,基因的表达发生变化。同时,一些不易解离的细胞类型也会因此被过滤掉,而使我们最终的分析丧失一些重要的信息。由于细胞核膜相对于细胞膜是更加稳定的,所以在实验的过程中也更加容易操作,从而规避了我们上面提到的一些单细胞测序技术的弊端,临床冷冻的样本的遗传信息也能够得到有效的利用。
虽然单细胞核测序技术只是测序了细胞核内的遗传信息,而没有得到细胞质内的遗传信息(如部分mRNA,因为我们知道,成熟的mRNA,要在细胞质中进行翻译。)但从目前的实验结果上看,snRNA-seq的表现与scRNA-seq完全一致,同样能够准确的捕捉到细胞的转录状态,这一点已在不同组织、不同外界处理条件等多种情况下得到了证实。
2.单细胞测序中,10xgenomics测序中的10x是什么意思呢?是不是指的是测序深度?
10X genomics是他们公司的商标就跟Illumina一样,X表示字母读作[eks]不是乘号的意思,所以也不是指测序深度。
3.什么是10X数据?
标准的10X数据(包含三个文件(barcodes.tsv/genes.tsv/matrix.mtx)挖掘公共单细胞数据集时,会遇到常见各种单细胞测序数据格式。
例如:
(1)barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz
(2)表达矩阵
(3)h5
(4)h5ad
barcodes.tsv、genes.tsv、matrix.mtx格式数据文件
这是cellranger上游比对分析产生的3个文件,分别代表细胞标签(barcode)、基因ID(feature)、表达数据(matrix)
一般先使用read10X()对这三个文件进行整合,得到行为基因、列为细胞的表达矩阵(为稀疏矩阵dgCMatrix格式,节约内存);然后再配合CreateSeuratObject()函数创建Seurat对象
3.什么是细胞的Gel bead,以及其组成部分?
单细胞测序的高通量化平台,不得不提的就是10X Genomics。其技术核心包括两部分:Gel Bead和油包水微液滴生成系统,后者也是微液滴法数字PCR仪(以Bio-Rad的产品为代表)的核心技术。Gel Bead由凝胶珠和磁珠上的一段引物构成,引物序列中包含一段每个Gel Bead都各不相同的10X Barcode,用以区分不用的单细胞。将细胞悬液进行充分稀释后经由微流体“双十字”交叉系统,形成微液滴和Gel Bead结合的GEM(Gel Beads-in-emulsion)。
Gel bead由四个部分组成。各有其各自的作用。
R1:为一段已知序列的DNA片段,用于后续的测序。
10X Barcode:用于标记细胞。
独特的分子标识符(UMI):unique Molecular identifiers 是在逆转录过程中添加到转录本中的短随机条码(4-10bp)。它们可以将测序读序列分配给单个转录分子,从而消除scRNASeq数据中的放大噪声和偏差。当对包含UMI的数据进行测序时,技术通常只对包含UMI的转录本的末端(通常是3’端)进行特定的测序。
在混合测序的过程中,用于区分不同的cDNA来源的reads。也就是在后续的建库扩增的过程中,cDNA不断的扩增产生reads,来源于同一个转录本的reads的UMI相同。每一个细胞有一个特征的UMI。之后,在进行扩增建库的过程中,只要是由该细胞扩增产生的cDNA,都会带有这段UMI。
poly(dT)VN:通过与mRNA的polyA尾互补配对,捕获细胞中游离的mRNA。
(2)建库
通过某种方法,将细胞裂解,释放出mRNA,利用逆转录酶,将mRNA反转成双链cDNA,进行扩增。而Gel bead所起到的作用就是,将我们细胞中的mRNA的序列信息捕获,然后通过反转录的方式,转换为带有特征的细胞标记的reads。
由于这个平台的测序过程是高通量的。所以,将所有的reads(来源于不同的细胞的不同的mRNA)都集中起来进行测序。而后续的过程中,如何将这些不同来源的reads区分开来,就是利用我们的标记。
一般而言,有几个维度的标记:
来自哪一个样本(患者,如果是一个个体的某个组织的话,另当别论)
来自哪一个细胞(因为我们要在细胞维度上,进行表达量的识别,所以这部分的信息也很重要)——10X barcode
来自哪一个基因(通过基因的识别,我们知道是哪些基因的表达)——UMI
所以,最终表现在counts矩阵上,就是行为所在的细胞,列为基因,值为定量后的表达值。