本文首发于“生信大碗”公众号,转载请注明出处
单细胞测序技术自2009年汤富酬老师发表单细胞文献后被广泛了解,2013年被Nature Methods评为年度技术,至此越来越多地被应用在科研领域。2017年10X Genomics平台的建立才使得单细胞技术彻彻底底的传播开来。
单细胞转录技术(scRNA-seq)非常适合研究样本中各个细胞基因表达的异质性,其经典流程:分离单细胞(核),将RNA转换为cDNA,准备测序文库(illumina)后测序。
- 今天给大家分享的是单细胞下游数据分析 -
第一步、下载数据
打开GEO数据库网站 Home - GEO - NCBI,选择Series板块输入“Single-cell Hepatocellular Carcinoma”搜索肝细胞癌的单细胞数据。
我们以肝细胞癌数据集GSE103867为例,点击GSE103867进入页面后,下拉至最末端,下载如下图所示三个文件。
第二步、数据质控
如下图所示我们将得到三张图片。第一张图为不同细胞中有多少基因表达;第二张图为不同细胞RNA表达的数量,即每个细胞中基因表达数量的总和;第三个图则代表线粒体的百分比,如果线粒体基因占比过高则说明有问题,有可能是细胞坏死。一般是占比在10%以下。
第三步、寻找高变基因
一般情况下,细胞与细胞之间的基因表达趋于相似,就类似我们在bulk RNA测序时找差异基因一样,只有那种表达有显著差异的主要基因才会用于后续研究。而我们后面的降维聚类其实也是用的这里的高变基因。
第四步、降维聚类
降维时,一般用PCA降维,默认会得到50个PCA主成分,而每一个PCA主成分其实代表了一种细胞的特征,根据这些特征的相似,将细胞聚类成不同细胞类群,如下图。
第五步、细胞注释
我们在上面将细胞聚类成8个类群之后,但是我们还是不知道每个类群代表的是什么细胞,所以我们需要将细胞的名称注释上去。细胞注释有很多方法,可以通过手动筛选maker基因,查找文献之后注释,也可以直接用singleR注释。如下图就是singleR注释的结果。
第六步、细胞轨迹分析
器官、组织会随着时间改变或者外界环境改变而改变,其根源是细胞的改变,那我们怎么才能知道一种细胞是怎么变化成另外一种细胞的呢,其中有那些基因参与了主要的过程,这就是细胞轨迹分析,也叫拟时序分析。
总结:以上是对单细胞测序下游分分析基本流程的一个讲解,当然单细胞测序肯定没有这么简单,后面我们会继续分享上面每个步骤的具体操作和一些注意事项,也会分享一些个性化的高级的单细胞测序分析方法。
本文首发于“生信大碗”公众号,转载请注明出处
—END—