前言
scRNA-seq越来越成为一种常规测序内容,最近正好分析一些scRNA-seq的数据,把分析过程记录下来,便于后续再次使用。
对于走过的坑也进行记录,后续便于解决问题。
本贴涉及的脚本运行环境包括linux及windows,软件涉及conda、R、python和docker。
本贴持续更新,随时更新记录新的分析方法和内容。
有什么宝贵建议,请留言交流,不胜感激!
目录
1 软件安装及环境搭建
本文依赖的软件如下:
Linux: Anaconda (搭建分析环境,安装相应的软件)
Windows: RStudio(运行R便于演示和修改)、Spyder(运行python便于演示和修改)、Docker(R包dyno依赖Docker)
R (version 4.3.0)及Rtools43 for Windows
Cell Ranger v7.0
相应的python模块和R包安装在正文中展示。
2 测序数据质控(fastp)
3 测序数据比对 (cellranger)
4 数据过滤
5 数据标准化(normalization)
6 细胞周期回归分析(cell cycle scoring and regression)
7 数据归一化(scale)
8 降维及聚类分析(PCA,UMAP及tSNE)
9 去除doublets (DoubletFinder)
10 找cluster Biomarkers
11 鉴定细胞类型(cell type)
12 伪时间分析(Pseudotime)
13 速率分析(RNA velocity)
正文
1 软件安装及环境搭建
数据分析开始前,先搭建分析环境并把该安装的软件安装完成。
本文在linux系统上基于conda进行环境搭建和软件安装。
#下载conda(版本可能随时变,请查阅官网)
wget https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh
#安装conda
bash ./Anaconda3-2023.03-1-Linux-x86_64.sh
#创建分析环境
conda create -n scRNAseq r-base=4.3.0 python=3.10 fastp
#激活分析环境
conda activate scRNAseq