- 本章开始记录自学单细胞分析,根据b站别人的投稿视频学习的,感谢up!(需要可以去搜索生信单细胞,播放量最高的两个视频)
1. 下载单细胞数据
GEO数据库里边搜索单细胞的数据,一般需要文件后缀是MTX的数据(里边有三个文件是必须要的)
-
注意很多数据不是单细胞的要好好看一下搜索GEO
-
一般是下载这个RAW文件RAW文件
-
在这里我们直接搜索GSE106273下载数据
image.pngimage.png -
简单理解:barcodes是细胞标记类似样本号;genes是gene ID;matrix为表达量(最后一列)
文件解压
2. Seurat4.0系列教程1:标准流程
- 读取方法一
-
把三个压缩文件改名成这样image.png
library(dplyr)
library(mindr)
library(tidyverse)
setwd(dir = "D:/桌面/Rwork/single_cell/GSE10627/hg19/")
rm(list = is())
pbmc.data <- Read10X(data.dir = "D:/桌面/Rwork/single_cell/GSE10627/hg19/") #注意压缩包要改名
pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc", min.cells = 3, min.features = 200)
#过滤检测少于200个基因的细胞(min.features = 200)和少于3个细胞检测出的基因(min.cells = 3)
-
读取方法二
直接读取解压缩后的文件
BiocManager::install("multtest")
library(multtest)
if(!require(Seurat))install.packages("Seurat")
if(!require(dplyr))install.packages("dplyr")
if(!require(mindr))install.packages("mindr")
if(!require(mindr))install.packages("tidyverse")
library(Seurat)
library(dplyr)
library(mindr)
library(tidyverse)
#####自动读取cellranger(LINUX)输出的feature barcode matric
rm(list = ls())
pbmc.data <- Read10X(data.dir = "filtered_gene_bc_matrices/hg19/")
#自动读取10X的数据,是一些tsv与mtx文件
pbmc <- CreateSeuratObject(counts = pbmc.data, project = "biomamba")
# pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc3k", min.cells = 3, min.features = 200)
#过滤检测少于200个基因的细胞(min.features = 200)和少于3个细胞检测出的基因(min.cells = 3)
- 读取方法三(readtable读取就行)
library(Seurat)
library(dplyr)
library(mindr)
library(tidyverse)
setwd(dir = "D:/桌面/Rwork/single_cell/GSE84465")
a <- read.table("GSE84465_GBM_All_data.csv.gz")
head(rownames(a))
tail(rownames(a),10)#查看最后10个行名是啥
a=a[1:(nrow(a)-5),]#后5行行名异常 删掉





