注意,这里使用的seurat对象要求已经run过runUMAMP()
findCluster等函数,否则也没有必要把seurat的结果弄到monocle3的cds对象里
1. 从seurat对象手动创建cds对象
library(Seurat)
library(monocle3)
library(tidyverse)
library(patchwork)
rm(list=ls())
dir.create("Monocle3")
setwd("Monocle3")##创建CDS对象并预处理数据
pbmc <-readRDS("pbmc.rds")
data<-GetAssayData(pbmc,assay ='RNA',slot ='counts')
cell_metadata <-pbmc@meta.data
gene_annotation <-data.frame(gene_short_name =rownames(data))
rownames(gene_annotation)<-rownames(data)
cds <-new_cell_data_set(data,cell_metadata =cell_metadata,gene_metadata =gene_annotation)
来源:(https://www.jianshu.com/p/c402b6588e17)
上面的是中文的教程,还包含手动把seurat中的umap的数据传入cds的操作,适合不想官方文档的时候看,挺适合新手上手的。
2. 使用seuratwrapper自动导入seurat中的数据;
教程来源:
Building trajectories with Monocle 3
来自 <https://satijalab.org/signac/articles/monocle.html>
library(SeuratWrappers)
注意seuratWrappers包提供了seuart对象到其他包的多种接口,可以把seurat对象转换为其他对象;
这里是把seurat对象转换为了cds对象;
erythroid.cds<-as.cell_data_set(erythroid)
erythroid.cds<-cluster_cells(cds =erythroid.cds, reduction_method ="UMAP")
erythroid.cds<-learn_graph(erythroid.cds, use_partition =TRUE)
#这个教程是已经手动提供了root的细胞,如果没有这个文件,order_cells()会开一个窗口,然后让人选root。
#hsc是教程中给的root的文件,实际操作的时候,可以不用给这个参数,直接选择弹出的窗口中的细胞即可;
# order cells
erythroid.cds <- order_cells(erythroid.cds, reduction_method = "UMAP", root_cells = hsc)
lymphoid.cds <- order_cells(lymphoid.cds, reduction_method = "UMAP", root_cells = hsc)
# plot trajectories colored by pseudotime
plot_cells(
cds = erythroid.cds,
color_cells_by = "pseudotime",
show_trajectory_graph = TRUE
)
plot_cells(
cds = lymphoid.cds,
color_cells_by = "pseudotime",
show_trajectory_graph = TRUE
)
#提取pseudotime的结果,并加到metadata上面;
bone <- AddMetaData(
object = bone,
metadata = erythroid.cds@principal_graph_aux@listData$UMAP$pseudotime,
col.name = "Erythroid"
)
bone <- AddMetaData(
object = bone,
metadata = lymphoid.cds@principal_graph_aux@listData$UMAP$pseudotime,
col.name = "Lymphoid"
)
#可视化结果;
FeaturePlot(bone, c("Erythroid", "Lymphoid"), pt.size = 0.1) & scale_color_viridis_c()
上述的教程只是比较方便的把seurat对象转变成了cds对象,同时把UMAP PCA等数据也给maping过去了,但是没有把seurat_cluster弄过去,没有把gene_short_name弄过去
自己的搜集到的解决的方法:
3.使用自己看到的方法
cds2 <- as.cell_data_set(x = TregCell)
#mapping cluster
#cds对象的cds2@clusters$UMAP$clusters是一个named vector。
cds2@clusters$UMAP$clusters <- Idents(TregCell)[rownames(colData(cds2))]
#parition的数目根据自己的实际情况处理,如果后面的 learn_graph(cds2, use_partition = F)的use_partition为F,则不用partition来做不同pseudotime推测,没有没有必要设置partition;
cds2@clusters$UMAP$partitions <- factor(x = rep(1, length(rownames(colData(cds2)))), levels = 1)
names(cds2@clusters$UMAP$partitions) <- rownames(colData(cds2))
#从seurat obj transfer过去的cds对象没有做estimate size factor参数
## Calculate size factors using built-in function in monocle3
cds2 <- estimate_size_factors(cds2)
#创建cds对象的时候,cds要求gene_meta这gedf必须要有一列为gene_short_name
## Add gene names into CDS
cds2@rowRanges@elementMetadata@listData$gene_short_name <- rownames(cds2)
#如果出现了order_cells(cds)报错"object 'V1' not found",否则不执行
#来源:https://github.com/cole-trapnell-lab/monocle3/issues/130](https://github.com/cole-trapnell-lab/monocle3/issues/130
###############################################################
rownames(cds2@principal_graph_aux[["UMAP"]]$dp_mst) <- NULL
# colnames(cds@reducedDims$UMAP) <- NULL
colnames(cds2@int_colData@listData$reducedDims@listData$UMAP) <- NULL
###############################################################
cds2 <- learn_graph(cds2, use_partition = F)
cds2 <- order_cells(cds2)
plot_cells(cds2, color_cells_by = "pseudotime", label_cell_groups=F, label_leaves=FALSE, label_branch_points=FALSE, graph_label_size=1.5)
plot_cells(cds2)
以上代码得到了使用seurat对象里的UMAP以及seurat_cluster得到pseudotime。