一行代码合并多个空间转录组数据

写了个简单的程序用于空间转录组数据的和整合,包含的合并方法有以下几种:
1.CCA(基于Seurat)
2.Harmony
3.FastMNN(基于batchelor)
4.scVI
5.基于 feature anchoring
要使用这个函数,您需要安装以下R包:Seurat、batchelor、reticulate,要是用scVI整合需要以下Python包:scanpy、anndata、scvi-tools。

使用方法非常简单,您只需要提供包含所有spaceranger输出数据的目录路径,函数将自动读取数据并将它们整合。使此函数正常工作,数据需要以下目录结构组织好spaceranger处理后的数据:

Result
├── Sample1
│   ├── outs
│   │   ├── analysis
│   │   ├── filtered_feature_bc_matrix
│   │   ├── raw_feature_bc_matrix
│   │   ├── spatial
│   │       ├── tissue_positions.csv
│   │       ├── scalefactors_json.json
│   │       ├── image.tif
│   │       ├── tissue_hires_image.png
│   │       ├── tissue_lowres_image.png
│   │       ├── aligned_fiducials.jpg
│   │       ├── detected_tissue_image.jpg
│   │       ├── spatial_enrichment.csv
├── Sample2
├── Sample3
│--- Sample4
│--- Sample5
│--- Sample6
│--- Sample7
│--- Sample8
│

按照这种方式组织您的数据,即将所有的spaceranger 结果放到一个result 目录下,并提供Result目录的路径,函数将自动读取数据并进行整合。

scVI:

要使用此方法,您需要为scVI设置一个工作的conda环境,请设置conda_env=您环境的路径,例如conda_env="/home/USER/miniconda3/envs/scvi", 此处USER是你的用户名

要在R终端加载此函数并运行:

加载代码:

source(url('https://raw.githubusercontent.com/Polligator/Integrated-Visium-Spatial-transcriptomics-data/main/integration.r'))

运行程序整合:

inetgrated_ST<-ST_Data_Integration(visium_dir = visium_dir, method = "SCVI", conda_env = "/miniconda3/envs/scvi",epochs = 100)

visium_dir是您目录的路径,其中应包含所有单个spaceranger数据文件夹。

整合结果可视化:

DimPlot(inetgrated_ST, reduction = "umap.integrated", group.by = c("integrated_clusters", "orig.ident"), pt.size = 3) 

FastMNN:

此方法使用batchelor包整合ST数据:https://bioconductor.org/packages/release/bioc/html/batchelor.html,此方法有两个选项:FastMNN_all和FastNMF_variable。FastMNN_all使用所有样本中存在的所有公共基因来整合数据,FastNMF_variable仅使用由Seurat函数VariableFeatures()识别的可变特征来整合数据。

inetgrated_ST <- ST_Data_Integration(visium_dir = visium_dir, method = "FastNMF_variable") inetgrated_ST <- ST_Data_Integration(visium_dir = visium_dir, method = "FastNMF_all")

可视化:

DimPlot(inetgrated_ST, reduction = "umap.NMF", group.by = c("integrated_clusters", "orig.ident"), pt.size = 3)

CCA或Harmony

CCA
inetgrated_ST <- ST_Data_Integration(visium_dir = visium_dir, method = "CCA") 
Harmony
inetgrated_ST <- ST_Data_Integration(visium_dir = visium_dir, method = "Harmony") 

可视化:

DimPlot(inetgrated_ST, reduction = "umap.integrated", group.by = c("integrated_clusters", "orig.ident"), pt.size = 3)

FeatureAnchoring

此方法基于Seurat包,它使用特征锚定函数来整合数据,该函数将自动选择最大数量的可变特征来整合数据。基本上,它是Seurat函数FindIntegrationAnchors和IntegrateData包装后的结果,即下面的函数打包后的结果

int.anchors <- FindIntegrationAnchors(object.list = st.list, normalization.method = "SCT", verbose = FALSE, anchor.features = st.features) 
integrated <- IntegrateData(anchorset = int.anchors, normalization.method = "SCT", verbose = FALSE) 

要使用此FeatureAnchoring方法

inetgrated_ST <- ST_Data_Integration(visium_dir = visium_dir, method = "FeatureAnchoring")

结果可视化:

DimPlot(inetgrated_ST, reduction = "umap", group.by = c("ident", "orig.ident"))
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容