今天读文献,遇到比较感兴趣的样本,数据下载下来是loom文件,查了下loom文件转换为seurat对象的方法。做个笔记。
- 背景
seurat 分析无法应付指数级增长的单细胞数据集计算需求。Linnarson实验室开发的基于hdf5的数据结构loom,可以方便地存储单细胞基因组数据集和元数据。HDF5数据格式不将数据存储在内存中,而是提供高效的磁盘存储,甚至可以扩展到大型数据集(甚至是>1M细胞)。
注意:loom对象是文件的连接,写入到文件完成之后,必需关闭文件。 - 处理工具
基于python的工具:loompy
基于R的处理工具:loomR - 官方教程
seurat:https://satijalab.org/seurat/mca_loom.html
loomR https://satijalab.org/loomR/loomR_tutorial.html
安装
devtools::install_github(repo = 'mojaveazure/loomR', ref = 'develop')
library(loomR)
library(Seurat)
pbmc <- connect(filename = "pbmc3k.loom", mode = "r"
pbmc3k.loom$close_all() # loom文件处理完要记得关闭
pbmc <- as.Seurat(pbmc)
VlnPlot(pbmc, features ="ACTB" , ncol = 2, pt.size = 0.1)
# Always remember to close loom files when done
- 其他
这里有人介绍了一个可以各种格式转换的R包,sceasy,禁止转载和摘录,所以链接: https://www.bilibili.com/read/cv8675277
这是github链接: https://github.com/cellgeni/sceasy
其中loom文件可以转换为 SingleCellExperiment
参考笔记:1. https://www.jianshu.com/p/880f8ead9f5e?utm_source=desktop&utm_medium=timeline
2.https://www.jianshu.com/p/9eb324ca5ff9 loom文件的具体结构和操作命令; seurat对象转换到loom文件。
- https://www.jianshu.com/p/396345566479?from=singlemessage&tdsourcetag=s_pcqq_aiomsg eurat对象、singlecellexper对象和anndata对象之间进行转换