一网打尽scRNA矩阵格式读取和转化(h5 h5ad loom)

  scRNA矩阵存储的文件格式有10X单细胞测序数据、h5、h5ad、loom:10X单细胞测序数据经过cellranger处理后会得到矩阵的三个文件:matrix.mtx、barcodes.tsv 和genes.tsv;h5、h5ad常见于表达矩阵及注释信息的存储;loom格式更常见于RNA速率(velocyto)、转录因子(SCENIC)分析。

1、10X单细胞测序数据

library(Seuart)

list.files('case1/filtered_feature_bc_matrix')
[1] "barcodes.tsv.gz" "features.tsv.gz" "matrix.mtx.gz"

count <- Read10X('case1/filtered_feature_bc_matrix')
obj <- CreateSeuratObject(counts = count, min.cells = 3, min.features = 100, project = "case1")
obj
An object of class Seurat
21966 features across 3267 samples within 1 assay
Active assay: RNA (21966 features, 0 variable features)

2、h5

  • cellranger生成的h5
count <- Read10X_h5('case1/filtered_feature_bc_matrix.h5')
obj <- CreateSeuratObject(counts = count, min.cells = 3, min.features = 100, project = "case1")
  • 普通h5
library(dior)

obj <- read_h5('fibo_rds.h5')
obj
An object of class Seurat
73202 features across 4257 samples within 2 assays
Active assay: RNA (36601 features, 0 variable features)
 1 other assay present: counts
 3 dimensional reductions calculated: pca, tsne, umap

3、h5ad
  read_h5ad函数需要依赖python的包scanpydiopy,使用前确保这两个包已经安装好,否则先安装一下:pip install scanpy diopy

library(dior)

obj <- read_h5ad('global_raw.h5ad', target.object = "seurat", assay.name = "RNA")
obj
An object of class Seurat
33538 features across 486134 samples within 1 assay
Active assay: RNA (33538 features, 0 variable features)
 2 dimensional reductions calculated: pca, umap

  diopypython版的dior,安装后可以在命令行直接使用:scdior --help查看软件参数,根据提示来使用。

4、loom

library(SCopeLoomR)
library(Seurat)

fibo_loom <- connect("fibo_count.loom")
count <- t(fibo_loom[['matrix']][,])
colnames(count) <- fibo_loom[['col_attrs']][['CellID']][]
rownames(count) <- fibo_loom[['row_attrs']][['Gene']][]

obj <- CreateSeuratObject(counts = count, min.cells = 3, min.features = 100, project = "case1")
obj
An object of class Seurat
21114 features across 4257 samples within 1 assay
Active assay: RNA (21114 features, 0 variable features)

  R包loomR也可以用来处理loom文件,安装devtools::install_github("mojaveazure/loomR", ref="develop"),感兴趣的可以自行尝试。

5、dior
  前面提到这个R包的两个功能,这里展示一下该包所有的功能,一个函数对应一个功能,基本上可以通过名称知道函数的用途。

library(dior)

ls('package:dior')
[1] "df_to_h5"        "h5_to_df"        "h5_to_matrix"    "matrix_to_h5"
[5] "read_h5"         "read_h5ad"       "read_h5part"     "seurat_write_h5"
[9] "write_h5"

6、sceasy
  这个R包也可以用于数据格式的转化,实际使用过程只需使用convertFormat函数即可,参数from = c("anndata", "seurat", "sce", "loom")指定了原始的格式,to = c("anndata", "loom", "sce", "seurat", "cds")指定需要转换为的格式,可以转换的格式组合见下面列表。

devtools::install_github("cellgeni/sceasy")
library(sceasy)

grep('2',ls(asNamespace('sceasy')), value=T)
[1] "anndata2cds"    "anndata2seurat" "loom2anndata"   "loom2sce"
[5] "sce2anndata"    "sce2loom"       "seurat2anndata" "seurat2sce"

convertFormat(obj, from='seurat', to='anndata', outFile='fibo.h5ad')

  这种转换可以是数据对象到文件的转换,也可以是文件到文件的转换。不过,这个包使用起来好像不是那么友好,比如上面从seurat对象想转换为anndata格式就没有成功,并且函数也没有帮助信息,github上面也是简单的介绍。


往期回顾

ggplot2 | 开发自己的画图函数
R包安装的4种姿势
clusterProfiler: No gene can be mapped | 怎么破?
R语言的碎碎念
linux入门学习指南

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容