提取10X空间组cloupe文件数据

分享一个快捷的提取工具,github上发布的,可以直接提取表达矩阵和空间坐标等信息。

cloupe-extract

cloupe-extract 是一个 Python 命令行工具,用于从 10x Genomics Loupe Browser 生成的 .cloupe 文件中提取空间转录组(Visium 风格)数据资产,输出结果可直接用于 SeuratScanpy 分析流程。


可提取的内容

类型 文件
表达矩阵 matrix.mtx.gzfeatures.tsv.gzbarcodes.tsv.gz
聚类元数据 metadata.tsv.gzclusterings_long.tsv.gz
空间坐标 spatial_positions.tsv.gzspatial_xy_matrix.tsv.gz
组织图像 tissue_hires_image.pngtissue_lowres_image.png
配置文件 scalefactors_json.json

安装

从本地目录安装(含所有依赖,包括图像提取所需的 Pillow):

pip install -e ".[all]"

从 GitHub 安装:

pip install "cloupe-extract[all] @ git+https://github.com/Coleliao/cloupe-extract.git"

如果只需要表达矩阵和空间坐标,不需要图像提取功能,可以省略 [all]

pip install .

快速上手

一键提取全部内容,生成标准 Visium 目录结构:

cloupe-extract extract-all sample.cloupe -o sample_10x

输出目录结构如下:

sample_10x/
  matrix/
    matrix.mtx.gz
    features.tsv.gz
    barcodes.tsv.gz
  metadata.tsv.gz
  clusterings_long.tsv.gz
  spatial/
    spatial_positions.tsv.gz
    tissue_hires_image.png
    tissue_lowres_image.png
    scalefactors_json.json
    ...

分模块提取命令

仅提取表达矩阵:

cloupe-extract matrix sample.cloupe -o sample_10x

默认会过滤掉 Loupe 的汇总行(如 SumGenome Sum),只保留 Gene Expression 特征。如需保留所有行:

cloupe-extract matrix sample.cloupe -o sample_10x --all-features

仅提取空间坐标:

cloupe-extract spatial sample.cloupe -o sample_10x/spatial

仅提取聚类元数据:

cloupe-extract metadata sample.cloupe -o sample_10x

输出的 metadata.tsv.gz 是一个 Seurat 友好的宽表格,每行对应一个 barcode,每列对应一种聚类方案(包含 Space Ranger 默认方案如 Graph-based 聚类、K-means K=2–10,以及用户在 Loupe 中自定义保存的标注)。

仅提取组织图像:

cloupe-extract image sample.cloupe -o sample_10x/spatial

可自定义图像尺寸:

cloupe-extract image sample.cloupe -o sample_10x/spatial --hires-max-dim 2000 --lowres-max-dim 600

适用场景

适合需要将 .cloupe 文件中的数据导入 Python(Scanpy/AnnData)或 R(Seurat)进行二次分析的研究人员,尤其是在无法通过 Space Ranger 重新运行流程、只有 .cloupe 文件的情况下。

推广一下 🥰🥰🥰🥳🥳🥳
如果大家有生信分析的需求,欢迎加我的🍠联系我交流合作
11430575655

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容