分享一个快捷的提取工具,github上发布的,可以直接提取表达矩阵和空间坐标等信息。
cloupe-extract
cloupe-extract 是一个 Python 命令行工具,用于从 10x Genomics Loupe Browser 生成的 .cloupe 文件中提取空间转录组(Visium 风格)数据资产,输出结果可直接用于 Seurat 和 Scanpy 分析流程。
可提取的内容
| 类型 | 文件 |
|---|---|
| 表达矩阵 |
matrix.mtx.gz、features.tsv.gz、barcodes.tsv.gz
|
| 聚类元数据 |
metadata.tsv.gz、clusterings_long.tsv.gz
|
| 空间坐标 |
spatial_positions.tsv.gz、spatial_xy_matrix.tsv.gz
|
| 组织图像 |
tissue_hires_image.png、tissue_lowres_image.png
|
| 配置文件 | scalefactors_json.json |
安装
从本地目录安装(含所有依赖,包括图像提取所需的 Pillow):
pip install -e ".[all]"
从 GitHub 安装:
pip install "cloupe-extract[all] @ git+https://github.com/Coleliao/cloupe-extract.git"
如果只需要表达矩阵和空间坐标,不需要图像提取功能,可以省略 [all]:
pip install .
快速上手
一键提取全部内容,生成标准 Visium 目录结构:
cloupe-extract extract-all sample.cloupe -o sample_10x
输出目录结构如下:
sample_10x/
matrix/
matrix.mtx.gz
features.tsv.gz
barcodes.tsv.gz
metadata.tsv.gz
clusterings_long.tsv.gz
spatial/
spatial_positions.tsv.gz
tissue_hires_image.png
tissue_lowres_image.png
scalefactors_json.json
...
分模块提取命令
仅提取表达矩阵:
cloupe-extract matrix sample.cloupe -o sample_10x
默认会过滤掉 Loupe 的汇总行(如 Sum、Genome Sum),只保留 Gene Expression 特征。如需保留所有行:
cloupe-extract matrix sample.cloupe -o sample_10x --all-features
仅提取空间坐标:
cloupe-extract spatial sample.cloupe -o sample_10x/spatial
仅提取聚类元数据:
cloupe-extract metadata sample.cloupe -o sample_10x
输出的 metadata.tsv.gz 是一个 Seurat 友好的宽表格,每行对应一个 barcode,每列对应一种聚类方案(包含 Space Ranger 默认方案如 Graph-based 聚类、K-means K=2–10,以及用户在 Loupe 中自定义保存的标注)。
仅提取组织图像:
cloupe-extract image sample.cloupe -o sample_10x/spatial
可自定义图像尺寸:
cloupe-extract image sample.cloupe -o sample_10x/spatial --hires-max-dim 2000 --lowres-max-dim 600
适用场景
适合需要将 .cloupe 文件中的数据导入 Python(Scanpy/AnnData)或 R(Seurat)进行二次分析的研究人员,尤其是在无法通过 Space Ranger 重新运行流程、只有 .cloupe 文件的情况下。
推广一下 🥰🥰🥰🥳🥳🥳
如果大家有生信分析的需求,欢迎加我的🍠联系我交流合作
11430575655