SpatialExperiment || 空间数据管理

我们知道单细胞数据的激增和它的高维特征催生了针对单细胞数据的数据格式:Seurat对象、singlecellexperiment对象以及anndata对象。空间数据的出现为表达量数据带来了新的视角,一般它包含图像数据,空间坐标数据以及表达量数据。虽然以上三种数据格式可以轻松地把空间信息包装起来,但是为了凸显空间位置的重要性,人们开发了与单细胞的singlecellexperiment类似的SpatialCellExperiment用于空间数据管理与分析。当然,另一个R包:SpatialExperiment 也在不断地完善中。

那么,我们不禁要问为什么之前的单细胞数据格式可以轻松地包装空间数据,还要开发类似SpatialCellExperiment呢?我们知道,毕竟单细胞的是单细胞的,虽然在数据格式上可以很好地容纳,毕竟内核部分没有针对空间分析方法。比如,SpatialCellExperiment 封装了sf提供了对空间数据分析的支持,这是一种编码空间向量数据的标准化方法。可用来实现一个SpatialPolygonExperiment类,包含精确的细胞亚群几何形状以及基因和文库元数据(metadata )。也即,表面看SpatialCellExperiment 只是加了XY轴,其实内在封装了空间分析的一般方法,如,一种中间建模方法可以是按平铺法进行,即将观测空间均匀划分为规则区域。然后,每个tile (区域)反映相应区域检测到的特征。请注意,tiles可以是矩形、六边形,或者任何可以将平面划分为规则网格的多边形。

我们曾经在空间信息在空间转录组中的运用应用空间统计学分析空间表达数据看到过如果没有专门的空间数据格式,如何自己调用(地理的)空间分析R包先做对象转换再做分析的过程。数据分析中50%的时间在数数据格式的处理,有了空间表达数据的格式可以缩短这部分时间,把我们从对象转换的藩篱中解放出来。当然这在Seurat或anndata中可能就是as.XXX的函数以完成数据格式转化,分析交给做空间的工具。前提是我们要有空间表达数据分析工具。

目前我们看到的主要R包是SpatialCellExperiment和SpatialExperiment,完善程度可能还没有singlecellexperiment那么高,但是至少我们看到了人们在切片上挖掘信息的努力。

空间分析常用的R包:

  • sp
  • spatstat
  • spdep
  • fields
  • spatclus
  • geoR
  • rgdal

大量的空间数据分析工具正在开发中,每一个工具都是一个新的视角。

如果你对空间转录组感兴趣不妨看看:

STRbook|| 纵论空间转录组前世今生
空间信息在空间转录组中的运用
应用空间统计学分析空间表达数据
Giotto|| 空间表达数据分析工具箱
SPOTlight || 用NMF解卷积空间表达数据
空间转录组教程|| stLearn :空间轨迹推断
Seurat 新版教程:分析空间转录组数据
单细胞转录组数据分析|| scanpy教程:空间转录组数据分析
10X Visium:空间转录组样本制备到数据分析
定量免疫浸润在单细胞研究中的应用


https://kevinrue.github.io/SpatialCellExperiment/articles/SpatialCellExperiment.html
https://bioconductor.org/packages/release/bioc/html/SpatialExperiment.html
http://www.bioconductor.org/help/course-materials/2020/HCASymposium/06-ChallengesAndOpportunities.pdf

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容