spaceranger知识(1)

卡卡最近接触到了单细胞空间转录组的数据,需要对其进行标准分析得到统一的数据格式,接触到了spaceranger软件。

spaceranger软件[1]

spaceranger软件是10X Genomics开发的,适用其Visium Spatial platform产生的数据,可以将原始fastq数据经过质控,比对,定量等步骤后转为spot X gene的表达矩阵,供分析人员进行二级分析;当然,其功能不仅限于此,但是这个是其很重要的功能。

raw feature-barcode matrix转为filtered feature-barcode matrix

卡卡分析时发现,有的公共数据,只提供raw feature-barcode matrix,但是下游分析一般使用的是filtered feature-barcode matrix,该怎么办呢?是不是spaceranger软件可以帮忙呢?卡卡发现:

  • 对于10X的6.5mm的Visium slides芯片,barcode白名单有4992个,即raw feature-barcode matrix的spot数目一般为4992个;而对于11mm的芯片,则有14336个spot barcode白名单;
  • 只有被tissue覆盖的spot用于生成filtered feature-barcode matrix并进行下游分析[1];
  • spcaeranger官网说明通过Imaging Algorithms确定真正被tissue组织覆盖的spot,并将其定义在tissue_positions.csv文件中;
  • 因此卡卡觉得可以根据tissue_positions.csv文件第二列信息(是否被tissue组织覆盖),对raw feature-barcode matrix进行过滤得到filtered feature-barcode matrix;
  • 于是卡卡找了一些公共及项目的数据,验证是否filtered feature-barcode matrix的barcode就是tissue_positions.csv文件中第二列为1的barcode;
  • 构建验证函数为check_tissue,并进行测试,发现猜想是正确的;
check_tissue <- function(tissuefile,filtereddir){
  if(! file.exists(tissuefile)){stop(paste0(tissuefile,' not exist!!'))}
  dat <- read.table(tissuefile,header=F,sep=",")
  dat <- dat[dat[,2]==1,]
  intissue_cell <- dat[,1]

  barcode_file = file.path(filtereddir,'barcodes.tsv.gz')
  if(! file.exists(barcode_file)){stop(paste0(barcode_file,' not exist!!'))}
  filtered_barcode <- read.table(barcode_file)
  if(length(filtered_barcode$V1) == length(intissue_cell) && all(intissue_cell %in% filtered_barcode$V1)){
    print('yes, filtered barcodes is the same with that in tissue_positions_list')
  }else{
    print('no, filtered barcodes is not the same with that in tissue_positions_list')
  }
}
  • 因此,卡卡构建了函数raw2filtered,可以将raw feature-barcode matrix转成filtered feature-barcode matrix;
raw2filtered <- function(datapath,tissuefile){
  library(Seurat)
  library(Matrix)
  library(dplyr)
  library(plyr)
  library(data.table)
  library(DropletUtils)

  if(! file.exists(tissuefile)){stop(paste0(tissuefile,' not exist!!'))}
  dat <- read.table(tissuefile,header=F,sep=",")
  dat <- dat[dat[,2]==1,]
  intissue_cell <- dat[,1]

  rawdir <- file.path(datapath,'raw_feature_bc_matrix')
  if(! dir.exists(rawdir)){stop(paste0(rawdir,' not exist!!'))}
  raw_data <- Read10X(data.dir=file.path(datapath, "filtered_feature_bc_matrix"))

  if(! all(intissue_cell %in% colnames(raw_data))){stop(paste0(tissuefile,' is error!!'))}
  filtered_data <- raw_data[,intissue_cell]
  filtereddir = file.path(datapath,'filtered_feature_bc_matrix')
  write10xCounts(x = filtered_data, path = filtereddir, version='3', overwrite = TRUE)
}
  • 其实有的分析步骤也可以直接用raw feature-barcode matrix进行分析,因为有的函数默认会根据tissue_positions.csv文件进行过滤,像BayesSpace的readVisium函数。

什么是单细胞空间转录组(Spatial Transcriptomics, ST)呢?

  单细胞转录组(scRNA-seq) 技术能够检测组织内存在的不同亚群,但是在组织解离中会丢失细胞的空间信息,而空间信息对于了解细胞相互作用是很重要的,单细胞空间转录组就能够提供细胞的空间信息。
  但是单细胞空间转录组的分辨率没有scRNA-seq那么么高,也就是说单个细胞(spot) 实际上含有数个细胞。
  目前商用的空间转录组平台可以说是一家(10X genomics Visium platform) 独大[2],10X Visium是通过芯片来捕获基因表达的位置信息的,在芯片的的捕获区域内,进行HE染色和成像,对组织切片进行透化处理,释放细胞内的mRNA,mRNA被芯片上带有oligo-dT的探针捕获,在进行cDNA合成,构建文库进行测序,由于每个探针都带有特异的barcode来代表位置信息,从而能够获得基因表达的位置信息。


Visium原理

参考

[1] https://support.10xgenomics.com/spatial-gene-expression/software/pipelines/latest/algorithms/overview#10x-barcode.
[2] Multimodal Analysis of Composition and Spatial Architecture in Human Squamous Cell Carcinoma

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,192评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,858评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,517评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,148评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,162评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,905评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,537评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,439评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,956评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,083评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,218评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,899评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,565评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,093评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,201评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,539评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,215评论 2 358

推荐阅读更多精彩内容