xCellx详细使用方法及结果分析

理论知识:

组织是由不同谱系和亚型的细胞类型组成的复杂环境,每种细胞都有自己独特的转录组。因此,批量转录组分析是细胞类型特异性基因表达的总和加权的细胞类型比例在给定的样本。去卷积的基因表达谱允许重建组织的细胞组成。Xcell 是一个强大的计算方法,转换基因表达谱为丰富分数的64免疫和基质细胞类型跨样本。
不同受试者细胞类型组成的差异可以确定疾病的细胞靶点,并提出新的治疗策略。此外,调整这些变异可以检测真正的基因表达差异,并提高解释下游分析。

1.安装xCell

Xcell 是在 r 中开发的,用于运行 xcell 的 r 包可以作为 github 存储库中的开源代码使用 (https://github.com/dviraran/xCell)
安装 r 是一个先决条件(https://www.r-project.org/) ,rstudio 是运行 r 脚本的推荐环境(https://www.rstudio.com/)。
要安装 xcell r 包,下面的所有命令都应该在 r 环境中输入:
如果 devtools 包以前没有安装,首先安装它:

install.packages('devtools')

从 github 安装当前的 xcell 版本:

devtools::install_github('dviraran/xCell')

Xcell 包装依赖于以下包装: 生物导体包装ーGSVA,GSEABase。

if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install(c("GSVA","GSEABase"), version = "3.8")

CRAN packages—pracma, utils, stats, MASS, digest, curl,
quadprog.

install.packages('pracma', 'utils', ' stats', 'MASS',
'digest', 'curl', 'quadprog')

以上为xCell说明文档的安装说明,以下为网络上的方法(用以下即可)。

install.packages('Rcpp')                     #########安装各类程序包
devtools::install_github('dviraran/xCell')
library(xCell)

2.输入文件

文件格式:Xcell 的输入是来自人类混合样本的基因表达矩阵。应该在运行 xcell 函数之前读取它。矩阵应该是基因作为行名,列是样本。如果基因表达式是一个标签分隔的文件,可以使用下面的调用来读取它:

expr = read.table(file.name, header=TRUE, row.names=1, as.is=TRUE, sep='\t')

如果基因表达数据来自微阵列,就不需要标准化。如果基因表达数据来自一个测序平台,数值必须被归一化为基因长度(例如,rpkm,tpm,fpkm)。Xcell 使用表达式级别排序,而不使用实际值,因此进一步的规范化不会产生影响。

3.xCell Pipeline

Xcell 管道由三个步骤组成,它们在 r 包中也表示为函数:

1. rawEnrichmentAnalysis
xCell.data$genes

作为最低要求,输入基因表达矩阵至少需要5000个基因,但共用基因数目太少可能会影响结果的准确性。
Xcell 为每种单元格类型使用多个签名。总共有489个特征符合64种细胞类型。完整的签名列表可在以下网址找到:

xCell.data$signatures

得分计算使用单样本基因集富集分析(ssGSVA)。对于每个单元格类型,计算来自多个相应签名的多个得分的平均值。最后,平均分数被移动,使得每个单元格类型的最小分数为零。

scores = rawEnrichmentAnalysis(expr, signatures,
genes, file.name, parallel.sz, parallel.type = "SOCK")
2. transformScores

这个函数用于将得分从原始浓缩得分转换为类似百分比的线性尺度,xcell 使用预先计算的校准参数进行转换。Xcell 使用不同的参数设置基于序列的基因表达值和基于微阵列的值(有关调整校准参数的信息,请参阅注3)。基于序列的值的参数可以在下面找到:

xCell.data$spill$fv

对于基于微阵列的数据:

xCell.data$spill.array$fv

函数的用法如下:

tscores = transformScores(scores, fit.vals, scale, fn)

‘scores’是 rawenrichmentanalysis 的输出; ‘ fit.vals’是上面描述的校准参数; 如果符合逻辑,则是否按比例缩放转换后的分数(默认值为 true 并推荐使用)。

3. spillOver
spillOver(transformedScores, K, alpha = 0.5, file.name = NULL)

usage

xCellAnalysis(expr, signatures = NULL, genes = NULL, spill= NULL, rnaseq = TRUE, file.name = NULL, scale = TRUE, alpha =0.5, save.raw = FALSE, parallel.sz = 4, parallel.type = "SOCK",cell.types.use =NULL)

可简化为

exprMatrix = read.table("expr",header=TRUE,row.names=1, as.is=TRUE)

4.实例

1)输入样本

https://github.com/dviraran/xCell/tree/master/vignettes

sdy = readRDS('sdy420.rds')

sdy有两种数据,一种是表达谱,另一种是细胞分数。


sdy数据.png

expr.png

fcs.png
raw.scores = rawEnrichmentAnalysis(as.matrix(sdy$expr),
  xCell.data$signatures,
  xCell.data$genes) #首先生成原始分数

下一步是转换原始分数,并应用溢出补偿。为了获得最佳的结果,最好只对相关的细胞类型进行溢出补偿(例如,如果我们知道混合物中没有巨噬细胞,最好将它们从分析中去除)。因此,我们将分数矩阵子集为仅在CyTOF数据集中也被测量的单元格类型:

cell.types.use = intersect(colnames(xCell.data$spill$K),
                           rownames(sdy$fcs))

最后一步是补偿溢出效果的分数:

scores = spillOver(transformed.scores,xCell.data$spill.array$K)

请注意,我们在这里使用xCell.data$spill.array数据,因为表达式数据是用微阵列生成的。上面详细介绍的管道也可以使用xCell分析包装器功能同样执行:

scores = xCellAnalysis(sdy$expr, rnaseq=F,cell.types.use = cell.types.use)

使用这些分数,我们现在可以找到细胞分数和细胞类型分数之间的相关性:

library(psych)
library(ggplot2)
fcs = sdy$fcs[rownames(scores),colnames(scores)]
res = corr.test(t(scores),t(fcs),adjust='none')
qplot(x=rownames(res$r),y=diag(res$r),
     fill=diag(res$p)<0.05,geom='col',
     main = 'SDY420 asspciation with immunoprofiling',
     ylab = 'Pearson R')+labs(fill="p-value<0.05")+
     theme_classic()+
     theme(axis.text.x = element_text(angle = 45,hjust = 1))

该代码生成一个条形图(图1a),用于显示xCell分数与免疫分析的预期分数的相关性。我们发现18种细胞类型中的13种存在显著相关性(p值<0.05),7种细胞类型中存在高相关性(R>0.5)。需要注意的是,xCell产生的是富集分数,而不是细胞类型的比例,因此不期望分数会与CyTOF比例相似,只是测量值之间将存在线性相关。


图1a

在上面的分析中,我们使用一个细胞子集运行了xCell,而不是所有64种细胞类型。在某些情况下,这可能会提高准确性,因为溢出补偿程序可能会进行过度补偿。因此,我们可以对所有细胞类型进行相同的分析,并与免疫图谱分析进行关联:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容