重生之我在剑桥大学学习单细胞RNA-seq分析——8. scRNA-seq数据整合(1)

8.1 简介
随着可用的scRNA-seq数据集越来越多,在它们之间进行合并比较是关键。比较scRNA-seq数据集有两种主要方法。第一种方法是“以标签为中心”,其重点是通过比较单个细胞或细胞群来识别数据集中的等效细胞类型/状态。另一种方法是“跨数据集标准化”,它试图通过计算消除实验特定的技术/生物效应,以便可以合并分析来自多个实验的数据。
以标签为中心的方法可以用于具有高置信度细胞注释的数据集,例如人类细胞图谱(HCA)或Tabula Muris,将新样本中的细胞或cluster映射到此参考上,以考虑组织成分和/或识别具有新/未知身份的细胞。从概念上讲,这种映射类似于流行的BLAST方法,该方法可以快速在数据库中找到与新识别的核苷酸或氨基酸序列最接近的匹配。以标签为中心的方法还可用于比较不同实验室收集的类似生物来源的数据集,以确保注释和分析的一致性。

以标签为中心的数据集比较可用于比较两个不同样本的注释。
以标签为中心的数据集比较可以将新实验中的细胞映射到带注释的参考上。

跨数据集标准化方法也可用于比较类似生物来源的数据集。与以标签为中心的方法不同,它可以对多个数据集进行联合分析,以便识别在每个单独的数据集中采样过于稀疏而无法可靠检测到的稀有细胞类型。然而,跨数据集标准化不适用于非常大且多样化的参考,因为它假设每个数据集中的很大一部分生物变异与其他数据集重叠。

跨数据集标准化支持2+ scRNA-seq数据集的联合分析。

8.2 基于MNN的方法
mnnCorrect校正数据集以便于联合分析。为了解释两次重复或两个不同实验之间的组成差异,它首先在实验中比对单个细胞以找到重叠的生物结构。利用这种重叠,可以了解哪些维度的表达对应于生物状态,哪些维度对应于批次/实验效果。mnnCorrect假设这些维度在高维表达空间中彼此正交。最后,它从整个表达矩阵中删除批次/实验效应以返回校正后的矩阵。
为了在数据集之间将单个细胞彼此比对,mnnCorrect使用余弦距离来消除文库大小的影响,然后识别数据集之间的相互最近邻(k决定邻域大小)。只有重叠的生物群体才应该有相互最近邻(见下图b)。这假设k设置为大约数据集中最小生物群的大小,但是,如果k太小,则会识别出过少的相互最近邻对,从而无法很好地估计我们想要消除的批次效应。
评估生物/技术效应是通过奇异值分解(SVD)来完成的,类似于我们在批次校正部分遇到的RUV,或者使用优化的irlba包进行主成分分析,应该快于SVD。svd.dim指定应保留多少个维度来概括数据的生物结构,我们将其设置为3个,因为我们上面使用Metaneighbor发现了3个主要群体。这些估计值可以通过平滑(sigma)和/或方差调整(var.adj)进一步调整。

相互最近邻(MNN)整合方法的原理

8.3 典型相关分析(CAA)(Seurat v3)
Seurat包含另一种用于整合多个数据集的方法,称为典型相关分析(CCA)。然而,与mnnCorrect不同,它并不直接校正表达矩阵本身。相反,Seurat会为每个数据集找到一个较低维数的子空间,然后校正这些子空间。与mnnCorrect不同的是,Seurat每次只整合一对数据集。
Seurat利用基因-基因相关性通过一种称为典型相关分析(CCA)的方法识别数据集中的生物结构。Seurat学习基因与基因之间关联的共享结构,然后评估每个细胞与该结构的契合程度。共享结构不能很好地描述的细胞被认为是数据集特定的细胞类型/状态,在对齐两个数据集之前将其丢弃。最后,使用“扭曲”算法将两个数据集对齐,该算法以一种对种群密度差异具有鲁棒性的方式对每个数据集的降维表示进行标准化。

往期内容:
重生之我在剑桥大学学习单细胞RNA-seq分析——7. 使用Seurat进行单细胞RNA测序分析(1)
重生之我在剑桥大学学习单细胞RNA-seq分析——7. 使用Seurat进行单细胞RNA测序分析(2)
重生之我在剑桥大学学习单细胞RNA-seq分析——7. 使用Seurat进行单细胞RNA测序分析(3)
重生之我在剑桥大学学习单细胞RNA-seq分析——7. 使用Seurat进行单细胞RNA测序分析(4)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,125评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,293评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,054评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,077评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,096评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,062评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,988评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,817评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,266评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,486评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,646评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,375评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,974评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,621评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,642评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,538评论 2 352

推荐阅读更多精彩内容