Scanorama ---整合单细胞的大数据

2018-07-19每日文献:Panoramic stitching of heterogeneous single-cell transcriptomic data

Abstract

作者提出了一种工具,Scanorama ,利用了全景拼接的算法,将来源于不同技术的单细胞的datasets进行整合。
使用的数据集:105476 cells from 26 scRNA-seq experiments across 9 different technonlogies to make a single comprehensive reference.

Data and code availability

http://cb.csail.mit.edu/cb/scanorama/
https://github.com/brianhie/scanorama

Main text

文中提到:
Seurat CCA 和 MNN 假设两个数据集之间至少有一种相同的cell type, 或者基因表达谱具有相同的相关结构(??),因此限制了使用。

Scanorama 跟图像拼接类似,也是根据两个数据集overlap的区域来进行batch-correction 和intergration。 优势:能够保留数据 specific population,也不需要所有的dataset share相同的cell type。信息的丢失??

利用mutual nearest neighbors matching ,主要能够寻找两个数据集的相似部分,而不是整个大数据中的相似部分。MNN ,针对多于两个datasets的比对,先选择一个作为reference,之后将其他的datasets和这个datasets做integrate,所以整合的效果很看重数据的顺序

Scanorama 的两个关键性步骤:1.使用SVD(singular value decomposition) 将高维的数据降维。2.基于超敏感局部敏感散列和随机投影树来构建近邻法,节约时间。

接下来,使用模拟和真实的数据集进行模拟,真实的数据集包括:293T cell and Jurkat cells,HSC data,pancreas data,105476 cells dataset.

文章重点强调:1.相同的细胞类型能merge在一起,2.保留数据集独特的细胞。3.根据alignment genes来监控两个数据的比对。4.运行速度快。十万细胞只需要25分钟(10核,384GB RAM)。

20180720-1.png

疑问:

1.可以尝试使用它来做整个物种数据的大图,数据的整合可以用,但是对于其normalization的方法以及是否能够找markers存在疑问。
2.好奇它与MNN 之间的差异,都是使用mutual nearest neighbor,区别到底在哪里??

需要尝试使用

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351

推荐阅读更多精彩内容

  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 11,094评论 1 32
  • *面试心声:其实这些题本人都没怎么背,但是在上海 两周半 面了大约10家 收到差不多3个offer,总结起来就是把...
    Dove_iOS阅读 27,136评论 30 470
  • 【反应第二】(2.2) 人言者,动也;已默者,静也。因其言,听其辞。言有不合者,反而求之,其应必出。言有象,事有比...
    猎人2016阅读 537评论 0 0
  • 这是智先生的第23篇原创文章 01 在腥风血雨的江湖上,传销组织被分为南派和北派。 北派崇尚暴力,以监禁为主,并切...
    智_先生阅读 26,062评论 30 71