第02周-用米氏方程解决单细胞转录组dropout现象

用米氏方程解决单细胞转录组dropout现象

米氏方程(Michaelis-Menten equation): v=Vmax × [S] /(Km+[S])

在假定存在一个稳态反应条件下推导出来的,其中 Km 值称为米氏常数,Vmax是酶被底物饱和时的反应速度,[S]为底物浓度。

Km值的物理意义为反应速度(v)达到1/2Vmax时的底物浓度(即Km=[S]),单位一般为mol/L,只由酶的性质决定,而与酶的浓度无关。可用Km的值鉴别不同的酶。

今天要介绍的这篇文章提出了一个算法,R包是:M3Drop , 文章是:Modelling dropouts for feature selection in scRNASeq experiments

挑选重要基因

目前已有的寻找单细胞转录组测序数据中的重要基因(feature selection)的方法都不够好,比如 scLVM 主要是根据先验基因集,比如cell-cycle or apoptosis来区分细胞。与此相反,基于 highly variable genes (HVG) 的方法挑选到的变化量大的那些基因很可能是技术带来的误差。而且低表达量基因的变动往往大于高表达量基因,而且所谓的表达变化大也并没有很好的生物学解释。
一个比较好理解的概念是差异基因,但是需要预先把细胞群体分组后进行比较才能得到,而很多时候细胞太相似了,没办法很好的分开。像PCA或者t-SNE这样的降维方法也可以用来挑选重要基因,但它们也受制于系统误差或者批次误差等等。
dropout是scRNASeq数据的一大特点,就是很多基因在某些细胞根本就不表达,但是在另外的细胞却高表达。这篇文章作者对全长转录本数据和基于UMI的表达量数据分别提出了对应的解决方案,Michaelis-Menten equation 和 depth adjusted negative binomial (DANB)

单细胞转录组数据里面的dropouts可以达到50%,但是通常认为这个dropouts是因为在文库构建的过程中,有部分基因没有被成功的反转录,是一个酶促反应。
所以作者用Michaelis-Menten 来建模。

比较了9种 feature selection 方法,

使用它们分别对基因排序,算法如下:

  • by the magnitude of their loadings in principal component analysis (PCA)
  • by the strength of their most negative gene-gene correlation (Cor)
  • by their relative Gini index (Gini)
  • M3Drop dropouts-mean expression curve (M3Drop)
  • the squared coefficient of variation (CV2)
  • mean expression relationship (HVG)
  • the dispersion-mean expression relationship fit by DANB (NBDisp)
  • the dropouts-mean expression relationship fit by DANB (NBDrop).

这些算法都不需要预先对样本进行分类,是无监督的算法。

  • differentially variable (DV)genes
  • highly variable (HV) genes
  • differentially expressed (DE) genes

单细胞转录组数据的batch effects比较严重,所以 feature selection 过程的一个主要目的就是降低技术误差的影响,集中在有生物学意义的差异上面。

公共数据集

作者比较了 5个公共数据集,都是小鼠的胚胎细胞,含有17~255个细胞的测序数据,包括zygote to blastocyst.

  • Tung et al. (2017) [12] considered iPSCs from three different individuals and performed three replicates of UMI-tagged scRNASeq and three replicates of bulk RNASeq for each. (GSE77288 ).

  • For Kolodziejczyk et al. (2015),we considered ESCs grown under two conditions: alternative 2i and serum for which there were three replicates of scRNASeq and two replicates of bulk RNASeq.( E-MTAB-2600 )
    对bulk转录组数据用了3种方法找差异基因,分别是 DESeq2,edgeR,limma-voom

    只有3种方法都是 5% FDR的差异基因才认为是阳性标准基因集,那些3种方法都在 20% FDR的非差异基因认为是阴性金标准。

  • 1,915 positives, and 8,398 negatives for the iPSCs

  • 709 positives and 11,278 negatives for the ESCs
    有了这些基因,就可以计算ROC

都细胞转录组数据文章一般分成下面两大类:

第一大类是:deep sequencing of full-transcripts for a relatively small number of cells
代表性的文章如下:

  • Accounting for technical noise in single­cell RNA­seq experiments. Nat. Methods 10,​ 1093–1095 (2013).
  • Fast, scalable and accurate differential expression analysis for single cells. (2016). doi:10.1101/049734
  • Single­cell RNA­seq reveals dynamic, random monoallelic gene expression in mammalian cells. Science 343,​ 193–196 (2014). 14. Brennecke, P. et al. Accounting for technical noise in single­cell RNA­seq experiments. Nat. Methods 10,​ 1093–1095 (2013).
  • Dynamics of Global Gene Expression Changes during Mouse Preimplantation Development. Dev. Cell 6, 117–131 (2004).
  • Roles of CDX2 and EOMES in human induced trophoblast progenitor cells. Biochem. Biophys. Res. Commun. 431, 197–202 (2013).

第二类是:high-cell number, low-depth sequencing of 3’ or 5’ ends of transcripts tagged with unique molecular identifiers
代表性的文章是:

  • Quantification noise in single cell experiments. Nucleic Acids Res. 39,​ e124 (2011).
  • Quantification of mRNA in single cells and modelling of RT­qPCR induced noise. BMC Mol. Biol. 9,​ 63 (2008).
  • ZIFA: Dimensionality reduction for zero­inflated single­cell gene expression analysis. Genome Biol. 16,​ 241 (2015).
  • DNA methylation dynamics during epigenetic reprogramming in the germline and preimplantation embryos. Genes Dev. 28, 812–828 (2014).
  • Genetic programs in human and mouse early embryos revealed by single­cell RNA sequencing. Nature 500,​ 593–597 (2013).

(文章转自jimmy的2018年阅读文献笔记)

生信基础知识大全系列:生信基础知识100讲
史上最强的生信自学环境准备课来啦!! 7次改版,11节课程,14K的讲稿,30个夜晚打磨,100页PPT的课程。
如果需要组装自己的服务器;代办生物信息学服务器
如果需要帮忙下载海外数据(GEO/TCGA/GTEx等等),点我?
如果需要线下辅导及培训,看招学徒
如果需要个人电脑:个人计算机推荐
如果需要置办生物信息学书籍,看:生信人必备书单
如果需要实习岗位:实习职位发布
如果需要售后:点我
如果需要入门资料大全:点我

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi阅读 7,322评论 0 10
  • 最近读了一个文章,并做了一个汇报在学校的Journal club,如下: 【原文:http://www.cell....
    Ternq8阅读 4,252评论 0 1
  • 第三期方糖也圆满结束~~ 其实在我带领的前两天,包括带领当天,我的状态很差,原本想让其他读书伙...
    余乐_ef08阅读 176评论 0 1
  • 爷爷奶奶年纪大了,爷爷痛风老毛病,耳朵不太好;奶奶眼睛看不清了,甚至下不了厨。前半辈子从没摸过锅铲的爷爷开始准备一...
    婧婧婧婧婧酱阅读 338评论 1 2
  • 今天记忆最深的一句话就是:“如果,你去到某一个地方旅游,没有停下来慢慢的把这个城市的每个巷子都走一遍,那么你就不算...
    江梦南阅读 392评论 0 1