八行代码搞定内参基因筛选-R版本的NormFinder

写在前面

硕士毕业做的大豆内参基因的筛选,当时用了geNorm, NormFinder和BestKeeper三个软件,geNorm 不需要多说,Vandesompele教授的奇作,自2002年发表至今被引用14000多次

geNorm被引用信息

而后商业化被整合到qBase+,需要大概220欧... 当然网上自然有crack的版本,大家各显神通把,BestKeeper则没有什么大变化,还是一个基于excel2003 VBA开发的一个算法,也木有更新,想对于geNorm和NormFinder来说算法简单,只是对Raw Ct value做了pairwise correlation,所以参考的意义其实不大,对于候选内参较少的情况(<10个)可以进行粗筛。NormFinder就显得良心多了,由于NormFinder考虑了inter-和intra-group的因素,所以在样品多分组的qPCR assay中NormFinder的评测结果可能要比其他软件好,在office版本更迭后在2015年推出了基于R的算法,甚至没有打包成package,使用方法也比较简单,下面就介绍一下如何实现两行代码搞定内参筛选。

准备

  • 首先下载这个文件r.NormOldStab5.txt,这个文件就是R版本的NormFinder了。详细参考NormFinder官方网站,当然CL Andersen 的大作从04年至今也有了4225的引用量。NormFinder文章
  • 然后在你的电脑中新建一个文件夹,命名为NormFinder,然后将下载的r.NormOldStab5.txt粘贴进来。
  • 对于完全不知道怎么用R的建议用Rstudio具体安装方法:R和Rstudio安装方法, 打开Rstudio,点击左上角的绿色小加号新建一个R script,绿色框是R script,就是以后写代码的地方,下面的叫console(控制台)一会软件计算的结果会在console中展示。
    image.png
  • 然后点击菜单栏上的session→set Working Directory→Choose Directory然后选择你刚才新建的NormFinder的文件夹。然后在R script 下方的 R console中会显示下面代码
>setwd("~/software/NormFinder")

说明你的工作目录已经转换到了你刚才新建的NormFinder“文件夹”下,
然后在上面R script输入

source("r.NormOldStab5.txt")

然后点 R script面板上右上角绿色的小箭头,会提示run current line or selection。

  • source以后 NormFinder这个命令就可以使用了,然后就是输入数据。数据输入格式如下:
    输入数据格式

纵向的rowname是candidate reference gene, 第一列的colname是样品的名称,最后是分组,比如case 和 control.中间是Raw Ct值,当然也可以根据老版本的说明做2 -delta Ct的归一化处理。当然这里的不同就意味着后面在查看结果时使用的代码也不同。这个数据是我通过excel函数 =RANDBETWEEN(13,30)随机生成的模拟Ct值。将自己的数据整理成这种格式后用excel保存,注意保存的时候将格式改为制表符分隔符的文本文档.txt格式,而不是UTF-16 Unicode的文本文档格式,这里我和manual中一致改成的Datafile.txt。然后同样保存到刚才新建的NormFinder文件夹下。然后输入:

Result=Normfinder("Datafile.txt")
##如果你输入数据格式是未分组的格式输入下面代码,如果不是就不要运行。
Result1=Normfinder('Datafile.txt', Groups = FALSE)
##如果你输入的格式不是ct值,而是和geNorm一样用2 -delta ct标准化过的数值的话用下面
Result1=Normfinder('Datafile.txt', ctVal = FALSE)
## 如果既不分组,也不用ct的话,从上面可以推测出来
Result1=Normfinder('Datafile.txt' Groups = FALSE, ctVal = FALSE)

运行完你会在右边environment的Data中发现多了一个Result,而这个result是一个list,这个list下面就保存了所有的结果信息,主要包括了Ordered, UnOrdered, PairOfGenes三个结果,也就是按照stability 排序后,未排序的筛选结果,以及最稳定的内参基因组合的结果。

文件的保存

思路就是将list中的结果分别命名然后再write.csv。 代码如下

Ordered_result = Result$Ordered
UnOrdered_result = Result$UnOrdered
PairOfGenes_result = Result$PairOfGenes
write.csv(Ordered_result,file = "Orderd.csv")
write.csv(UnOrdered_result, file = "UnOrdered.csv")
write.csv(PairOfGenes_result, file = "PairOfGene.csv")

一顿操作过后你会发现在你新建的NormFinder文件夹中出现了如下结果文件:

结果输出

对于结果的解读就不介绍了,文献多如牛毛,自己把握。最后附上R版本NormFinder的manual,基本就是简单翻译了一下,做一个杜师兄当年提倡的脑残版protocol

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容

  • .bat脚本基本命令语法 目录 批处理的常见命令(未列举的命令还比较多,请查阅帮助信息) 1、REM 和 :: 2...
    庆庆庆庆庆阅读 8,006评论 1 19
  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,688评论 0 10
  • 第一章 1.Linux是一套免费使用和自由传播的类UNIX操作系统,它可以基于Intel x86系列处理器以及Cy...
    yansicing阅读 5,288评论 0 9
  • 在假期中充电学习,我希望破茧成蝶。 彩虹花的力量,各位老师的分享使我受益匪浅。 阅读是光。光可以净化孩子的心灵,拓...
    张振云唐山市安各庄小学阅读 276评论 0 0
  • Java 多态 多态就是同一个接口,使用不同的实例而执行不同操作,如图所示: 多态性是对象多种表现形式的体现。 多...
    赵哥窟阅读 584评论 0 0