CORNAS:一种快速简单鉴定无重复转录组差异基因的方法

还记得上次文章的最后提到CORNAS这种方法吗?最近刚好在Github上看到了这个项目,就花了点时间看了下文档感觉操作也比较简单,这里记录一下使用过程,大家共同学习一下。

介绍

该软件17年发表在BMC上,是一种快速贝叶斯方法,它可以根据样品的覆盖参数来估计真实基因计数的后验分布,从而提高计算差异表达基因的准确性,更多的原理大家可以去看文章或者中文解读

image

下载

使用软件之前,我们最好先看下该软件Github中的Readme文件,看一下我们需要下载哪些东西并且怎么使用。下图第一段中内容可以得知CORNAS是用R语言写用来快速计算无重复转录组数据差异基因,我们可以直接命令行模式中运行R脚本,也可以在R语言编辑器(常用Rstudio)里运行,这个包包含了俩个主要文件:CORNAS.Rcornas.config。软件测试基于R版本3.0,运行基因列表数据也是基于mapping的原始数据,无需标准化。这里我们先将这个文件压缩包下载下来。

image-20200929205449914

使用方法

  1. 方法一 (Shell中运行):

     Rscript CORNAS.R <config> <datatable>
    
  2. 方法二(Rstudio中运行)

     source("/path/to/CORNAS.R")
     cornas("/path/to/config" , "/path/to/datatable")
    

根据方法二我们可以看出CORNAS软件其实是作者写的由一些函数构成的R脚本,并非是个R包,我们就先加载CONRNAS.R脚本中的函数,然后通过其中的cornas函数运行即可,核心参数为俩个文件:config配置文件和datatable数据文件。所以我们只要按照规定的文件格式将自己的文件整理一致就可以轻松使用了,还是蛮简单的。

CORNAS.R

图片.png

贴心的是作者在文档的example_run目录里准备了这俩个示例文件,我们在使用前可以先运行一下了解运行过程,之后再替换文件内容即可。 OK,我们先分别看下这几个文件的内容格式,然后运行一遍。

图片.png
  1. datatable数据文件

    文件有四列信息,第一列可以是基因/转录本的ID,第二列为对应的长度信息,第三列和第四列分别为没有重复的俩样本。注意文件不能包含标题行,而且第二列的长度信息可以不需要,文件分隔以Tab形式分隔。


    图片.png
  2. contig配置文件

    这个软件比较特别的地方就在于此,也是它的核心部分,我们需要简单配置一个文件,运行自己的数据时候只需要改动我圈出的部分即可,上面对应的数字代表所在的列数,而下面的每个样品的覆盖度

    关于覆盖度的概念,作者提到(The sequencing coverage is the number of total reads (observed counts) divided by the actual amount of fragments present in the PCR mix),意思即为样品存在的实际片段数量除以观察到的总数值,这里他提供了俩种选择:1. 如果你提前已经计算了样品A和B的覆盖度值,那就直接填写在配置文件中 ; 2. 如果没有这俩个样品的覆盖度也OK,这里程序会根据你datatable文件中每个样品的总reads量计算这个覆盖度的值。

除此之外,作者另外还有俩个可选的参数,我们可以增添到配置文件下方 (其实建议默认就好):

Alpha:如果你想改变alpha值从默认的99%。降低该参数的值可以增加鉴定差异表达基因的灵敏度,数量会变多。

Fold change:差异倍数,默认是1.5,降低该值也可以增加差异表达基因的数量。

image

运行

方式一

Linux中以命令行的模式运行

Rscript CORNAS.R cornas.config.test4 test4_kidneyliver_example.tab >cornas_test4_example2.out

方式二

Rstudio中运行

source("/path/to/CORNAS.R")
cornasExample1 <- cornas("cornas.config.test4" , "test4_kidneyliver_example.tab")

以上俩种方法根据个人运行环境自由选择,代码都很简单一行搞定,运行速度也非常快大概10几秒就可以了,我们现在直接看下结果文件都包含了哪些东东,也就是对应示例文件中的cornas_test4_example2.out文件。

image-20200929220429044

结果文件就是上图一排**************号下面的内容,上面内容就是你当时设置的参数及一些重要的值,我们重点看下面这些,从左到右有十列内容,重点其实为前4列的内容。

  1. Gene_Name = 输入文件的基因/转录本ID
  2. DEG_call = 通过设置阈值鉴定该基因是否为差异基因: 是 (Y) or 否 (N).
  3. Express_higher = 如果 DEG_call == Y, 显示哪个样品的表达量最高 (A or B), 否则为 "-".
  4. Fold_difference = 高表达的样品与另一样品之间的差异倍数fold difference/change.、
  5. A_O-count = 输入文件中样品A的表达量
  6. B_O-count = 输入文件中样品B的表达量
  7. A_T-lower = 样本A中真实计数后验分布的下界。
  8. A_T-upper = 样本A中真实计数后验分布的上界。
  9. B_T-lower = 样本B中真实计数后验分布的下界.
  10. B_T-upper = 样本B中真实计数后验分布的上界。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352