RNA-seq 详细教程:似然比检验(13)

学习内容

  1. 应用似然比检验 (LRT) 进行假设检验
  2. 将 LRT 生成的结果与使用 Wald 检验获得的结果进行比较
  3. 从 LRT 显著基因列表中识别共享表达谱

似然比检验

在评估超过两个水平的表达变化时,DESeq2 还提供似然比检验作为替代方法。被确定为重要的基因是那些在不同因子水平上在任何方向上表达发生变化的基因。

通常,此测试将产生比单独的成对比较更多的基因。虽然 LRT 是对因子的任何水平差异的显着性检验,但不应期望它与使用 Wald 检验的基因集的并集完全相等(尽管我们确实期望高度重叠) 。

result

要从我们的 dds_lrt 对象中提取结果,我们可以使用与 Wald 检验相同的 results() 函数。不需要对比,因为我们没有进行成对比较。

# Extract results for LRT
res_LRT <- results(dds_lrt)

让我们看一下结果表:

# View results for LRT
res_LRT  
res_LRT

输出看起来类似于 Wald 检验的结果,具有与我们之前观察到的相同的列。

  • 为什么要报告 LRT 检验的倍数变化?

对于使用似然比检验的分析,p 值仅由完整模型公式和简化模型公式之间的偏差差异决定。单个 log2 倍变化打印在结果表中以与其他结果表输出保持一致,但与实际测试无关。

与 LRT 检验相关的:

  • baseMean:所有样本的归一化计数的平均值
  • stat:简化模型和完整模型之间的偏差差异
  • pvalue:将统计值与卡方分布进行比较以生成 pvalue
  • padj:BH 调整后的 p 值

附加列:

  • log2FoldChange:log2 倍变化
  • lfcSE:标准错误

识别重要基因

当从 LRT 中过滤重要基因时,我们仅对 padj 列设置阈值。 padj < 0.05 时有多少基因是显著的?

# Create a tibble for LRT results
res_LRT_tb <- res_LRT %>%
  data.frame() %>%
  rownames_to_column(var="gene") %>% 
  as_tibble()

# Subset to return genes with padj < 0.05
sigLRT_genes <- res_LRT_tb %>% 
  filter(padj < padj.cutoff)

# Get number of significant genes
nrow(sigLRT_genes)

# Compare to numbers we had from Wald test
nrow(sigOE)
nrow(sigKD)

从 LRT 观察到的重要基因数量相当多。该列表包括可以在三个因子水平(控制、KO、过表达)中以任何方向变化的基因。为了减少重要基因的数量,我们可以增加 FDR 阈值 (padj.cutoff) 的严格性。

  • 识别具有共享表达谱的基因簇

我们现在有了这份约 7K 重要基因的列表,我们知道这些基因在三个不同的样本组中以某种方式发生了变化。我们接下来做什么?

下一步是识别在样本组(水平)之间共享表达变化模式的基因组。为此,我们将使用来自“DEGreport”包的名为 degPatterns 的聚类工具。 degPatterns 工具使用基于基因间成对相关性的层次聚类方法,然后切割层次树以生成具有相似表达谱的基因组。该工具以优化集群多样性的方式切割树,使得集群间的可变性 > 集群内的可变性。

在我们开始聚类之前,我们将首先对我们的 rlog 转换归一化计数进行子集化,以仅保留差异表达的基因 (padj < 0.05)。在我们的例子中,对 7K 基因运行聚类可能需要一些时间,因此出于类演示目的,我们将子集化以仅保留按 p 调整值排序的前 1000 个基因。

# Subset results for faster cluster finding (for classroom demo purposes)
clustering_sig_genes <- sigLRT_genes %>%
  arrange(padj) %>%
  head(n=1000)


# Obtain rlog values for those significant genes
cluster_rlog <- rld_mat[clustering_sig_genes$gene, ]

重要基因的 rlog 转换计数与一些附加参数一起输入到 degPatterns

  • metadata:样本对应的元数据dataframe
  • time:元数据中的字符列名称,将用作更改的变量
  • col:元数据中的字符列名,用于分隔样本
# Use the `degPatterns` function from the 'DEGreport' package to show gene clusters across sample groups
clusters <- degPatterns(cluster_rlog, metadata = meta, time = "sampletype", col=NULL)

聚类运行完成后,您将在控制台中返回命令提示符,您应该会在绘图窗口中看到一个图形。这些基因被分为四个不同的组。对于每组基因,我们都有一个箱线图来说明不同样本组之间的表达变化。叠加了一个折线图来说明表达变化的趋势。

假设我们对在样本中表现出表达减少和过表达增加的基因感兴趣。根据该图,共有 275 个基因共享此表达谱。为了找出这些基因是什么,让我们探索一下输出。聚类输出的数据结构是什么类型?

# What type of data structure is the `clusters` output?
class(clusters)

我们可以使用名称(簇)查看列表中存储了哪些对象。里面存储了一个数据框。这是主要结果,让我们看一下。第一列包含基因,第二列包含它们所属的簇编号。

# Let's see what is stored in the `df` component
head(clusters$df)

由于我们对第 1 组感兴趣,我们可以过滤数据框以仅保留那些基因:

# Extract the Group 1 genes
group1 <- clusters$df %>%
          filter(cluster == 1)

提取一组基因后,我们可以使用注释包来获取额外的信息。我们还可以使用这些基因列表作为下游功能分析工具的输入,以获得更多的生物学见解,并查看基因组是否共享特定功能。


欢迎Star -> 学习目录

更多教程 -> 学习目录


本文由mdnice多平台发布

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,427评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,551评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,747评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,939评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,955评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,737评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,448评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,352评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,834评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,992评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,133评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,815评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,477评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,022评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,147评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,398评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,077评论 2 355

推荐阅读更多精彩内容