dplyr函数简介
dplyr是R中专门用于数据处理的包,非常高效,且容易上手,其六大具体功能包括:
select() ——从数据中选择列
filter() ——数据行的子集
group_by() ——汇总数据
summarise() ——汇总数据(计算汇总统计信息)
arrange() ——排序数据
mutate() ——创建新变量
mutate函数用法:
mutate(.data, ...)
## S3 method for class 'data.frame'
mutate(
.data,
...,
.by = NULL,
.keep = c("all", "used", "unused", "none"),
.before = NULL,
.after = NULL
)
注意:
这个函数只能用于数据框,不能在列表,矩阵,向量或其他数据结构中使用。
使用时,通常你只需要指定3项内容:
- 您要修改的数据框的名称
- 您将创建的新变量的名称
- 您将分配给新变量的值
还是给大家举个例子:看下图,mutate()的第一个参数就是数据框,然后就是新变量名=旧变量的某种新式。就是说你可以轻松地以数据框中的原有变量生成新变量。
举例:在差异分析结果列表de_result中加入一列direction ,标注出基因表达上下调情况及是否具有显著性
DEgene <- mutate(DEgene, direction = if_else(P.Value >= 0.05 | abs(log2FoldChange) <= 1, 'NS',
if_else(log2FoldChange > 1, 'UP', 'DOWN')))
本文参考:Codewar:R数据分析:如何在R中使用mutate