dplyr包用于数据清洗相关函数介绍一:mutate函数的使用

dplyr函数简介

dplyr是R中专门用于数据处理的包,非常高效,且容易上手,其六大具体功能包括:
select() ——从数据中选择列
filter() ——数据行的子集
group_by() ——汇总数据
summarise() ——汇总数据(计算汇总统计信息)
arrange() ——排序数据
mutate() ——创建新变量

mutate函数用法:

mutate(.data, ...)

## S3 method for class 'data.frame'
mutate(
  .data,
  ...,
  .by = NULL,
  .keep = c("all", "used", "unused", "none"),
  .before = NULL,
  .after = NULL
)

注意:

这个函数只能用于数据框,不能在列表,矩阵,向量或其他数据结构中使用。

使用时,通常你只需要指定3项内容:

  • 您要修改的数据框的名称
  • 您将创建的新变量的名称
  • 您将分配给新变量的值

还是给大家举个例子:看下图,mutate()的第一个参数就是数据框,然后就是新变量名=旧变量的某种新式。就是说你可以轻松地以数据框中的原有变量生成新变量。

举例:在差异分析结果列表de_result中加入一列direction ,标注出基因表达上下调情况及是否具有显著性

DEgene <-  mutate(DEgene, direction = if_else(P.Value >= 0.05 | abs(log2FoldChange) <= 1, 'NS', 
                             if_else(log2FoldChange > 1, 'UP', 'DOWN')))

本文参考:Codewar:R数据分析:如何在R中使用mutate

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容