R语言之Tidyverse

下载并加载包

BiocManager::install("tidyverse")
library(tidyverse)

用dplyr::filter过滤数据

  • 过滤得到包含特定字符串的行
df %>%
dplyr::filter(grepl('strA|strB', columname))
  • 过滤去除包含特定字符串的行
df %>%
dplyr::filter(!grepl('strA|strB', columname))
  • 过滤某列为空(NA)的所有行
    filter(dataframe_x, !is.na(columname))

列转换为行名 or 行转换为列名

  • 列转换为行名
df %>%
column_to_rownames(var = "columname")
  • 行转换为列名
colnames(df) <- df[1,]
df <- df[-1,]

列的拆分

  • 将一列数据按照分隔符拆分为两列或多列
separate(df, columname, 
        into = c("new_columnameA", "new_columnameB", "new_columnameC"), # 新列名
        sep = ":") # 分隔符
  • 有两列数据,其中有一列数据需要拆分,并且拆分后要与另一列数据一一对应
separate_rows(df, columname, sep = " \\| ")


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容