生信星球学习第六天
学习内容主要包括R语言的一些简单数据处理操作,现在回顾一下
1.R有很多包,主要分为两大类CRAN or Biocductor,其操作命令分别为install.package(); BioManager::install()
2. dplyr包的五个基础函数
2.1 mutate(), 为新增列
2.2 select(), 按列筛选
2.3 filter ()按行筛选
2.4 arrange (),按某一列或者某几列进行排序
2.5 summarise (),汇总
3.dplyr两个实用技能
3.1 %>%,管道操作
3.2 count 统计某列的unique值,避免重复的列内容出现
4.dplyr处理关系数据,即将两个表连接起来
4.1 內连inner_join,取交集
4.2 左连left_join
4.3 全连full_join
4.4半连接 返回能够与y表匹配的x表所有记录semi_join,只有X表的内容会被显示出来
4.5 反连接 anti_join, 和半连接刚好完全相反
4.6 简单合并数据框 cbind(), rbind(); bind_rows(), bind_cols() ps: bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
生信_20200413122153.png
加油!