学习小组-Day6-by王tutu

dplyr包

  • count统计某列的unique值
  • mutate(x,new=),新增列
  • arrange(),按某1列或某几列对整个表格进行排序
  • 2个表进行连接时注意:不要引入factor。
    options(stringsAsFactors = F)
    或者在输入表格变量时加入下面加粗代码。
    test1 <- data.frame(x = c('b','e','f','x'), z = c("A","B","C",'D'), stringsAsFactors = F)
  • 半连接:semi_join(x=变量名1 ,y=变量名2 ,by=' ')返回能够与y表匹配的x表所有记录semi_join
  • 反连接:anti_join(x=变量名1 ,y=变量名2 ,by=' ')返回无法与y表匹配的x表的所记录
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容