dplyr包
- count统计某列的unique值
- mutate(x,new=),新增列
- arrange(),按某1列或某几列对整个表格进行排序
- 2个表进行连接时注意:不要引入factor。
options(stringsAsFactors = F)
或者在输入表格变量时加入下面加粗代码。
test1 <- data.frame(x = c('b','e','f','x'), z = c("A","B","C",'D'), stringsAsFactors = F)- 半连接:semi_join(x=变量名1 ,y=变量名2 ,by=' ')返回能够与y表匹配的x表所有记录semi_join
- 反连接:anti_join(x=变量名1 ,y=变量名2 ,by=' ')返回无法与y表匹配的x表的所记录