和Python对应,用R如何清理数据呢?
R主要用到两个包:tidyr
和dplyr
library(tidyr)
?gather
?spread
效果示意
一、单独表的“长宽互变”
依旧按场景来看。
(一)“省份—年份”式
宽表变长表
gather(pf, 'year', 'n', 2:4)
用gather函数
(二)“省份—分类”式
长表变宽表
spread(pf, size, amount)
用spread()函数
(三)时间式
类似时间这样的数据分割和合并
用sepatate()分割
unite()合并
二、多表的“增宽加长”
“绑”列增宽
“绑”行加长
合并新增
找重叠
找差异
按条目增宽
按多条件增宽
增宽并舍弃无数据对象