一/数据集的合并
(一)、Merge函数
merge(a,b,by = '列名',by.x,by.y,all=True) ——a,b是合并的数据框,by按什么合并,all是否保留所有行,all.x=True是a中所有行,b中匹配的行 all.y=True是b中所有的行,a中匹配的行
(二)、cbind函数
cbind(a,b)——纵向链接两个数据框,行相同
(三)、rbind函数
rbind(a,b)——横向链接两个数据框,列相同
(四)、duplicated(h)——返回逻辑值,看是否前面有相同的行 h[!duplicated(h),]返回没重复的行
(五)、排序函数
sort(age)——对age数列,从小到大排序
sort(age,decreasing=T)——从大到小排序
order(age)——从小到大排序返回每个的索引
rank(age)——返回序列每个值排第几
怎么按某列从小到大排序呢?数据集[order,]
sort(x,na.last=T)——让缺失值排最后 若F则排最前 若NA则直接删掉
t(a)——对a转置
(六)、aggregate函数
aggregate(处理的列,by = list(),算法)——按list分类对列求均值
(七)、抽样函数
sample(1:100,10)——在1到100抽10个数
sample(letters[1:20],10,replace=T)——有放回抽样,replace默认F