R第十天

R第十天

一/数据集的合并

（一）、Merge函数

merge（a,b,by = '列名',by.x,by.y,all=True） ——a,b是合并的数据框，by按什么合并，all是否保留所有行，all.x=True是a中所有行，b中匹配的行 all.y=True是b中所有的行，a中匹配的行

（二）、cbind函数

cbind(a,b)——纵向链接两个数据框，行相同

（三）、rbind函数

rbind(a,b)——横向链接两个数据框，列相同

（四）、duplicated(h)——返回逻辑值，看是否前面有相同的行 h[!duplicated(h),]返回没重复的行

（五）、排序函数

sort(age)——对age数列，从小到大排序

sort(age,decreasing=T)——从大到小排序

order(age)——从小到大排序返回每个的索引

rank(age)——返回序列每个值排第几

怎么按某列从小到大排序呢？数据集[order,]

sort(x,na.last=T)——让缺失值排最后若F则排最前若NA则直接删掉

t(a)——对a转置

（六）、aggregate函数

aggregate(处理的列,by = list(),算法)——按list分类对列求均值

（七）、抽样函数

sample(1:100,10)——在1到100抽10个数

sample（letters[1:20],10，replace=T）——有放回抽样，replace默认F