R第十天

一/数据集的合并

(一)、Merge函数

merge(a,b,by = '列名',by.x,by.y,all=True) ——a,b是合并的数据框,by按什么合并,all是否保留所有行,all.x=True是a中所有行,b中匹配的行 all.y=True是b中所有的行,a中匹配的行 

(二)、cbind函数

cbind(a,b)——纵向链接两个数据框,行相同

(三)、rbind函数

rbind(a,b)——横向链接两个数据框,列相同

(四)、duplicated(h)——返回逻辑值,看是否前面有相同的行 h[!duplicated(h),]返回没重复的行

(五)、排序函数

sort(age)——对age数列,从小到大排序

sort(age,decreasing=T)——从大到小排序

order(age)——从小到大排序返回每个的索引

rank(age)——返回序列每个值排第几

怎么按某列从小到大排序呢?数据集[order,]

sort(x,na.last=T)——让缺失值排最后 若F则排最前 若NA则直接删掉

t(a)——对a转置

(六)、aggregate函数

aggregate(处理的列,by = list(),算法)——按list分类对列求均值

(七)、抽样函数

sample(1:100,10)——在1到100抽10个数

sample(letters[1:20],10,replace=T)——有放回抽样,replace默认F

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,504评论 0 13
  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi阅读 7,448评论 0 10
  • Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
    草里有只羊阅读 18,378评论 0 85
  • 看到一篇公众号文章《你95%的勤奋,都在浪费时间》,颇为感触。 比如学生时代: “上课专心听讲记笔记,生怕错过任何...
    梦之郎阅读 360评论 1 1
  • 说起麻五,大家千万别以为人长得难看,其实麻五是很英俊的型男,只因家中兄弟多,排行老五而取名麻五。 ...
    泌园寒香阅读 2,445评论 0 1