R语言cut函数

在数据处理时,常需要对数值型数据进行归类,如我们收集收入时往往需要给出最直观的变量来告知我们这个值的收入是高、低还是中等。cut函数可实现这一目的。

income<- c(1050,2030,3020,4030,5080,8000,9500,12000,5000,2300,30000)
age<-c(20,30,40,50,55,33,55,77,88,22,33)
dat<-data.frame(age,income)
image.png

如果希望加一列来将income分类为 low,medium以及high,标准为income<=3000定义为low, 3000<income<=8000为medium, income>8000为high,运用cut函数,命令如下:

dat$lveel<- cut(dat$income,breaks=c(-Inf,3000,8000,Inf),labels=c('low','medium','high'))
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。