R语言入门——因子(factor)

因子:

用于存储不同类别的数据类型,例如人的性别有男和女两个类别,年龄来分可以有未成年人和成年人。
R 语言创建因子使用 factor() 函数,向量作为输入参数。

factor() 函数语法格式:
factor(x = character(), levels, labels = levels, exclude = NA, ordered = is.ordered(x), nmax = NA)
#参数说明:
x:向量。
levels:指定各水平值, 不指定时由x的不同值来求得。
labels:水平的标签, 不指定时用各水平值的对应字符串。
exclude:排除的字符。
ordered:逻辑值,用于指定水平是否有序。
nmax:水平的上限数量。

下图示例先生成向量,然后把向量转换成因子。


内部结构
因子长度
修改元素
注意

注意这里一定是要是已经存在的水平值,原先水平里没有的元素你修改的话会报非法的水平值错.
可以指定你的Levels
tapply(x,f,g)函数:

基本概念:

tapply(x,f,g)
#x:向量
#f:因子
#g:函数
#将x按照f的因子进行分组,并且针对分组应用g函数

举个栗子🌰


sum

进阶版:
split(x,f)函数

基本概念:

split(x,f)
#x:向量,数据框
#f:因子
#将x按照因子f进行分组
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容