本文参考:《R语言数据挖掘》第2版 薛薇 编著
R的数据对象根据储存类型角度划分为数值型、字符串型、逻辑型等。
1.数值型numeric
顾名思义,就是一些以数字形式出现的数据类型,比如身高、年龄、体重。根据位数的长短占用存储空间
2.字符串型character
用英文双引号括起来的一个字符序列,如"name","234","2019-4-22".
3. 逻辑型 logical
真或假。要用英文大写字母表示为TRUE和FALSE。"!"表示非,即TRUE=!FALSE,FALSE=!TRUE
若根据数据结构划分,则R对象可分为向量、矩阵、数组、数据框、列表等多种结构类型。
数据类型
1.向量vector
R数据组织的基本单位,具有相同存储类型的变量。一个向量一般对应一个变量,一个变量常含有多个变量值,如小明同学的数学成绩为100为小明同学成绩的一个变量值。因为变量一般按列组织,所以若无明确说明,向量均为列向量。因子factor为一种特殊向量。
2.矩阵matrix
二维表格。具有相同存储类型的变量。矩阵列称为变量,行称为观测。
3.数组array
是多张二维表格的罗列,是多个矩阵的集合。因此也具有相同存储类型的变量。
4.数据框dataframe
变量的储存类型不尽相同。一张二维表格。
5.列表list
是多个向量、矩阵、数组、数据框以及列表的集合。通常结构化的数据不采用列表组织。列表用于多个相关分析结果的打包集成。
查看R数据对象的结构
str(对象名)
这个函数要经常用,日后数据类型报错的时候会有帮助判断对象是否为..
is.vector(对象名) #是否为向量
is.logical(对象名) #是否为逻辑型
is.matrix(对象名) #是否为矩阵
is.dataframe(对象名) #是否为数据框
is.array(对象名) #是否为数组
.......
R有许多的is.系列函数用于判断xx是否为。。