一、R的数据类型(模式)大概分为如下几种:
第一种:原生型数据是计算机能够直接识别的类型,二进制的形式保存的数据,格式为raw。
v <- charToRaw("Hello")
v
[1] 48 65 6c 6c 6f
mode(v)
[1] "raw"
第二种:数值型;数值型数据是数字,格式为numeric。
v <- 3
mode(v)
[1] "numeric"
第三种:字符串型;字符串型的数据要用双引号或者单引号包括起来,格式为character。
v <- 'hello'
mode(v)
[1] "character"
第四种:逻辑型;TRUE或者FALSE或者NA,格式为logical。
v <- TRUE
u <- FALSE
mode(v)
[1] "logical"
mode(u)
[1] "logical"
第五种:复合型数据,包含实数和虚数,格式为complex。
v <- 3+2i
mode(v)
[1] "complex"
另外,还有NULL表示未定义,NA表示缺失值。
v <-NA
u <-NULL
mode(v)
[1] "logical"
mode(u)
[1] "NULL"
NULL与NA的区别:用一个比喻来讲,NA是已经挖好了一些坑,只是里面没有萝卜而已,这就是所谓的“缺失值”。而NULL则指的是“压根连坑都没有”。一个元素值全为NA的向量,它的长度是存在的,就等于元素的个数。而如果把一个向量的所有元素的值都设为NULL,这个向量就变成了“空值”,其长度为0,表明“空无一物”。(来自网上)
我的理解:NULL是什么都没有,一片空地;NA是有几个坑,只不过里面没东西而已,但是有坑。
二、R的数据结构
R中的数据结构包括标量(只含一个元素的向量)、向量(vector)、矩阵(matrix)、数组(array)、数据库(dataframe)、列表(list)、因子(factor)。
这里就不给大家细说了,附上详细的学习链接。
第一种:向量
http://www.yiibai.com/r/r_vectors.html
第二种:因子
http://www.yiibai.com/r/r_factors.html
第三种:矩阵
http://www.yiibai.com/r/r_matrices.html
第四种:数组
http://www.yiibai.com/r/r_arrays.html
第五种:数据框
http://www.yiibai.com/r/r_data_frames.html
第六种:列表
http://www.yiibai.com/r/r_lists.html
原谅作者的懒吧,下期给大家带来简单数据处理教学。