挤进R语言的第二天—数据结构

学习了R、RStudio以及R包的安装,自然要学习开门第一课——创建数据(以下文字摘自R语言实战(第二版))。R语言有许多用于储存的对象类型,包括标量、向量、矩阵、数组、数据库和列表。

  1. 向量(vector)
    向量是用于存储数值型、字符型或逻辑型数据的一组一维数组。执行组合功能的函数c()用来创建向量。例如:
    a <- c(1,2,3,4); b<- c("one","two","three"); c<-("TRUE", "FALSE","TRUE","TRUE"
    )
    其中a属于数字型向量,b属字符型向量,c属于逻辑型向量。单个向量中的数据必须用于相同的类型或模式。

  2. 矩阵(matrix)
    矩阵是一个二维数组,只是每个元素都拥有相同的模式。通过matrix()创建矩阵。
    mymatrix <- matrix(vector, nrow= number_of_rows, ncol= number_of_columns, byrow=logical _value, dimnames=list(char_vector_rownames, char_vector_colnames))
    解释一下,mymatrix相当于命名,赋予生命名字都OK,第一个是vector向量,包含矩阵的元素,nrow和ncol是行和列的数字,byrow表明矩阵是按照行填充还是列填充,默认是FLASE即,按列填充,若敲代码时,赋予byrow=TRUE,则按行填充,dimnames即对行或列进行命名。


    代码清单2-2(摘自R语言实战(第二版))

创建了1个2*2的矩阵,向量为cells,行名为为rnames,列名为cnames,第一个按行填充,第二个按列填充

  1. 数组(array)
    数组与矩阵类似,但是唯独可大于2,通过array()创建数组。
    myarray<-array(vector,dimensions,dinames)
    其中vector包含数组中的数据,dimensions是一个数值型向量,给出各个维度下标的最大值,dinames是可选的,为各个维度名称的标签的列表。
代码清单2-3(摘自R语言实战(第二版)

创建了一个234的数值型数组,其中各维度名称为dim1, dim2, dim3。而z(1,2,3)为第一行第二个第三组数据,值为15。

  1. 数据框(data.frame)
    数据框属于最常处理的数据结构与SAS,SPSS和Stata中看到的数据集类似,通过data.frame()创建数据框。
    mydata<-data.frame(col1,col2,col3,...)
    其中的列向量col1,col2,col3等可成为任何类型。每一列的名称可由函数names来指定。


    代码清单2-4(摘自R语言实战(第二版)

每一列数据模式必须唯一,但是可将多个模式的不同列放到一起组成数据框。

  1. 因子(factor)
    类别(名义型)变量和有序类别(有序型)变量在R语言中称为因子,通过factor()创建因子。函数factor是以一个整数向量的形式存储类别之,整数的取值范围是[1...k](其中k是名义型变量中唯一值的个数),同时一个由字符串组成的内部向量将映射到这些整数上。


    代码清单2-6(摘自R语言实战(第二版)

建立了4个向量,将向量diabetes指定为普通因子,将status指定为有序型因子,将整个数据合并成一个数据框。函数str()提供对象的信息,显示patientID和age为数字型向量,diabetes为普通因子,status为有序因子。函数summary()显示对象的统计概要,并会区别对待各个变量,如图显示,对patientID和age计算最小值,1/4,中间值,平均值,3/4以及最大值。对待diabetes和status显示出频数值。
注:1. 对于字符型向量,因子的水平默认依字母顺序创建,若想按照自己的逻辑,可通过选项levels来覆盖默认排序,如:status<-factor(status, order=TRUE,levels=c("Poor”, "Improved", "Excellent"))
2.对于数字型向量可用levels和labels参数来编码成因子。如男性编码成1,女性编码成2。
sex<-factor(sex, levels = c(1,2), labels = c("Male", "Female"))

  1. 列表(list)
    列表是R的数据类型中最为复杂的一种,一般来说是一些对象(或成分)的有序集合。类别允许你整合若干对象到单个对象名下,通过list()创建列表。


    代码清单2-7(摘自R语言实战(第二版)

创建了1个字符串,数字型向量,矩阵和字符型向量,将4个保存为1个列表。可以通过[[]]输出想要的成分,如mylist[[2]]或mylist[["ages"]]。

今天有分享这么多,不过在编写的时候发现简书的图片上传一直是!,显示失败,大家可以切换成预览模式就可看到自己插入图片的状态,不知道发布的时候会不会一致。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容