用R进行数据分析-05



20-矩阵与数组

一、矩阵的定义

矩阵(Matrix)是一个按照长方阵列排列的复数或实数集。向量是一维的,而矩阵是二维的,需要有行和列。

R中,矩阵是有维数的向量,但元素必须拥有相同的模式,此和向量一致。

例:x<-1:20

构造4行5列的矩阵:

m<-matrix(x,nrow=4,ncol=5) 或m<-matrix(1:20,4,5)

矩阵默认按列分配,即上述结果为:

1    5    9    13  17

2    6    10  14  18

3    7    11  15  19

4    8    12  16  20

matrix(1:20,4,byrow=T)此按行分布,即输出结果如下(若为F则按列分布)

1    2    3    4    5

6    7    8    9    10

11  12  13  14  15

16  17  18  19  20

其他章节内容请看我的个人微信公众号:全哥的学习生涯


二、数组

x<-1:20

①dim(x) <-c(2,2,5)  x此时变为三维数组

②构造数组:

dim1 <-c(“A1”,”A2”)

dim2<-c(“B1”,”B2”,”B3”)

dim3<-c(“C1”,”C2”,”C3”,”C4”)

Z <-array(1:24,c(2,3,4),dimnames=list(dim1,dim2,dim3))

③Titanic为R中内置数据集的数组


三、矩阵的索引

构造矩阵m<-matrix(1:20,4,5,byrow=T),即为

1    2    3    4    5

6    7    8    9    10

11  12  13  14  15

16  17  18  19  20

m[1,2]  即为2

m[1,c(2,3,4)]  第1行,2,3,4,列的数据

m[c(2:4),c(2,3)]  输出矩阵一个子集

m[2, ] 输出第2行数据

m[ ,2] 输出第2列数据

m[2]  默认输出第2行第1列的数,即6

m[-1,2]  即去除第1行,再取第2列

m+1,m*2  表示每个元素都乘以2

m+m 两个矩阵相加时,对应位置相加

若n <-matrix(1:20,5,4) ,则n+m会报错

colSums(m) 计算每一列的和

rowSums(m) 计算每一列的和

若构造m<-matrix(1:9,3,3) t<-matrix(2:10,3,3)

m*t 对应位置相乘,为矩阵内积

m %*% t 矩阵外积

diag(m) 返回对角线位置的值,即1,5,9

t(m) 将矩阵m转置,即行列互换


21-列表

列表即一些对象的有序集合,可以存储若干向量、矩阵、数据框,甚至其他列表的组合。

[if !supportLists]①   [endif]在模式上与向量相似,都是一维数据集合

[if !supportLists]②   [endif]向量只能存储一种数据类型,列表中的对象则可以是R中的任何数据结构,甚至列表本身。

R内置数据集state.center即列表数据

创建列表:list()

[if !supportLists]③   [endif]列表的访问

mlist<-list(a,b,c,d)

mlist[1]  即输出向量a

一次访问多个列表元素:mlist[c(1,4)]

也可用名称访问列表,即state.center[c(“x”,”y”)]

state.center$ x  访问列表的另一种形式

mlist[[1]]此时的输出结果变为元素本身类型

class(mlist[1]);class(mlist[[1]))  可测试元素类型

若给列表赋值,比如如上两个中括号才可以

Mlist[[5]]

<-删除列表元素

其他章节内容请看我的个人微信公众号:全哥的学习生涯


22-数据框

一、数据框的概念

数据框是一种表格式数据结构,数据集通常是由是由数据构成的一个矩形数组,行表观测,列表变量。(记录与字段/事例与属性)

数据框实际上是一个列表,列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同长度,所以数据框是矩形结构,且数据框的列必须命名。数据框并不是矩阵,因为矩阵要求元素属性必须相同。

即:

[if !supportLists](1)   [endif]数据框形状上很像矩阵

[if !supportLists](2)   [endif]数据框是比较规则的列表

[if !supportLists](3)   [endif]矩阵必须为同一数据类型

[if !supportLists](4)   [endif]数据框每一列必须为同一类型,每一列则不必

R内置数据集iris,mtcars,rock即为数据框

创建数据框:state<-data.frame(state.name,state.abb,state.region,state.x77)

二、数据框的访问

state[1]  输出第1列数据

state[c(2,4)] 输出2,4列数据

state[-c(2,4)] 去除2,4列数据后再输出其他数据

利用行和列的名字也可以取出对应的行列

state[ ,”state.abb”]

plot(women$height,women$weight)  输出散点图

lm(weight  ~height,data=women)  线性回归

attach(mtcars) 直接加载数据框的内容,之后直接敲列名即可,不用加$

rownames(mtcars)

colnames(mtcars) 取行名与列名

with(mtcars,{mgg}) 取mtcars中的mgg列

其他章节内容请看我的个人微信公众号:全哥的学习生涯


23-因子

R中的变量可以分为:名义型变量(相互间独立,无顺序差别)、有序型变量(相互间有联系,但又并非连续型数值)、连续型变量

在R中连续型变量和有序型变量统称为因子,factor,这些分类变量的可能值称为一个水平level,例如good,better,best都称为一个level,由这些水平值构成的向量就称为因子(整个集合才称为因子),mtcars$cyl即为一个因子

因子的最大作用是进行数据分类,计算频率与频数

因子的应用:计算频数、独立性检验、相关性检验、方差分析、主成分分析、因子分析等等

table(mtcars$cyl) 可用于频数统计,因子即cyl,而因子的level为4,6,8

f <- factor(c(“red”,”yellow”,”green”)) 即因子类型的数据

plot(factor(mtcars$cyl)) 输出条形图

注意:向量输出散点图,而因子输出条形图

state.division、state.region为因子类型的数据

其他章节内容请看我的个人微信公众号:全哥的学习生涯

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,548评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,497评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,990评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,618评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,618评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,246评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,819评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,725评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,268评论 1 320
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,356评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,488评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,181评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,862评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,331评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,445评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,897评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,500评论 2 359