R语言入门

Step1:下载和安装R

Windows和OS X用户可以从CRAN(Comprehensive R Archive Network)上下载R。

在浏览器中打开http://www.r-project.org/

点击“CRAN”。然后会看到按国家排序的镜像站点列表(我选的是University of Science and Technology of China 中国科学技术大学);

点击“Download  R for Windows”。

点击“base”;

点击下载最新版R的链接(我下载的是R-3.3.2-win.exe文件);

下载完成后,双击.exe文件,按照提示安装。

完成后如下图所示:

Step2:下载和安装RStudio

在浏览器中打开https://www.rstudio.com/;

点击“Download”。然后会看到如下选项,有两个免费版本。(我选择了第一个Desktop桌面版的)

点击“Download”后跳入如下界面

选择Installers下载项的第一行,进行Windows版本的RStudio的下载;

下载完成后,双击.exe文件,按照提示安装。

完成后如下图所示:

!!!没想到打开的窗口一片空白,单击无法正常打开,经登录相关论坛,发现可能是安装路径存在问题。于是我将R及RStudio重新安装于同一目录下,然而窗口仍不可正常显示。经过我进一步的查找相关解决方法,按住“Ctrl”启动Rstudio后,终于关联了正确的英文路径,得以正常显示:

如图左边“Console”是控制台,用于输入R语言的命令及显示输出结果。右上角为工作空间,主要用于记录目前变量的数值,便于查看目前相关变量的状况;右下角为目录,主要显示当前目录下的相关文件以及文件夹等。

Step 3:Rstudio 的初体验

1.新建项目

在“New Project”下,选择“New Directory”

选择“Empty Project”,并新建立project的名称。本次命名为“DA”,如下图所示:

2.创建脚本

点击菜单File项下的New File中的R Script,即为创建新脚本。


由上图可见,新建立的脚本默认名称是Untitled1,为了日后查找方便,需要对其进行重命名。然而,live第二讲中并未涉及命名讲解,因此需要自己进行操作或者搜寻互联网解决。我注意到live课件中“保存”的按钮是灰色的,而我新建的脚本中的却还是蓝色的活动状态,于是点击进行“保存”后,命名“DS”,果然重命名成功:

3.运行脚本:

在脚本空白处输入代码,选中需要运行的代码部分,点击Run运行,就能在控制台以及工作空间上看到代码运行的情况及结果(这里借用了猴子老师第二讲live里部分代码):

随后,又尝试自己输入几行简单的求和代码,运行后如图;

赋值a=5,b=6,C=a+b,最后得出正确的答案C=11。试验成功!

Step 4:数据结构入门

1.数据结构

R拥有许多用于存储数据的对象类型,包括标量、向量、矩阵、数组、数据框和列表。

注意:在R中,术语 对象(object)是指可以赋值给变量的任何事物,包括常量、数据结构、函数,甚至图形。对象都拥有某种模式,描述了此对象是如何存储的,以及某个类。

1.1向量

向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的函数 c() 可用来创建向量。各类向量如下例所示:

a <- c(1, 2, 5, 3, 6, -2, 4)                      #数值型向量

b <- c("one", "two", "three")                  #字符型向量

c <- c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE) #逻辑型向量

注意,单个向量中的数据必须拥有相同的类型或模式(数值型、字符型或逻辑型)。同一向量中无法混杂不同模式的数据。

如何访问向量中的元素?通过在方括号中给定元素所处位置的数值。如下所示:

> a <- c("k", "j", "h", "a", "c", "m")

> a[3]#访问向量中第三个元素

[1] "h"

> a[c(1, 3, 5)] #访问向量中第一、三、五个元素

[1] "k" "h" "c"

> a[2:6]    #访问向量中第二至第六个元素

[1] "j" "h" "a" "c" "m"

实例演练

在脚本中输入代码:

name<-c("猴子","李四","张三","王二")#命名向量名为猴子、李四、张三、王二

name[1]#访问向量中第一个元素名

length(name)#获取向量中元素个数

name[1:4]#访问向量中第一至第四的元素名

name[c(1,2,3,4)]#分别访问向量中第一、二、三、四的元素名

依次点击、同时选定点击运行后,结果如下图所示。

1.2 矩阵

矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数matrix()创建矩阵。

a <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,byrow=logical_value, dimnames=list(char_vector_rownames, char_vector_colnames))

其中 vector 包含了矩阵的元素,nrow和ncol 用以指定行和列的维数,dimnames 包含了可选的、以字符型向量表示的行名和列名。选项 byrow 则表明矩阵应当按行填充(byrow=TRUE )还是按列填充(byrow=FALSE ),默认情况下按列填充。

实例演练

创建一个3*3的矩阵,

“data <-c(2,4,6,1,3,5,7,8,9);#数值为2,4,6,1,3,5,7,8,9

rnames <-c("A","B","C");#行名为"A","B","C"

cnames <-c("L1","L2","L3");#列名为"L1","L2","L3"

a<- matrix(data = data,#矩阵显示数值,

nrow=3,ncol=3,#行数为3,列数为3

byrow=TRUE,#按行填充

dimnames = list(rnames,cnames));#包含行名、列名”

得出矩阵图为

假如,改成byrow=FALSE,则:

显然,数据的排列方式发生了改变。

然后,尝试在矩阵中选择向量元素,输入代码:

a[1,1]#查看第一列第一行的元素

a[,3]#查看第三列的所有元素

a[2,c(2,3)]#查看第二行的第二、三列的所有元素

a[c(1,2),c(2,3)]#查看第一、二行、第二、三列的所有元素

a[c(1,3),c(1,2,3)]#查看第一、三行、第一、二、三列的所有元素。

结果如图:


进一步的,创建一个5*1的矩阵,绘制柱状图,如图所示:

1.3 数组

数组(array)与矩阵类似,但是维度可以大于2。数组可通过 array 函数创建。

myarray <- array(vector,dimensions,dimnames)。其中 vector 包含了数组中的数据, dimensions 是一个数值型向量,给出了各个维度下标的最大值,而 dimnames 是可选的、各维度名称标签的列表。

实例演练

创建一个三维数组,元素为1~24,

dim1 <- c("A1", "A2")

dim2 <- c("B1", "B2", "B3")

dim3 <- c("C1", "C2", "C3", "C4")

a <- array(1:24,c(2, 3, 4),dimnames = list(dim1, dim2, dim3))

欲查看该数组所有元素,采用方法如下

首先输入代码a[,,,], 显示错误,分别输入最后维度的序数,则正常显示

a[,,1]

a[,,2]

a[,,3]

a[,,4]

采用一句代码,输入a[,,c(1:4)]

则同样显示该数组所有元素

结论:数组的维度需要符合数值型向量给出的各维度下标最大值。像矩阵一样,数组中的数据也只能拥有一种模式。从数组中选取元素的方式与矩阵相同。

1.4 数据框

由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。它与你通常在SAS、SPSS和Stata中看到的数据集类似。数据框将是你在R中最常处理的数据结构。

下表所示的病例数据集包含了数值型和字符型数据。由于数据有多种模式,无法将此数据集放入一个矩阵。在这种情况下,使用数据框是最佳选择。

数据框可通过函数 data.frame()创建: mydata <- data.frame(col1,col2,col3,…)。其中列向量 col1 、 col2 、 col3 等可为任何类型(如字符型、数值型或逻辑型)。每一列的名称可由函数 names 指定。

实例演练

输入5名糖尿病患者的各项数据:

patientID <- c(1, 2, 3, 4,5);#病人编号

name <- c('张三','李四','王二','赵大','孙五');#姓名

age <- c(30, 34,48,56,45);#患者年龄

diabetes <- c("1型糖尿病", "1型糖尿病",

"2型糖尿病", "2型糖尿病","1型糖尿病");#糖尿病类型

status <- c("较差", "好转",

"显著好转", "较差",'较差');#病情

patientdata <- data.frame(patientID,name,age,

diabetes, status,

stringsAsFactors=FALSE);

.运行,得下图:

若要对该图表中的数据进行筛选,则需要注意$号的使用,它被用来选取一个给定数据框中的某个特定变量。

实例演练

若要筛选出患有“1型糖尿病”的人数,需要两步走:

#step1:查找“1型糖尿病”的病人

type1 <- patientdata[patientdata$diabetes =="1型糖尿病",];

#step2:统计病人数

type1.number <- nrow(type1);

结果如图:

此外,还可以通过rbind以及cbind函数添加行和列。

1.5 列表

一般来说,列表就是一些对象(或成分,component)的有序集合。可以使用函数 list() 创建列表:mylist <- list(object1, object2, ...)。其中的对象可以是目前为止讲到的任何结构。

list列表的重要性。首先,列表允许以一种简单的方式组织和重新调用不相干的信息。其次,许多R函数的运行结果都是以列表的形式返回。

1.6 因子

因子(factor):类别(名义型)变量和有序类别(有序型)变量。

总结:

总的来说,初步了解了R的数据结构,掌握了一些基本操作。遇到问题,不做伸手党,这一点非常重要,独立思考,独立解决问题也是一项技能。加油吧,少年!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,183评论 6 516
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,850评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,766评论 0 361
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,854评论 1 299
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,871评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,457评论 1 311
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,999评论 3 422
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,914评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,465评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,543评论 3 342
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,675评论 1 353
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,354评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,029评论 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,514评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,616评论 1 274
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,091评论 3 378
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,685评论 2 360

推荐阅读更多精彩内容

  • 《R语言入门》的读书笔记 本书的重点内容及感悟: 第一章 导言 1、R是一个有着统计分析功能及强大作图功能的软件系...
    格式化_001阅读 12,594评论 0 9
  • R语言科学计算 分类统计 mean(),求平均值 min(),求最小值 sd(),求标准差 数组和矩阵 数组与矩阵...
    Jtag特工阅读 4,803评论 1 13
  • 最近在复习python的科学计算,突然心血来潮,想看看R的数据处理和python的区别在哪,所以就有了这篇文章。 ...
    若与阅读 2,100评论 1 24
  • 1.对象和属性 在R中有5种基本的对象类型(classes of subjects): 字符:character,...
    曹务强阅读 804评论 2 2
  • 孩子上初三,我和他共用一间书房。通常是他写他的,我做我的,互不干涉,相安无事。我不知道,这是不是一种陪伴,抑...
    雅禅阅读 272评论 0 5