《R语言入门与实践》第二章:R包与帮助文档

前言:接着上一章(《R语言入门与实践》第一章:R基础)的任务,现在已经有了模拟掷一对骰子的函数。接下来的目标是对骰子进行加权,做出不均匀的骰子——即让这对骰子掷出大点数的概率稍高于掷出小点数的概率。需要用两个函数实现重复(replicate)和可视化(visualization):

  • replicate():重复运行,实现重复投掷骰子
  • qplot():快速做图(quick plot),将重复抛掷的结果可视化
    拓展学习:qplot入门- 知乎 (zhihu.com)

笔记目录:
2.1 下载和加载R包
2.2 运用qplot函数快速绘图
2.3查找帮助页面获取帮助
2.4 项目1总结(1-2章)

2.1 下载和加载R包

刚才提到的qplot函数不是R自带的函数,来自外部的一个独立的R包ggplot2。这就是R作为开源软件最大的特点,很多优秀的数据科学家、统计学家、程序员编写上传的R包,可以帮助我们快速实现很多分析操作,再次感谢前辈们的贡献。
当然也有一个潜在的缺点就是,大量的R包在其中找到合适的包,需要更多的时间查找和学习。好在优秀的前行者们也有很多总结经验,小白日常感激。
拓展学习:R语言最新最好用综合包推荐【2022】 - 知乎 (zhihu.com)

  • 安装R包:命令:install.packages("ggplot2"),双引号中间为R包的名称。
  • 加载R包:命令:library("ggplot2"),加载包后,没有信息显示代表一切正常。
  • 每个包只需安装一次,但是每次重新打开RStudio后,都需要重新加载需要的包。
library("ggplot2")

2.2 运用qplot函数快速绘图

安装和加载好,开始使用qplot绘图吧~

  • 把两个长度相同的数值向量交给qplot函数,它就会绘制出一幅散点图。
  • qplot函数一个向量,它就会画出一个直方图。
#输入R包名称回车,可以显示这一函数的源代码,太长就不放了。
qplot
# c函数创建数值向量,放在c()括号内,每个数值用逗号隔开。
x <- c(-1,-0.8,-0.6,-0.4,-0.2,0,0.2,0.4,0.6,0.8,1)
y <- x^3
qplot(x,y)
  • 散点图:描述两个变量之间的关系。

    简单散点图.png

  • 直方图:可视化单一变量的分布情况;显示这个变量的每一个值x,直方图会展示有多少数据点落在这个值内。

  • 通过直方图可以直观地看出x的哪些值出现的频率高。

x <- c(1,2,2,2,3,3)
qplot(x,binwidth=1)
# binwidth参数代表直方图的宽度,确保每个图的一致性。
直方图1.png
x2 <- c(1,1,1,1,1,2,2,2,2,3,3,4)
qplot(x2,binwidth=1)
# 5个数据点取值为1,因此在区间[1,2)上的柱高为5。
直方图2.png
x3 <- c(0,1,1,2,2,2,3,3,4)
qplot(x3,binwidth=1)

直方图3.png

那么,如何通过直方图检验虚拟骰子的均匀程度呢?我们可以通过replicate函数,快速重复运行投掷骰子的命令。投掷足够多的次数便会看到投掷结果呈现的规律趋于稳定。

# roll刚才为定义的一对骰子,如果再次打开Rstudio,之前定义过的函数,需要重新运行一下,不然会报错,没有这个函数。
roll<- function(){
  die <- 1:6
  dice <- sample(die,size=2,replace=TRUE)
  sum(dice)
}
# rolls为投掷10000次的骰子点数总和的分布。
rolls <- replicate(10000,roll())
qplot(rolls,binwidth=1)
均匀骰子10000次投掷结果

2.3查找帮助页面获取帮助

  • R函数家族庞大,不可能记住和掌握每个函数。所幸每一个R函数都有自己的帮助页面。
  • 查看帮助页面的方式:?+ 函数名称
  • 如果忘记函数的具体名称,可以用:??+函数关键词
  • 如果查找的函数来自某个R包,而没有安装或者加载该包,以上方式不能查看。
?sample
sample函数帮助页面.png

帮助页面的组成部分:

  1. 函数描述(Description):一段简短的有关该函数功能的描述。
  2. 使用方法(Usage):说明如何键入该函数和相应的参数名。
  3. 参数(Arguments):列出该函数所包含的所有参数、参数的赋值类型及作用。
  4. 相关细节(Details):对函数的工作原理的进一步描述及注意事项。
  5. 返回值(Value):关于该函数运行后返回值的简短描述。
  6. 另请参阅(See also):与该函数相关的函数的列表。
  7. 示例(Examples):确保可以无错运行的代码示例。

很多函数帮助页面的内容非常多,并且难以理解(尤其我这种英语还不好的小白)。那就可以只需要关注能理解的部分,并且最重要的是最后的代码示例。运行这些代码,可以帮助我们快速掌握该函数的基本功能。

现在,我们的目的是在帮助页面中找到sample函数如何设置抽取概率,以获得一对非均匀的骰子。

  • 在使用方法(Usage)这里,我们找到了sample函数的所有参数设置,最后一个参数我们还没有运用。看一下最后一个参数的作用,看起来很像我们要找的,接下来来实践一下吧!

Usage
sample(x, size, replace = FALSE, prob = NULL)
prob :a vector of probability weights for obtaining the elements of the vector being sampled.(用于获取被抽取向量元素的概率权重向量。)
(prob的参数中的概率权重与抽取向量元素一一对应)

# roll刚才为定义的一对均匀骰子。
roll<- function(){
  die <- 1:6
  dice <- sample(die,size=2,replace=TRUE)
  sum(dice)
}
# roll2为加了概率权重参数的非均匀骰子。
roll2<- function(){
  die <- 1:6
  dice <- sample(die,size=2,replace=TRUE,prob = c(1/8,1/8,1/8,1/8,1/8,3/8))
  sum(dice)
}
# rolls2为投掷10000次非均匀骰子点数总和的分布。
rolls2 <- replicate(10000,roll2())
qplot(rolls2,binwidth=1)
非均匀骰子10000次投掷结果.png

均匀骰子10000次投掷结果

再看一下上面的均匀骰子结果图,可以看出这次的直方图出现了较大的向右偏态。如果是模拟掷骰子,点数大的概率远高于点数小的概率。

2.4项目1总结

上一章我们总结了R语言最重要的两个组成部分:

  • 对象:用来存储数据——R语言中的名词
  • 函数:用来操作分析数据——R语言中的动词(函数中的参数可以看作副词)
    书中比喻的特别好:

如果函数和对象结合起来,就可以通过R语言表达一个完整的想法。将多个想法按逻辑顺序接合起来,可以生成有力的甚至唯美的语句。(P34)
这样看R语言和其他语言并无差异。同样如果想要学好这门语言,就必须掌握一定词汇量(即R命令),不然难以自如地用R语言和计算机交流。
即使目前词汇量还不大,也不应该羞于开口,一定要多交流,计算机是一个好的听众,有问题会立马给你指出来(报错),而不会嘲笑你;操作正确会给你反馈正确的结果。(这样的及时反馈,不就是刻意练习嘛!)

复盘一下我们已经掌握的技能:

  • 认识和使用RStudio的用户界面
  • 运行R命令、创建R对象
  • 编写自己的R函数和脚本
  • 生成随机样本和非均匀概率样本
  • 加载并使用R包
  • 快速制图
  • 在需要帮助时及时获取帮助

到现在为止我们所学习的R基础知识已经足以在接下来学习过程中边学边用了,而边学边用正是最佳的学习途径。截至目前代码累积到150行,向10000行继续进发!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容