用R语言计算统计学习题(上)

R语言可说是一门统计学语言,要熟练运用,还需要掌握一定的统计学知识。除了学习《深入浅出统计学》以外,个人还推荐《商务统计学》(人大第5版)这本书,它的优点是习题很多,可以用R语言的统计学函数对照练习。

图片来自网络

下面是书中的习题(第一到六章),我利用R语言进行解答的一些简单分析:

第二章 用图表演示数据

2.78 文件Drink的数据展现了50瓶连续灌装饮料的量。(数据略)

问题:A. 按照顺序,用x轴表示瓶号,y轴表示时间的量,画出时间序列图。

           B. 这些数据呈现出什么模式?

           C. 如果你预测下一瓶罐装饮料的量,你会怎么预测?

这道题我认为用时间序列图解答比较好。不巧的是,时间序列图在《R语言实战中》第15章才讲。不过我们可以提前做一下:

运用ts函数,计算时间序列。这里起始时间我选择了2016年1月,频率我投机取巧的选择了小时数(一小时生产一瓶...),然后画出时间序列图。

td<-ts(drink,start=c(2016,1),frequency=8760)


从图上可以看出,饮料的灌装量越来越少,看来该检修机器了...

接下来的预测用forecast包的forecast实现,可以预测一步的,也可以预测n步......答题结束。


第三章 数值描述度量

3.32 两家银行记录了午间一小时的顾客等候时间,分别为(数据略)

问题:列出这两两家的盒须图,以及等候时间的相似/差异之处。

盒须图可以用boxplot来画。等候时间比较可以用《R语言实战》的第七章t检验来做。

结果p<0.001,拒绝两家等候时间相同的假设。


3.75,标准茶袋净重5.5克,数据显示一台机器包装的50袋茶叶的净重(数据略)

问题:A. 计算算术平均数,中位数,第一四分位数与第三四分位数。

           B. 计算该样本的全距,四分位间距,方差,标准差以及相关系数

           C. 解释集中趋势和变异程度

自己先做了一个正态检验:

中位数和四分位数,可以参考《R语言实战》第七章 描述性统计分析,利用图基五数fivenum函数求出。其余的数值,可以采用pastecs包的stat.desc函数。

其中偏度skewness为-0.12,说明分布呈现左偏;峰度kurtosis为-0.19,较正态分布稍平。


第六章正态分布

6.16 某快餐店抽取20份鸡肉三明治的脂肪含量,分别为:

7 8 4 5 6 20 20 24 19 30 23 30 25 19 29 29 30 30 40 56

问题: 确定这些数据是否符合正态分布

一开始,我的想法是利用直方图,直观的看数据分布情况:

a<-c(7,8,4,5,16,20,20,24,19,30,23,30,25,19,29,29,30,30,40,56)

hist(a)

得到图形,但并不是很完美的正态分布:

搜索下,原来应该用shapiro.test分析(不记得在R语言书中哪里了,有记得者请指教)

代码就是:shapiro.test(a)

根据说明,W值近似1,p值>0.05,符合正态分布假设。


概率函数pnorm,qnorm,dnorm等在《R语言实战》的第五章就讲到了。(5.2.3概率函数,P90),基本定义如下:

dnorm密度函数。ie 正态分布x=1对应的值可以用dnorm(1)计算

pnorm概率函数。ie 正态分布从负无穷大到1的概率,可以用pnorm(1)计算

qnorm分位函数。如果知道正态分布从负无穷大到x的概率是0.45,可以通过qnorm(0.45)计算x值。

但是R书中只是简单说明一下,再练练兵吧!《商务统计学》的相关练习是:

P176,问题6.30  瓶装饮料的净重符合正态分布,均值2升,标准差0.05升。

问题:多少比例的瓶子含有如下数量的饮料? A.1.9-2.0升;     B.1.9-2.1升;   C. 少于1.9或多于2.1升

解答:运用qnorm函数,格式为:

pnorm(2.1,sd=0.05,mean=2)

代入不同重量,得到不同结果

因此,在1.9-2.0升的比例为:0.5-0.0227=0.4773

1.9-2.1的比例为:0.9772-0.0227=0.9545

低于1.9或超过2.1的比例为:0.02275x2=0.0455

好,再来一道:

问题6.32,从每个橘子榨出的橘子汁符合正态分布,均值4.7盎司,标准差0.4盎司。问题:

80%的橘子所含有的汁在哪两个数量(对称分布于总体均值两端)之间?

按照题意理解,题目的分布是在-100%至100%之间,而R是在0-1之间取值,因此需要按比例折减,-80%折合0.1,80%折合0.9,算出答案,与书本答案一致。

77%的橘子至少会有多少盎司的橘子汁?

按照上述想法,-0.77/2+0.5=0.115,

写代码:qnorm(0.115,sd=0.4,mean=4.7),得出4.22

而书中答案是4.404。再利用pnorm(4.04, sd=0.4,mean=4.7)反推,得出比例应为0.23。咦,这里难道又不用算对称分布于两端了吗?好吧......

先写到这里吧,下一部写第七到十章的习题。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容