从肆开始的R学习之路

本章讲一些基础的代码,有不懂的可以查询R语法查询网站

  1. rep
    即是Replicate Elements of Vectors and Lists 重复向量和列表中的元素

    rep

  2. runif
    即是平均分布的一组数,runif(235)表示产生235个min=0,max=1的随机数。

    runif

  3. rnorm
    即是正态分布的一组数,rnorm(100)表示产生100个均数为0,标准差为1的随机数。

    rnorm

  4. R里面遵循先行后列
    nrow= ,ncol=

  5. 逻辑判断 TRUEorFALSE

    logical

    ==是判断,=是赋值

  6. seq 生成序列,跨度是1的序列,sequence
    seq(1,9)

    序列

  7. ls()list objects 列举当前环境中所有的变量
    rm(list=ls())remove,清除当前环境中的变量

  8. 储存变量save(数据1,数据2,file='名称.Rdata') for example

    代码

    数据

    变量

  9. 转化成数据框 as.data.frame( ),把向量转化成数据框。

  10. 给数据框添加一列,赋值。data1[,2] <- 'male',本身只有一列的数据框添加了一列值都为male的数据。

  11. 按行合并两个数据框 rbind(data1,data2)

  12. ggplot2 画直方图用密度函数来画要加上geom_histogram(stat='density') ,分面用facet_gride( )括号里放分面参数。

  13. length( )的括号里必须是向量,统计里面有多少个数

  14. gl()函数,gl(2,5)生成具有两个因子水平,每个因子水平重复5次的因子。
    class()查看第一层类别,mode()查看第二层类别,typeof()查看第三层类别。

    类别

  15. 检验数据是否符合正态分布,三种检验方法:

  • qq图
qqnorm(data1[,1])#先生成一系列点
qqline(data1[,1],col='darkred')#看点是否在线上
  • 夏皮罗威克尔检验
shapiro.test(sample(data1[,1],5000))

这个检验最多只能用5000个数据,所以只能取样。


夏皮罗威克尔检验

p值>0.05即有效,符合正态分布

  • KS检验
ks.test(
  data1[,1],
  rnorm(10000,mean=mean(data1[,1]),sd=sd(data1[,1]))
)

将原数据与以原数据的平均数为值,标准差为值的一组随机正态分布数作比较。


ks检验

也是p值>0.05即可。

  1. 正态分布的四个函数应用。
#关于正态分布的4个函数及其应用
#由已知的正态分布总体来分析个体
#已知某大学男性毕业生收入的均值为7000,标准差为2000,求:
#1.1若甲同学的收入大于80%的人,那么他的收入是多少呢?(由概率求值问题)
qnorm(0.8,mean=7000,sd=2000)

#1.2乙同学收入为8500左右的概率是多少?(点概率问题)
dnorm(8500,mean=7000,sd=2000)

#1.3已知丙同学的收入为9000,他的收入会比百分之多少的人高?(区间概率问题)
pnorm(9000,mean=7000,sd=2000)
计算题
  1. 一般正态分布转换成标准正态分布
    若随机变量X~N(\mu,\sigma),则有Z=X-\mu\over \sigma~N(0,1)

  2. 因子factor可以看成是分类变量,转化成因子factor()

Grade <- c('Low','Medium','High')
Grade.f <- factor(Grade,order=T,levels=c('Low','Medium','High'))
因子
  1. 转化成字符串as.character( ),转化成数值型as.numeric( )

  2. 导入数据,File>Import Dataset>选择类型

  3. which函数的应用,用于条件的筛选

a <- c(12,34,56,86,11,16)
which(a>30)
返回位数,所在位置
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容

  • R中常见函数 1、对行和列进行操作的函数: •对矩阵或数据框的行和列调用函数:apply(矩阵/数组,1,func...
    苹果皮好多皮阅读 486评论 0 0
  • --title: R语言中dnorm, pnorm, qnorm与rnorm以及随机数date: 2018-09-...
    backup备份阅读 67,121评论 1 29
  • 20171205(从有道迁移) 高级数据管理 示例问题:给所有学生确定一个单一的成绩衡量指标,需要将这些科目的成绩...
    KrisKC阅读 450评论 0 0
  • 刘小泽写于18.8.29-30 R函数是什么? 其实就是对一些编程语言的封装,编写函数可以减少重复代码的书写,让R...
    刘小泽阅读 3,252评论 0 6
  • 鲁迅先生对于中医的态度我始终很纳闷。虽说暇不掩玉,但以他的地位与声望,对于中医的伤害是显而易见的。现代所谓...
    花痴_halou阅读 944评论 5 4