第五章高级数据管理

#5高级数据管理

y<-data.frame(name=character(0),math=numeric(0),science=numeric(0),english=numeric(0))

mydata<-edit(y)

mydata

#5.2数值和字符处理函数

#5.2.1数学函数

#5.2.2统计函数

dada<-scale(mydata)#数据标准化

#5.2.3概率函数

set.seed()#设定随机种子

runif(5)#生成服从正态分布的伪随机数

#生成服从多元正太分布的数据

library(MASS)

options(digits=3)

set.seed(1234)

mean<-c(230.7,146.7,3.6)

sigma <- matrix(c(15360.8,6721.2,-47.1,

6721.2,4700.9,-16.5,

-47.1,-16.5,0.3),nrow=3,ncol=3)

mydata<-mvrnorm(500,mean,sigma)

mydata<-as.data.frame(mydata)

names(mydata)<-c("y","x1","x2")

dim(mydata)

head(mydata,n=10)

#5.2.4字符处理函数

#5.2.5其他实用函数

#5.2.6将函数应用于矩阵和数据框

#将函数应用于数据对象

a<-5

sqrt(a)

b<- c(1.243,5.654,2.99)

round(b)

c<-matrix(runif(12),nrow=3)

c

log(c)

mean(c)

#将一个函数应用到矩阵的所有行或列中

mydata<-matrix(rnorm(30),nrow=6)

mydata

apply(mydata,1,mean)#计算每行平均值

apply(mydata,2,mean)#计算每列平均值

apply(mydata,2,mean,trim=0.2)#计算每行平均值

#5.3数据处理难题的一套解决方案

options(digits=2)

setwd("e:/r")

library(xlsx)

student<-read.xlsx("student.xlsx",1)

student

roster<-data.frame(student,math,science,english,

stringAsFactor=FASLE)

z<-scale(#未完)


5-6

options(digits=2)

student<-c("J D","A W","B M",

"D J","J M","C C",

"R Y","G K","J E",

"M R")

math<-c(502,600,412,358,495,512,410,625,573,522)

science<-c(95,99,80,82,75,85,80,95,89,86)

english<-c(25,22,18,15,20,28,15,30,27,18)

roster<-data.frame(student,math,science,english,stringAsFactors=FALSE)

z<-scale(roster[,2:4])

score<-apply(z,1,mean)

roster<-cbind(roster,score)

y<-quantile(score,c(.8,.6,.4,.2))

roster$grade[score>=y[1]]<-"A"

roster$grade[score<y[1]&score>=y[2]]<-"B"

roster$grade[score<y[2]&score>=y[3]]<-"C"

roster$grade[score<y[3]&score>=y[4]]<-"D"

roster$grade[score<=y[4]]<-"F"

roster

class(roster$student)

roster$student<-as.character(roster$student)

name <- strsplit((roster$student)," ")#roster$student必须是字符变量才能用strsplit?

LN<-sapply(name, "[",2)

FN<-sapply(name, "[",1)

roster<-cbind(FN,LN,roster[,-1])

roster<-roster[order(LN,FN),]

roster



#5.4控制流

#5.4.1重复和循环

for( i in 1:10) print("H")

i<-10

while(i>0) {print("h");i<- i-1}

#5.4条件执行

#5.4.1 if-else

attach(roster)

if(is.character(math)) math<-as.factor(math)

if(!is.character(LN)) math<-as.factor(LN)else print("gggg")

#5.4.2 ifelse,二元,输入输出均为向量时

attach(roster)

ifelse(score>0.5,print("P"),print("f"))

outcome<-ifelse(score>0.5,"P","f")

5.4.3switch

feelings<-c("s","a")

for(i in feelings)

print(

switch(i,

h="iii",

a="tttt",

s="ccc",

a="ccc"))

#5.5用户自编函数

mystats<-function(x,parametric=TRUE,print=FALSE){

if(parametric){center<-mean(x);spread<-sd(x)

}else{

center<-median(x);spread<-mad(x)

}

if(print&parametric){

cat("mean=",center,"\n","sd=",spread,"\n")

}else{

cat("median=",center,"\n","mad=",spread,"\n")

}

result<-list(center=center,spread=spread)

return(result)

}

#验证

set.seed(1234)

x<-rnorm(500)

y<-mystats(x,parametric=TRUE,print=FALSE)

#自编函数2

mydate<-function(type="long"){

switch(type,

long=format(Sys.time(),"%A %B %d %Y"),

short=format(Sys.time(),"%m-%d-%y"),

cat(type,"is not a recognizede type\n"))}

mydate("long")

mydate("short")

mydate()

mydate("dvsdf")

5.6整合和重构

5.6.1转置

cars<-mtcars[1:5,1:4]

cars

t(cars)

5.6.2整合数据

options(digits=3)

attach(mtcars)

mtcars

aggdata<-aggregate(mtcars,by=list(cyl,gear),FUN=mean,na.rm=TRUE)

aggdata

5.6.3reshape包融合和重铸melt,dcast

library(reshape2)

md<-melt(mydata,id=c("id,time"))

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,402评论 6 499
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,377评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,483评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,165评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,176评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,146评论 1 297
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,032评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,896评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,311评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,536评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,696评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,413评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,008评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,659评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,815评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,698评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,592评论 2 353

推荐阅读更多精彩内容