第一部分第5章 高级数据管理

5.1 一个数据处理难题

5.2 数值和字符处理函数

5.2.1 数学函数

数学函数

函数 描述
abs(x) 绝对值abs(-4)返回值为4
sqrt(x) 平方根sqrt(25)返回值为5
ceiling(x) 不小于x的最小整数
floor(x) 不大于x的最大整数
trunc(x) 向0的方向截取的x中的整数部分
round(x, digits=n) 将x舍入为指定位的小数
signif(x, digits=n) 将x舍入为指定的有效数字位数
cos(x),sin(x),tan(x) 余弦、正弦和正切
acos(x),asin(x),atan(x) 反余弦、反正弦和反正切
cosh(x),sinh(x),tanh(x) 双曲余弦、双曲正弦和双曲正切
acosh(x),asinh(x),atanh(x) 反双曲余弦、反双曲正弦和反双曲正切
log(x, base=n) 对x取以n为底的对数
log10(x) log(x)为自然对数,log10(x)为常用对数
exp(x) 指数函数

5.2.2 统计函数

统计函数

函数 描述
mean(x) 平均数
median(x) 中位数
sd(x) 标准差
var(x) 方差
mad(x) 绝对中位差
quantile(x,probs) 求分位数,probs[0,1]
range(x) 求值域
sum(x) 求和
diff(x,lag=n) 滞后差分
min(x) 求最小值
max(x) 求最大值
scale(x, center=TRUE, scale=TRUE) 为数据对象x按列进行中心化或标准化

5.2.3 概率函数

d = density 密度函数
p = probabilty 分布函数
q = quatile function 分位数函数
r = random 生成随机数
概率分布

分布名称 缩写 分布名称 缩写
Beta分布 beta Logistic分布 logis
二项分布 binom 多项分布 multinom
柯西分布 cauchy 负二项分布 nbinom
卡方分布 chisq 正态分布 norm
指数分布 exp 泊松分布 pois
F分布 f Wilcoxon符号秩分布 signrank
Gamma分布 gamma t分布 t
几何分布 geom 均匀分布 unif
超几何分布 hyper Weibull分布 weibull
对数正态分布 lnorm Wilcoxon秩和分布 wilcox

5.2.4 字符处理函数

字符处理函数

函数 描述
nchar(x) 计算x中的字符数量
substr(x, start, stop) 提取或替换一个字符向量中的子串
grep(pattern, x, ignore.case=FALSE, fixed=FALSE) 在x中搜索某种模式,pattern为正则表达式
sub(pattern, replacement,x, ignore.case=FALSE, fixed=FALSE) 在x中搜索pattern,并以replacement将其替换。
strsplit(x, split, fixed=FALSE) 在split处分割字符向量x中的元素
paste(..., sep=" ") 连接字符串,分隔符为sep
toupper(x) 大写转换
tolower(x) 小写转换

5.2.5 其他实用函数

函数 描述
length(x) 对象x的长度
seq(from, to, by) 生成一个序列
rep(x,n) 将x重复n次
cut(x,n) 将连续型变量x分割为有着n个水平的因子
pretty(x,n) 创建美观的分割点,绘图中常用
cat(... , file ="myfile", append=FALSE) 连接...中的对象,并将其输出到屏幕上或文件中

5.2.6 将函数应用于矩阵和数据框

apply()函数:可将一个任意函数“应用”到矩阵、数组、数据框的任何维度上。
使用格式为:apply(x, MARGIN, FUN, ...)
x=数据对象,MARGIN是维度下标,FUN是由指定的函数

5.3 数据处理难题的一套解决方案

5.4 控制流

正常情况,R程序中的语句都是从上至下顺序执行的,但有时想重复执行某些语句---控制流发挥作用

  • 语句statement: 是一条单独的R语句或一组复合语句
  • 条件cond:是一条最终被解析为TRUE or FALSE的表达式
  • 表达式expr:是一条数值或字符串的求值语句
  • 序列seq:是一个数值或字符串序列

5.4.1 重复和循环

循环结构重复地执行一个或一系列语句,知道某个条件不为真为止。

  • for结构:for循环重复地执行一个语句,直到某个变量的值不再包含在序列seq中为止。for (var in seq) statement
    eg. for (1 in 10) print ("Hello")
  • while结构: while循环重复地执行一个语句,直达条件不为真为止。while (cond) statement
    eg. i <- 10
    while (i>0) {print ("Hello"); i <- i-1)

5.4.2 条件执行

  • if-else结构
    if (cond) statement
    if (cond) statement1 else statement2
  • ifelse结构
    ifelse (cond, statement1, statement2)
  • switch结构
    switch(expr, ...)

5.5 用户自编函数

myfunction <- function (arg1, arg2, ...) {
statements
return(object)
}

5.6 整合与重构

5.6.1 转置 t()

5.6.2 整合数据 aggregate(x, by, FUN)

5.6.3 reshape2包

reshape2包是一套重构和整合数据集的绝妙的万能工具。
数据融合melt
数据重铸cast

5.7 小结

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335