R数据科学day2-4

  • 分组新变量

用到的变量有:select(),mutate(),summarize(),filter()。组合使用。

  1. 找出每组中最差的成员
flights_sml %>% 
  group_by(year, month, day) %>%
  filter(rank(desc(arr_delay)) < 10)

注:<10的意思不是值,而是个数,是选择每天延误时间最长的10趟航班。

  1. 找出大于某个阈值的所有分组:
popular_dests <- flights %>%
group_by(dest) %>%
filter(n() > 365)
popular_dests

dest=77

  1. 筛选延误的航班,添加新变量,并显示指定列。
  filter(arr_delay > 0) %>% 
  mutate(prop_delay = arr_delay / sum(arr_delay)) %>% 
  select(year:day, dest, arr_delay, prop_delay)

工作流:脚本

image.png

编辑器用来修改脚本,不要在控制台输入。使用组合键Ctrl+Shift+N创建新脚本。

当退出RStudio 时,它会自动保存编辑器中的内容,并在重新打开时自动加载编辑器中的内容。
尽管如此,我们还是应该定时保存脚本,并做好备份。

Ctrl+Enter。这组快捷键会在控制台中执行当前的R 语句
一次性运行整个脚本:Ctrl+Shift+S

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Eclipse常用快捷键 1几个最重要的快捷键 代码助手:Ctrl+Space(简体中文操作系统是Alt+/)快速...
    山不转人自转阅读 1,510评论 0 10
  • 搜索 Eclipse常用快捷键 编辑 查看 窗口 导航 文本编辑 文件 项目 源代码 运行 重构 其他Eclips...
    CarlosLynn阅读 1,768评论 0 7
  • 工欲善其事必先利其器,作为PC客户端开发,Visual Studio是我们每天都要使用的开发工具,IDE提供了非常...
    小猪啊呜阅读 4,710评论 1 10
  • 1. ctrl+shift+r:打开资源 这可能是所有快捷键组合中最省时间的了。这组快捷键可以让你打开你的工作区中...
    微扬轻轻语阅读 847评论 1 7
  • 主啊,我们永恒的父。 在祢的庇佑下,又走过了一年,籍着圣灵的指引,我们再次领悟了生命的真谛,找到了明确不变的目标,...
    科技驿站阅读 300评论 0 0