R语言基础3--tidyverse包总结


R语言基础系列:


tidyverse是一组处理与可视化R包的集合,它们共享通用数据表示和API设计。
tidyverse中的包修改的相当频繁,可以通过运行tidyverse_update()函数来检查是否有更新,并选择是否更新。

library(tidyverse) #单个命令加载了几十个包
tidyverse_packages(include_self = TRUE) #查看其中的包
 [1] "broom"         "cli"           "crayon"        "dbplyr"        "dplyr"        
 [6] "dtplyr"        "forcats"       "googledrive"   "googlesheets4" "ggplot2"      
[11] "haven"         "hms"           "httr"          "jsonlite"      "lubridate"    
[16] "magrittr"      "modelr"        "pillar"        "purrr"         "readr"        
[21] "readxl"        "reprex"        "rlang"         "rstudioapi"    "rvest"        
[26] "stringr"       "tibble"        "tidyr"         "xml2"          "tidyverse"   
核心包 功能
ggplot2 可视化数据
dplyr 数据操作语法,可以用它解决大部分数据处理问题
tidyr 清理数据
readr 读入表格数据
purr 提供一个完整一致的工具集增强R的函数编程
tibble 新一代数据框
stringr 提供函数集用来处理字符数据
forcats 提供有用工具用来处理因子问题

常见功能及对应的包和函数

1. 数据导入
  • readr:read_csv(), read_tsv(), read_delim()
  • readxl:read_xls(), read_xlsx()
  • haven:打开SAS 、SPSS、Stata等外部数据
  • BDI:定义R和数据库管理系统(DBMS)之间的通用接口
  • httr:httr的目的是为curl包提供一个包装器,根据现代Web API的需求进行定制
  • jsonlite:针对统计数据和Web优化的快速JSON解析器和生成器
  • rvest:rvest帮助从网页中获取信息
  • xxxml2:用于XML

⚠️:read.table()是R自带的,而read_table()是readr包有的

2. 数据整理
  • tibble:对data.frame的改进
  • tidyr:清洗数据
3. 数据转换
  • dplyr:处理数据
  • lubridate:处理时间数据
  • stringr:处理字符串类型
  • forcats:处理因子变量
4. 数据可视化
  • ggplot2:高级数据可视化
5. 编程
  • magrittr:使代码更具可读性的管道
  • purr:通过提供一些完整连贯用于函数和向量的工具集,增强R的函数编程
6. 处理特定数据格式
  • hms:轻松阅读时间
7. 建模
  • modelr:提供的功能可以帮助我们在建模时创建优雅的管道
  • broom:轻松地将模型提取为整洁的数据
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

推荐阅读更多精彩内容