学习小组Day6笔记-- Joanna

"R包的安装"

  • 性价比高的配置Rstudio的下载镜像
    按照如下代码> options()repos options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源 options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源 保存之后,再检验 options()repos
    options()$BioC_mirror
    image.png

安装失败时,可在每次需要下载R包时运行这两句代码即可

测验数据


image.png

""dplyr五个基础函数""
1.mutate(),新增列


image.png

2.select(),按列筛选

  • 按列号筛选


    image.png

    image.png

    image.png
  • 按列名筛选


    image.png

    image.png

3.filter()筛选行


image.png

image.png

4.arrange(),按某1列或某几列对整个表格进行排序


image.png

5.summarise():汇总


image.png

对数据进行汇总操作,结合group_by使用实用性强
6.管道操作 %>% (cmd/ctr + shift + M)


image.png

(加载任意一个tidyverse包即可用管道符号)

7.count统计某列的unique值


image.png

8.dplyr处理关系数据

将2个表进行连接,注意:不要引入factor

  • 内连inner_join,取交集


    image.png
  • 左连left_join


    image.png
  • 全连full_join


    image.png
  • 半连接:返回能够与y表匹配的x表所有记录semi_join


    image.png
  • 反连接:返回无法与y表匹配的x表的所记录anti_join


    反连接
  • 简单合并

bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数


基本情况

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容