学习小组Day6笔记--WQQ

2022.8.17 R包.png

R包

1 安装和加载

  • CRAN镜像是R默认使用的R包仓库,install.packages()只能用于安装发布在CRAN上的包。
  • Bioconductor是基因组数据分析相关的软件包仓库。
  • 一次性配置好镜像源
    (1)file.edit('~/.Rprofile')
    (2)保存——直接使用即可
    image.png
  • install.packages(“包”)R包安装
  • BiocManager::install(“包”)Biocductor安装
  • 调用:library(包) require(包)
    eg:dplyr包:数据分析包

dplyr五个基础函数

test <- iris[c(1:2,51:52,101:102),]

image.png

  • mutate(test, *new* =*A+B*)新增列
    image.png
  • select(test,*1*)筛选列
    image.png
  • 筛选行:filter(test, Species == "setosa")
    filter(test, Species %in% c("setosa","versicolor"))
    image.png
  • arrange(test, Sepal.Length) 按某1列或某几列对整个表格进行排序
    image.png
  • summarise()汇总
    image.png

    image.png

dplyr两个实用技能

1 %>% 管道操作 (cmd/ctr + shift + M)将上一个函数结果作为下一个函数的第一个参数

2 count(test,Species)统计某列的unique值

dplyr处理关系数据

eg:
image.png

1 inner_join(test1, test2, by = "x")內连inner_join,取交集(test1和2均有“x”,所以等值连接把两张表里x相同的连接起来)

image.png

2 left_join(test1, test2, by = 'x')左连left_join(test1的左为左,test2右为右,保留test1左侧x所有,对应test2补上,没有的天NA)

image.png

3 full_join( test1, test2, by = 'x')全连full_join

image.png

4 semi_join(x = test1, y = test2, by = 'x')半连接:返回能够与y表匹配的x表所有记录semi_join

image.png

5 anti_join(x = test2, y = test1, by = 'x')反连接:返回无法与y表匹配的x表的所记录anti_join

6 简单合并:bind_rows(test1, test2)两个表格列数相同;

bind_cols(test1, test3)两个数据框有相同的行数

image.png

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。