
2022.8.17 R包.png
R包
1 安装和加载
- CRAN镜像是R默认使用的R包仓库,install.packages()只能用于安装发布在CRAN上的包。
- Bioconductor是基因组数据分析相关的软件包仓库。
- 一次性配置好镜像源
(1)file.edit('~/.Rprofile')
(2)保存——直接使用即可image.png -
install.packages(“包”)R包安装 -
BiocManager::install(“包”)Biocductor安装 - 调用:
library(包)require(包)
eg:dplyr包:数据分析包
dplyr五个基础函数
test <- iris[c(1:2,51:52,101:102),]

image.png
-
mutate(test, *new* =*A+B*)新增列
image.png -
select(test,*1*)筛选列
image.png - 筛选行:
filter(test, Species == "setosa")
filter(test, Species %in% c("setosa","versicolor"))image.png -
arrange(test, Sepal.Length)按某1列或某几列对整个表格进行排序
image.png -
summarise()汇总
image.png
image.png
dplyr两个实用技能
1 %>% 管道操作 (cmd/ctr + shift + M)将上一个函数结果作为下一个函数的第一个参数
2 count(test,Species)统计某列的unique值
dplyr处理关系数据
eg:
image.png
1 inner_join(test1, test2, by = "x")內连inner_join,取交集(test1和2均有“x”,所以等值连接把两张表里x相同的连接起来)

image.png
2 left_join(test1, test2, by = 'x')左连left_join(test1的左为左,test2右为右,保留test1左侧x所有,对应test2补上,没有的天NA)

image.png
3 full_join( test1, test2, by = 'x')全连full_join

image.png
4 semi_join(x = test1, y = test2, by = 'x')半连接:返回能够与y表匹配的x表所有记录semi_join

image.png
5 anti_join(x = test2, y = test1, by = 'x')反连接:返回无法与y表匹配的x表的所记录anti_join

6 简单合并:bind_rows(test1, test2)两个表格列数相同;
bind_cols(test1, test3)两个数据框有相同的行数

image.png






