学习R包
先上思维导图
思维导图.png
配置镜像
配置镜像.png
编辑配置文件
file.edit('~/.Rprofile')
在新建的脚本窗口中添加这两行代码
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
在控制台输入options()$repos
和options()$BioC_mirror
检查是否配置成功
安装R包
install.packages(“包”)
BiocManager::install(“包”)
加载包
library(包)
require(包)
dplyr五个基础函数
1.mutate()
,新增列
.2.select()
,按列筛选
列号select(test,1)
多个列select(test,c(1,5))
列名select(test,Sepal.Length)
3.filter()
筛选行
4.arrange()
,按某1列或某几列对整个表格进行排序
5.summarise()
:汇总
dplyr两个实用技能
1:管道操作 %>% (cmd/ctr + shift + M):就是把第一个命令的结果作为第二个命令的输入
2:count()
统计某列的unique值
dplyr处理关系数据
stringsAsFactors = F意味着,“在读入数据时,遇到字符串之后,不将其转换为factors,仍然保留为字符串格式”。
1.內连inner_join,取交集
2.左连left_join()
3.全连full_join()
4.半连接:返回能够与y表匹配的x表所有记录semi_join()
5.反连接:返回无法与y表匹配的x表的所记录anti_join()
6.简单合并:bind_rows()
bind_cols()
连接两个列需要行数相同.png
总结
学会了配置镜像,加速包的下载。
学会了dplyr包的5个基础函数。
学会了管道操作,就像水管一样一个接着一个地把结果作为下一条命令的输入。
比较难理解的就是连接关系数据。