R包
1.镜像配置
高级模式
file.edit('~/.Rprofile')
添加:
options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))
options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
保存,重启Rstudio
再运行:options()$repos和options()$BioC_mirror 就已经配置好了
2.安装加载三部曲
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr") #安装包存在CRAN用这个
BiocManager::install(“dplyr”) #安装包存在Biocductor用这个
library(dplyr) #或者require(包)
3.dplyr五个基础函数
1.mutate(),新增列
2.select(),按列筛选
(1)按列号筛选
举个例子
(2)按列名筛选
举个例子
3.filter()筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
举个例子
PS:desc是降序排列(即从大到小排列)
5.summarise():汇总
举个例子
4.dplyr两个实用技能
管道操作 %>% (cmd/ctr + shift + M)
加载任意一个tidyverse包即可用管道符号
count统计某列的unique值
5. dplyr处理关系数据
1.內连inner_join,取交集
2.左连left_join
3.全连full_join
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所记录anti_join
6.简单合并
bind_rows() #函数需要两个表格列数相同
bind_cols() #函数则需要两个数据框有相同的行数
举个例子
总结
安装包时出现了问题,很蠢的问题,被一起学习的小伙伴提醒,瞬间找到问题所在,感谢小伙伴!学到点点R包的基础,感觉也很有用,加油学习!