安装和加载R包
1.镜像设置
[1]R的配置文件 .Rprofile
a 用file.edit()来编辑文件:file.edit('~/.Rprofile')
b 添加options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
#对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
#对应中科大源 两行代码
c 保存=》重启Rstudio,这时你再运行一下:options()$repos
和options()$BioC_mirror
就发现已经配置好了
options函数就是设置R运行过程中的一些选项设置
2 安装
install.packages(“包”)#CRAN网站
BiocManager::install(“包”)#Biocductor
3.加载
library(包)
require(包)
运行install.packages("dplyr")
载入程辑包:‘dplyr’
library(dplyr)
dplyr五个基础函数
示例数据test <- iris[c(1:2,51:52,101:102),]
1.mutate(),新增列
2.select(),按列筛选
(1)按列号筛选
(2)按列名筛选
3.filter()筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)
#默认从小到大排序arrange(test, desc(Sepal.Length)
)#用desc从大到小
5.summarise():汇总
结合group_by使用实用性强
summarise(test, mean(Sepal.Length), sd(Sepal.Length))
# 计算Sepal.Length的平均值和标准差先按照Species分组,计算每组Sepal.Length的平均值和标准差
dplyr两个实用技能
1:管道操作 %>% (cmd/ctr + shift + M)
2:count统计某列的unique值
dplyr处理关系数据
1.內连inner_join,取交集
2.左连left_join
3.全连full_join
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所记录anti_join
6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
-
(Rstudio最重要的两个配置文件:在刚开始运行Rstudio的时候,程序会查看许多配置内容,其中一个就是.Renviron,它是为了设置R的环境变量;而.Rprofile就是一个代码文件,如果启动时找到这个文件,那么就替我们先运行一遍(这个过程就是在启动Rstudio时完成的) ↩