一、设置默认镜像
file.edit('~/.Rprofile')
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像
保存 =》问题:这个键找不到?不会保存
options()$repos
options()$BioC_mirror
#确认设置是否成功
二、加载R包
1.library(dplyr)
2.dplyr常用函数
mutate | 添加新的列 |
---|---|
select | 按列筛选(按列数或者列名) |
filter | 筛选行 |
arrange | 按某1列或某几列对整个表格进行排序,默认从小到大排序,desc()从大到小 |
summaris | 对数据进行汇总操作,结合group_by使用实用性强 |
管道操作 | %>% (cmd/ctr + shift + M) |
count | count统计某列的unique值 |
3.将2个表进行连接,注意:不要引入factor,options(stringsAsFactors = F)
4.dplyr处理关系数据
1)內连inner_join,取交集 inner_join(test1, test2, by = "x") 2)左连left_join 3)全连full_join 4)半连接:返回能够与y表匹配的x表所有记录semi_join 5)反连接:返回无法与y表匹配的x表的所记录anti_join 6)简单合并,在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数