学习小组Day6笔记--edo

一、设置默认镜像

file.edit('~/.Rprofile')

# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像

保存 =》问题:这个键找不到?不会保存
options()$repos
options()$BioC_mirror #确认设置是否成功

二、加载R包

1.library(dplyr)
2.dplyr常用函数

mutate 添加新的列
select 按列筛选(按列数或者列名)
filter 筛选行
arrange 按某1列或某几列对整个表格进行排序,默认从小到大排序,desc()从大到小
summaris 对数据进行汇总操作,结合group_by使用实用性强
管道操作 %>% (cmd/ctr + shift + M)
count count统计某列的unique值

3.将2个表进行连接,注意:不要引入factor,options(stringsAsFactors = F)
4.dplyr处理关系数据
1)內连inner_join,取交集 inner_join(test1, test2, by = "x") 2)左连left_join 3)全连full_join 4)半连接:返回能够与y表匹配的x表所有记录semi_join 5)反连接:返回无法与y表匹配的x表的所记录anti_join 6)简单合并,在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容