Day 6 by 姜哥

关于如何设置下载R包的镜像

R的配置文件是 .Rprofile。在刚开始运行Rstudio的时候,程序会查看许多配置内容,其中一个就是.Renviron,它是为了设置R的环境变量(这里先不说它);而.Rprofile就是一个代码文件,如果启动时找到这个文件,那么就替我们先运行一遍(这个过程就是在启动Rstudio时完成的)
(相当于Linux里的.bashrc文件)

file.edit('~/.Rprofile')
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像

不过我试了一下我的RStudio好像不需要

然后来用iris这个数据试一下

iris

1.mutate(),新增列

mutate(test, new = Sepal.Length * Sepal.Width)

2.select(),按列筛选
(1)按列号筛选

select(test,1)

select(test,c(1,5))

select(test,Sepal.Length)

(2)按列名筛选

select(test, Petal.Length, Petal.Width)

3.filter()筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
5.summarise():汇总

管道操作 %>% (cmd/ctr + shift + M)

count统计某列的unique值

test %>% 
  group_by(Species) %>% 
  summarise(mean(Sepal.Length), sd(Sepal.Length))
count(test,Species)

处理

连接两个表

options(stringsAsFactors = F)

test1 <- data.frame(x = c('b','e','f','x'), 
                    z = c("A","B","C",'D'),
                    stringsAsFactors = F)
test2 <- data.frame(x = c('a','b','c','d','e','f'), 
                    y = c(1,2,3,4,5,6),
                    stringsAsFactors = F)

inner_join,取交集
左连left_join
全连full_join
半连接:返回能够与y表匹配的x表所有记录semi_join
反连接:返回无法与y表匹配的x表的所记录anti_join
简单合并 bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容