2020-05-16

Day-6 lzyazcr

R语言的第三天

镜像配置

options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") 

R包安装

install.packages("dplyr")

R包加载

library(dplyr)

简版iris数据集:

Iris :鸢尾花数据集,包含 3 类共 150 条记录,每类各 50 个数据,每条记录都有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度,可以通过这4个特征预测鸢尾花卉属于(iris-setosa, iris-versicolour, iris-virginica)中的哪一品种

test <- iris[c(1:2,51:52,101:102),]

两个小技巧

1:管道操作 %>% (cmd/ctr + shift + M)(加载任意一个tidyverse包即可用管道符号)

test %>% 
  group_by(Species) %>% 
  summarise(mean(Sepal.Length), sd(Sepal.Length))

减少工作量,简化代码,必备R包:magrittr

2:count统计某列的unique值

count(test,Species)

unique值:返回参数数组中所有不同的值,并按照从小到大排序

数据关系处理.png

dplry五种常用函数.png
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容