一 .什么是R,R studio,R包
- R是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能
- Rstudio是R语言的集成开发环境(Integrated Development Environment)。 相对于R,R studio界面更人性化(必须先装R,才能使用RStudio)
-
R包是R的扩展,相当于把R的函数进行打包用于实现某种特定目的。通过利用已有的R包你可以更快更简单的实现自己的目的,而不需要用R语言一点点编写完成自己的目的。
二. R,R studio 的安装
三 . R的使用
1.R studio的外观设置
Tools--Global Options--Appearance
数据处理
2.R studio界面介绍
2.1脚本编辑区
- 功能键
Save:保存
放大镜:查询替换
荧光棒:代码工具
笔记本:脚本编辑报告
Run:运行
Re-run:再运行 - 快捷键
新建脚本:Ctrl+Shift+C
编辑代码
运行所有/指定代码:Ctril+Shift+Enter/Ctril+Enter
补全:Tab
选择替换:Ctrl+F
赋值:Alt+-
- 2控制台(Console)
功能键
箭头:曾用工作目录
扫帚:清空控制台快捷键
中断:Esc
全部清空:Ctrl+L
上下条历史命令:上/下箭头
2.3 工作空间(Workspace)和历史(History)窗口
- Environment: 查看变量
- History: 历史代码
- 画图和帮助窗口
- Files:工作目录和文件
- Plot:图片查看与输出
- Package:R包
- Help: 帮助文档
二. 基本函数
1.管理工作目录
设置保存文件夹:set("文件夹路径")
查看保存文件夹:getwd()
对于多个并行项目可以新建new project
2.显示文件列表
dir ()
list.file()
3.赋值:
将x定义为由元素1,2,3组成的向量 : x<- c(1,2,3)
1-10之间所有的整数: x<- 1:10
1-10之间每隔0.5取一个数: x<- seq(1,10,by = 0.5)
1-3 重复2次: x<- rep(1:3,times=2)
4.删除变量
单一:rm()
多个:rm(a,b)
5.列出历史记录
所有:history()
指定数量:history(n)
三. 数据类型
1.向量;一维
#提取元素
#根据元素位置
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
#根据值
x[x==10]#等于10的元素
x[x<0] #小于0的元素
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
2.矩阵:二维,多个长短,类型均相同的向量
3.数据框:多个长短,类型均可不同的变量,比如表格
#设定工作目录(见基本函数)
#读取数据
read.table/csv/...( )
file:文件的相对路径或者绝对路径,Windows下路径要用/或\\
sep:分隔符,默认为空格。可以设置为',',';'和制表符(tab)
header:设置为T时第一行作为列名
如果数据集中含有中文,加上参数fileEncoding='utf-8'
Excel表格未转化成csv格式,可以安装readxl包,read_excel()
# 提取行,列名
colnames(X) #查看列名
rownames(X) #查看行名
colnames(X)[1]<-"A"#修改第一列名为A
# 提取元素,X为变量名
X[x,y]#第x行第y列
X[x,]#第x行
X[y]或X[,y]#第y列
X[a:b]#第a列到第b列
X[c(a,b)]#第a列和第b列
X$列名#也可以提取列
# 数据框导出
write.table(X,file = "yu.txt",sep = ",",quote=F)
X:需要导出的数据
file:导出的文件路径
sep:分隔符,默认为空格(" "),也就是以空格为分割列
row.names:是否导出行序号,默认为TRUE,也就是导出行序号
col.names:是否导出列名,默认为TRUE,也就是导出列名
quote:字符串是否使用引号表示,默认为TRUE,也就是使用引号表示
# 保存及重新加载
save.image(file="A.RData")#保存当前所有变量,格式为R.data
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
四.R 包安装加载
-
设置镜像
1.1 新建R的配置文件:file.edit('~/.Rprofile')
1.2 运行:options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) 清华源或options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源,然后保存并重启Rstudio。
1.3 查看镜像来源:options() $ repos/BioC_mirror
-
安装加载R包
安装:install.packages("包")
加载: library(包) 数据处理之dplyr包
相信我,这是全网最详细的dplyr教程