R和Rstudio介绍
R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点:
-
完全免费、开源
-
可编程语言
可以编写自己的函数来扩展现有的语言,比SPSS、SAS等统计软件跟新快的多大多数最新的统计方法可以在R中实现 -
具有很强的互动性
除了图形输出是在另外的窗口处,它的输入输出窗口都是在同一个窗口进行的,输入语法中如果出现错误会马上在窗口口中得到提示。输出的图形可以直接保存为JPG,BMP,PNG等图片格式,还可以直接保存为PDF文件。另外,和其他编程语言和数据库之间有很好的接口
安装
之前已经安装,在此不再赘述。注意用户名要改为英文,不然会很麻烦。
R的基本设置
工作界面
脚本编辑器script | environment(对象/变量列表);history |
---|---|
控制台console(脚本运行结果显示) | 文件、图像结果、帮助、包 |
外观设置
在appearance中可以设置字体、大小、主题、控制台颜色等
R project管理工作目录
所谓工作目录就是默认的读取和储存位置,也就是说,R语言只能和文件夹进行互动,这个文件夹非常重要,做不好就会导致你的脚本、文件、图片各种乱跑,找不到(转自生信星球)
可参考Rproject
当需要进行很多不同的项目的时候,可以用多个project来管理
R基本操作
tab
快捷键可以帮助一键补全可能的命令
↑
可以快速复制上一命令行
dir()
查看目录中有哪些项目
list()
查看目录中有哪些对象
dir()
[1] "test.Rproj"
list.files()
[1] "test.Rproj"
> 1+3
[1] 4
<-
赋值符号,将后面的数值赋予前面的变量,和“=”一样,但是一般不用“=”
==
判断是否相等,返回一个布尔值,如果相等就返回“TRUE”,不相等就返回“FALSE”
> x<-2
> x
[1] 2
> a=3
> a==3
[1] TRUE
ls()
变量都被储存在ls()这个列表中
> ls()
[1] "a" "x"
rm
删除变量
rm(list=(ls())
删除所有变量
>rm(x)
> x
Error: object 'x' not found
> rm(list=ls()) #清除列表中所有变量
> ls()
character(0)
history()
查看历史记录,也就是右上方的工作窗口
ctrl+l
清空控制台
plot(rnorm(50))
R语言中的runif()函数用于生成从0到1区间范围内的服从正态分布的随机数,每次生成的值都不一样;set.seed()用于生成随机数的种子元素,两个函数配合起来发挥作用
还可以根据自己的需要修改参数
> plot(rnorm(50),xlab="x",ylab="y",col=c("blue"),cex=0.5,pch=5)
x轴名称为x,y轴名称为y,图像颜色为blue,散点大小为默认的50%
boxplot(iris$Sepal.Length~iris$Species,col = c("lightblue","lightyellow","lightpink"))
横轴名称为iris$Sepal.Length,纵轴名称为iris$Species,颜色按顺序为浅蓝、浅黄、浅粉(如果图像个数多于颜色个数,则会按照颜色顺序进行循环使用)
(这里使用了反转义符号\$
来消除$
的作用)
更多关于ggplot2的基础使用,可以见详解ggplot2