今日学习的是R语言基础,由于之前了解过R语言, 已经安装上RStiudo,安装过程就省略掉。(安装很久过程已经忘记了)
学习R语言首先要了解R语言是什么
R语言在生信分析中常用的是画图软件,但是R语言是统计分析和绘图非常强大的工具,可以对数据进行分析处理制图等。
RStudio是r的集成开发环境(IDE),它包括一个控制台、语法高亮显示编辑器,支持直接执行代码,以及绘图、历史记录、调试和工作空间管理工具。
简单相关函数的应用(要多查询,看到有个啥+()就查是干嘛的
- 使用rnorm()绘图(一般函数括号内就是参数设置对对象,函数套函数就是括号套括号,plot()也是一个函数,所以是plot(rnorm()))
rnorm()函数会随机正态分布,然后随机抽样 或者取值 n 次,而rnorm(50)
中的50是指50个随机数,符合正态分布。plot()函数是常用的绘图函数,可以绘制散点图曲线图等等。
plot(rnorm(50))
可以设置其参数,如rnorm(50,3,4)产生5个均值是3,方差是4的随机数
运行参数的时候也会出现报错,查看一下,发现应该是逗号出现问题,应该使用英文输入法下的逗号,而不是中文。改掉就可以出图了。
- 画箱线图,使用示例,boxpolt()是绘制箱线图的函数,用于展示数据的整体分布,包括是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。
boxplot(iris$Sepal.Length~iris$Species,col = c("lightblue","lightyellow","lightpink"))
iris是一个R语言自带的数据框,通常用作示例。iris$Sepal.Length表示iris数据框的Sepal.Length这一列数据。后面的是箱线图画图用的颜色。说明画箱线图是需要数据框的,那什么是数据框?
- 数据框是R中最常处理的数据结构,数据框不同的列可以包含不同模式(数值型、字符型等)的数据。
https://blog.csdn.net/weixin_41577291/article/details/79186924
work<-c(PE,Chinese,English)
work<-c('PE','Chinese','English')
Source<-c(85,95,60)
number<-data.frame(Day,work,Source)
number
-
<-
是赋值,相当于将work等定义,项、而work是被定义的对象,随便什么名字都可以,c()
函数: 将括号中的元素连接起来,并不创建向量,向量也是R中的一种数据类型。data.frame()
就是形成数据框
那如果想要知道一组数据是什么数据类型,比如想要知道是否是数据框还是向量?
可以使用
class()
查看数据的类型- 查看函数除了百度,还可以直接在R查阅使用方法
使用??+要查的函数
?? data.entry
- 设置字体的大小,选择最大的做了个比较(也可以改变颜色等等)
R语言的基本操作
- 用Rproject管理工作目录
https://mp.weixin.qq.com/s/G-LXN9P2HVLv9v0cvyFJMA
首先新建目录,建立时需要命名新的目录名字以及存放的位置
使用getwd()查看当前目录所在位置
- 查看文件列表,把那个查看目录中文件的多少
dir()
list.files()
write.table( number, "number.txt", sep="\t", quote = F, row.names = F, col.names = F )
number<-c(1,1,2,3,4)
write.table( number, "number.txt", sep="\t", quote = F, row.names = F, col.names = F )
dir()
list.files()
-
实现简单的运算
- 删除变量(跟linux的rm一样)(
rm(list=ls()
为清空所有变量)
- 查看历史命令
history()
-
清空ctrl+l