Basic R Knowledge

R主页:http://www.r.project.org/

R语言主页→software→package→可以下载多种R包

下载地址:http://mirror.bjtu.edu.cn/cran/

在R包页面下→CRAN→task views可以看到不同R包的分类→选择需要下载的R包→Windows binaries→r-release→下载(zip文件)

在R语言软件界面中,通过下拉菜单“程序包”→install package(s) from local files→读取已下载的R包。

下载R包还可以通过下拉菜单“程序包”→安装程序包→选择镜像“China(Beijing)”→选择要下载的package。

install.packages()命令也可以用于直接下载R包,如install.packages("ggplot2")。

安装完毕后使用library()打开该R包。

另外Rstudio为R的脚本编辑器(IDE)可以显示帮助文档,并实现语法高亮,下载主页为http://www.rstudio.com

当在Rstudio中输入?t.test并点回车后 ,在右侧会显示出t检验的帮助文档。

💡 在编程中,使用#作为注释符号

外部数据读取使用read.table()或read.csv()来进行,括号内的内容是字符形式的文件名(带后缀),使用header=T命令使每行首、每列首为名称

💡 quantile()函数用于计算括号中数字的倒数(或称分位数),也可计算矩阵或向量

<-符号用于将右边的值赋予左边(等于号

==符号具有作为数字运算中的等于涵义

比较运算符>  <  >=  <=  ==  !=

逻辑运算符!  &   &&  |  ||(非、和、或)

当给对象起名时不可以用数字开头。

对象类型=数值型+字符型+逻辑型(TURE或FALSE)+因子型

注:构建因子型变量可以使用factor()命令,格式为factor(x,levels=,labels=),levels为x的水平,默认情况下是x的非冗余结果,labels是赋予levels名称,默认情况下与levels一致。

eg:将几个人的成绩按照高低分为三个档次,编码如下:

test=c(96,56,68,93,36,84,64,72,58,90,32,50,58,96,88,64,72)

test=cut(test,breaks=3)   ###将数据切为三份(每份区间范围一致)

test.fact=factor(test,labels=c('small','middle','high'))

💡 字符型变量的创建必需用''''表示

对象类型=向量+数组+矩阵+列表(可以包含任何类型的对象)+数据框

向量的创建通过c()命令或:来创建,其中c()命令中character之间使用隔开,:符则用于创建递进的整数向量

eg:计算从-10到10所有整数的平方

x<- -10:10    ###x的类型为向量

y<- x^2

matrix()命令用于构建矩阵,括号内输入向量信息,通过ncol=以及nrow=来确定行数和列数另外也可以通过rownames()=和colnames()=命令来定义行和列的名称

如果想将两个矩阵横向整合,则使用cbind()函数。

cbind(matrix1,matrix2)

[]可以作为下标使用,在某个多元素对象后面加入[3],即可把该对象第三个元素输出;如果对象是矩阵或数据框,则可以使用[1,3]来输出第一行第三列的元素,若需要把所有行都输出,则可以省略

eg:as.matirx(example[,2:8])代表将example对象中的所有行2到8列输出为矩阵形式

data.frame()命令可以用于创建数据框,括号内输入变量名称即可(数据框以竖排的方式输出

在dataframe后使用$符号可以选中或输出某一特定header所代表列的数据(如data$sample输出的是data中sample列的信息)

在某些特殊情况下,如果要求满足不同条件的值呈现为不同的颜色,可以在数据框基础上新增加一列,使用data$colname=条件/公式或data$colname=as.factor(条件),这样就会在data中新增一列,满足条件的输出为True,否则为False。(该方法只适用于一个条件/两种颜色)

如果想将行名转变成第一列,可以使用如下代码:

data <-  data.frame(rownames(data),data)     ###将数据的行名和数据本身合并成一个数据框

row.names(data)=NULL       ###去除行名

如果想将某一列转变为行名,可以使用如下代码:

rownames(rawdata)=rawdata[,1]   ###指定第一列作为数据的行名

rawdata=rawdata[,-1]    ###去除数据的第一列,也可以通过dplyr包下的select函数实现

如果想将两个数据框纵向整合,则使用rbind()函数。

rbind(dataframe1,dataframe2)

列表创建使用list()命令创建(列表以横排方式输出)

对象类型的判断使用class()来进行

对对象进行类型转换可以使用as.numeric()as.character()as.matrix()as.data.frame()来进行

💡Ctrl+L清除工作台内容

💡在Rstudio中ctrl+enter运行代码

💡ls()查看工作空间

💡rm(工作空间名称)删除特定工作空间

💡gc()释放内存

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容