一、工作空间
工作空间是R用来读取文件和保存整个结果的默认目录。R对工作空间自动保存了两个隐藏文件:.RData和.Rhistory。其中.RData以二进制的方式保存了会话中的变量值;.Rhistory以文本文件的方式保存了会话中的所有命令。
——刘鹏《R语言》
二、工作空间的管理
用于管理工作空间/目录的部分标准命令如下表:
函数功能
getwd()显示当前工作目录
setwd(“mydirectory”)修改当前的工作目录为mydirectory
ls()列出当前的工作空间中的对象
rm(objectlist)删除一个或者多个对象
list.files()查看当前工作目录下的文件
source()运行脚本
#这里可复习文档4中命令:rm(list=ls()),清楚工作空间中所有变量
举例:
getwd() #显示当前工作目录
setwd("D:/R_Files") #设置工作目录为D盘中的R_Files文件
##注意,在R中反斜杠/作为转移符,不能使用window自动文件路径的\
##除了/,也可以用\\,所以上面命令也可以写作setwd(“D:\\R_Files”)
#../表示上级目录
list.files()
三、数据的读取和导入
R提供使用编辑函数和网站SQL语言导入数据,但是我们的分析最主要涉及三种文件,因此介绍三种常用方法导入数据。
1. [导入文本或csv文件
read.table()
read.cvs()
格式如下:
mydataframe赋值表名<- read.table(file需要读取的文件, header=logical_value是否将第一行作为行名, sep="delimiter"分割数据的分隔符是什么, row.
names="name"指定一个或多个标识符)
#在txt 文件中\t一般表示制表符,用制表符间隔
#标识符指可用于做标识的字段,如病人住院号
#在csv文件 中,逗号做分割符
#导入数据时,为了不使R将其自动转换为因子变量,使用命令options(stringasfactor=F)即可。
2.导入excel文件
(1) [将excel保存成一个逗号分割文件csv,用上面方法打开。
(2) [下载并安装打开excel的包,再打开,这里不介绍了,可参见刘鹏《R语言》
3.导入SPSS文件
(1) 调用foreign包(新版本R默认安装该包),使用read.spss命令
(2)或者用Hmisc包(需要先安装包,在调用),使用spss.get命令
举例:
install.packages("Hmisc")#安装Hmisc包
library(Hmisc)#加载Hmisc包到当前工作目录中
HUAframe=spss.get("D:/new-HUA.sav",use.value.labels=TRUE)
#D:/new-HUA.sav表示工作路径
#use.value.labels=TRUE表示将函数带有值标签的变量导入
四、数据的导出
导出文本文件write.table()
导出cvs文件write.cvs()
格式:
write.table (x, file ="", sep ="", row.names =TRUE, col.names =TRUE, quote =TRUE)
举例:
write.csv(train,file="D:/train.csv") #简单保存,未设置其他参数