R中读取数据的常用几种类型:
Excel
csv
txt
其他格式
1. Excel 格式比较常见,以data.xlsx为例,内容如下:
使用readxl包读取Excel文件。首先我们要安装这个R包
install.packages("readxl") #安装包
library(readxl)#读取包
tmp <- read_xlsx("D:/data.xlsx", col_names = F) #读取包,需要注意如果表里面有列名需要col_names = T,否则会报错,如果文件不是是.xlsx格式的,那需要用其他函数,比如read_xls()函数读取.xls结尾的文件
2. csv文件是一种逗号分隔文件,打开后和excel看起来一模一样,如果不确定用什么分割符,可以用vscode打开查看;一般推荐把excel文件另存为csv文件,因为方便R语言读取,不需要安装R包就能读取
csv <- read.csv("D:/R/data.csv", header = T)
csv <- read.table("D:/R/data.csv", header = T,sep = ",") # 指定分隔符!!,两种方式都可以读取
3. txt文件也是常见的文件类型,通常这种数据也是可以直接读取的,不用安装R包;txt是tab键分隔的文件,在读取时,一定要指定分隔符!
tmp <- read.table("data.txt",sep = "\t", # 必须要指定分隔符
header = T)
4. 其他类型,如果是spss软件产生的.sav文件,可以使用foreign包中的read.spss()函数读取,或者使用haven包中的read_sav();如果是rdata/Rdata/RData文件或rds文件,是R自带的格式,直接load()即可
library(foreign)
spss <- foreign::read.spss("data.sav",to.data.frame = T)
# haven包读取
library(haven)
spss <- read_sav("data.sav")
load(file = "data.rdata")
data <- readRDS(file = "data.rds")
5.写出文件(从R语言另存为其他格式)
# 把data这个数据框保存为csv
write.csv(data, # 要保存的对象
file = "D:/data.csv",
quote = F, # 不加引号
row.names = F, # 行名
col.names = T # 列名
)
write.table(data,
file = "D:/data.csv",
sep = ",", # 必须指定分隔符!!!
quote = F, # 不加引号
row.names = F, # 行名
col.names = T # 列名
)
#保存为txt文件
write.table(data,
file = "D:/data.txt",
sep = "\t",
quote = F, # 不加引号
row.names = F, # 行名
col.names = T # 列名
)
#保存为rdata/Rdata/RData文件,直接用save()函数
save(data,csv, # 同时保存多个对象
file = "data.rdata")
#保存为rds格式:
saveRDS(data, file = "data.rds")