2021.4.12
持续更新中。。。
《R语言实战2》、学术数据分析及可视化
1. 导入数据
1.1 导入文本文件(.txt
和.csv
)
read.table("example.txt", header = T, fileEncoding = "UTF-8", skipNul = T)
重要参数:
① example.txt:要读入的文件名
② header:是否读入表头
③ seq:分隔符,默认是空白分隔符,读入.csv
文件时设置成:seq = ","
④ fileEncoding:文件内容编码方式,不添加时容易出现乱码
⑤ skipNul:是否忽略空值(默认:F)
⑥ blank.lines.skip:是否忽略空白行(默认为T)
尽量转换成
.txt
和.csv
格式文件导入,因为这两种文件占用内存较小,导入速度较快。.txt
文件中,用下划线代替其他的空格
1.2 导入Excel文件
install.package("xlsx")
library(xlsx)
read.xlsx("example.xlsx", sheet = 2, colNames = T)
重要参数:
① example.xlsx:要读入的文件名
② sheet:读入第几个表
③ colNames:是否读入表头
④ fileEncoding:文件内容编码方式,不添加时容易出现乱码
1.3 导入其他数据类型
2. 导出数据
write.tableI(example.txt, "file1", append = FALSE)
重要参数:
① example.txt:需要导出的数据集
② file1:数据集导出后的文件名
③ append:是否是追加导出