#2.3.1键盘输入
mydata=edit(mydata) #s使用前一定需要创建对象,且编辑后需要赋值回对象本身
fix(mydata)
mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))#创建一个各列数据类型固定的空数据集
mydata=edit(mydata)
#2.3.2 从带分隔符的文本文件导入数据
mydata<-read.table
if(FALSE){read.table(file, header = FALSE, sep = "", quote = "\"'",
dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
row.names, col.names, as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#")}
?help(file)
if(FALSE){file():访问文件,剪贴板,标准输入;
gzfile()/bzfile()/xzfile()/unz():读取压缩文件;
url():含有http://,ftp://或这file://的完整URL文件}
#2.3.3导入excel数据
install.packages("RODBC") #可以读入Excel和microsoft Access、RODBC还是一个可以连接ODBC库的双向通信工具
library(RODBC)
channel<-odbcConnectExcel("Q1.xls") #通过channel将.xls导入
mydata<-sqlFetch(channel,"Sheet1") #将.xls文件中的工作表读入mydata
odbcClose(channel) #结束
#还可以用read.xlsx()读入,不过要先配置java(rjava,xlsxjava),有出错,不知道原因
#2.3.4 导入XML数据
##有相关的XML包,需要时可拓展
#2.3.5 从网页抓取数据
##可使用readLines()函数,结合grep()和gsub()函数处理
##推荐RCul包和XML包
#2.3.6访问数据库管理
##R中有很多面向关系型数据库管理系统(DBMS),一方面可以使用一些包访问,一方面可以使用ODBC(需要RODBC包)和JDBC(需要RJDBC包)
#2.3.7
##Stat/Trandfer(www.stattransfer.com)可以在多种数据格式转换
#2.3.8汇总:处理数据对象常用的函数
> length(mydata) #对象中成分的数量
[1] 15
> dim(mydata) #对象中维度
[1] 34 15
> str(mydata) #对象的结构
'data.frame': 34 obs. of 15 variables:
$ F1 : chr NA "T" "C" "G" ...
$ F2 : num 0 -2 -3 -4 -5 -6 -7 -8 -9 -10 ...
$ A : num -2 -1 -3 -4 -5 -4 -6 -6 -8 -9 ...
> class(mydata) #对象的类型
[1] "data.frame"
> mode(mydata) #对象的模式
[1] "list"
> names(mydata) #对象中各个成分名称
[1] "F1" "F2" "A" "T" "A1" "G" "A2" "A3" "T1" "G1" "C" "G2" "G3"
[14] "F14" "F15"
>cbind(object1,object2,……) #按列合并对象
>rbind(object1,object2,……) #按行合并对象
> ls() #列出当前对象
[1] "channel" "mydata" "workbook" "y"
> rm(channel) #删除对象(几乎全部删除rm(list=ls())
> newobject<-edit(workbook) #另存为
>head(object) #列出开始部分
>tail(object) #列出最后部分