可以使用 read.table()从分隔的文本文件导入数据,该函数以表格格式读取文件并将其另存为dataframe。文件中的一行对于表格中的一行。
代码如下:
mydataframe <- read.table(file, options)
read.table()函数参数:
参数 | 功能 |
---|---|
header | 逻辑值,指示表格是否包含文件第一行中的变量名称 |
sep | 分隔数据值的分隔符。默认值为sep =“ ”,表示一个或多个空格、制表符、换行符或回车符。使用sep =“,”来读取被逗号","分隔的文件,使用sep =“\t”来读取制表符分隔的文件 |
row.names | 一个可选参数,指定一个或多个变量来表示行标识符 |
col.names | 如果数据文件的第一行不包含变量名(header = FALSE),则可以使用col.names指定包含变量名的字符向量。如果header = FALSE并且省略了col.names选项,则变量将命名为V1,V2,依此类推。 |
na.strings | 指示缺失值代码的可选字符向量。例如,na.strings = c(“9”,“?”)转换每个9和?读取数据时的值为NA |
colClasses | 分配给列的类的可选向量。例如,colClasses = c(“numeric”,“numeric”,“character”,“NULL”,“numeric”)将前两列读取为numeric,将第三列读取为character,跳过第四列,并读取 第五列为numeric。 如果数据中有五列以上,则第六列重新从colClasses的第一个numeric开始 |
quote | 用于分隔包含特殊字符的字符串的字符。默认情况下,这是双引号"或单引号' |
skip | 在开始读取数据之前要跳过的文本文件中的行数。此选项对于跳过文件中的标题注释很有用 |
stringsAsFactors | 逻辑值,指示是否应将字符变量转换为因子。除非被colClasses覆盖,否则默认值为TRUE。处理大型文本文件时,设置stringsAsFactors = FALSE可以加快处理速度 |
text | 指定要处理的文本字符串的字符串 |
comment.char | 关闭注释 |
read.table()函数实例:
假设有一CSV文件(wenjian.CSV)的内容如下:
UniProtID,GeneID,Organism,Length
Q96S44,PRPK,Human,253
P04637,P53,Human,393
P49915,GMPS,Human,693
输入代码:
CancerProtein <- read.table("wenjian.csv", header=TRUE,
row.names="UniProtID", sep=",")