R语言数据框2021.1.29

数据框

一、定义

数据框是一种表格式的数据结构,与excel原表很像,形状上很像矩阵,每一列必须同一类型,每一行可以不同。数据框旨在模拟数据集,与其他统计软件例如SAS或者SPSS中的数据集的概念一致。数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量。不同的行业对于数据集的行和列叫法不同。
数据框实际上是一个列表。列表中的元素是向量,这些向量构成数据框的列,每一列必须具有相同的长度,所以数据框是矩形结构,而且数据框的列必须命名。
——引用自B站基因学苑up主教学视频中的一段文字

二、数据框与矩阵的区别

1、数据框形状上很像矩阵;
2、数据框是比较规则的列表;
3、矩阵必须为同一数据类型;
4、数据框每一列必须同一类型,每一行可以不同。

三、创建数据框

我们如果想将数据存储到R中进行进行分析,只需要每个数据单独存储为一个向量,用data.frame()函数合并即可。

state<-data.frame(state.name,state.abb,state.region,state.x77)

四、访问数据框

1.访问数据框子集合
数据框访问数据和向量,列表等类似

  • 数据框名称[数值],例如state[1]输出数据框第一列。
  • 数据框名称[数组],例如state[c(2,4,6)]输出数据框第2,4和6列。
    这种访问方法会输出数据的列命和对应元素值

2.访问数据框子集合(不包含字段名称)
例如:

  • 索引访问: state[,2]
  • 字段访问:state[,"state.abb"]
  • $符号访问(大佬推荐使用),不是数据框则没有办法用$
state$state.abb
  • attach函数访问:attach(数据框名)加载数据框到R搜索目录中,运行该命令后就可以在当前窗口中直接输入数据框列的名字就可以了,使用完数据之后可以使用detach(数据框名)取消加载。
  • with函数访问:with函数也可以完成和attach类似的功能,形如**with(数据框名,{数据框中列的名字})
  • 双中括号访问:[[ ]]与列表用法相似,返回是向量
单中括号与双中括号的用法区别

3.访问数据框元素
输入对应行和列即可输出对应元素
例如:

  • 索引访问: state[1,2]
  • 字段访问:state["Alabama","state.abb"]
    4.计算数据框的长度和宽度
  • dim(数据框名称)
  • length(数据框名称)
  • 计算某一列长度length(数据框名称$列名)

五、删除数据框子集合

  • 负索引方法
    数据框名称[-数值],例如state[-1]删除数据框第一列。同样的,用数组的方法可以一次删除多列。
  • 赋空值方法
    将数据框某一列赋值为NULL,以达到删除目的
state[5]<-NULL

attach():加载数据框到R搜索目录中

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容