第三天

11-19-1数据结构区分
1.1向量匹配排序match
11-19-2数据框
2.1向量
2.2向量变矩阵
2.3数据框
2.4list列表
3.1读取数据框
3.2数据框属性描述
4.1数据框取子集
4.1.1根据行名和列名
4.2提取列
4.3数据框编辑:改行或列内容
4.4修改行名和列名
11-19-3
5.1数据框进阶
5.2 str
5.3 na
5.4 两个表格的连接
5.5 merge

1.1 match


image.png

y中的第四个元素是x的第一个元素,所以第一个匹配数为“4”,依此类推
x=y[match(x,y)] match(x,y):y中的第几个元素代表对应的x的1,2,3...个元素,所以完整的写法一般为ymatch(x,y),即谁在后面,谁在外面


image.png

y按照x的顺序重新排序

2.1 向量
sample(1:100,7)1至100个数中随机取7个数

2.2 向量变矩阵
要求:多个向量的类型相同,长度相同 可用cbind或matrix
可用1个向量变成矩阵或多个向量变成矩阵


image.png

image.png

此为一个向量变成矩阵

image.png

image.png

此为多个向量变成矩阵

2.3 数据框:长度相同,数据类型不同


image.png

image.png

2.4 list列表: 长度可以不同,数据类型可以不同,没有行与列的差别,可以有多级元素


image.png

3.1读取数据框


image.png

3.2数据框属性描述
维度(几行几列) dim(df)
nrow(df):几行 ncol(df):几列
rownames:行名 colnames:列名

4.1数据框取子集
df[2,2]:数据框的第二行第二列数
df[2,]:数据框的第二行
df[,2]:数据框的第二列
df[c(1,3),1:2]:数据框的第一,第三行的第一第二列数


image.png

中括号里的逗号表示维度的分割

4.1.1根据行名和列名


image.png

image.png

取最后一列;除掉最后一列,其他的都选

能用函数表示的东西尽量不用数字

4.2 提取列
df 或用tab键只能取一列或一行,不能同时取几行几列

image.png

4.3数据框编辑:改行或列内容

image.png

df$abc<-c(23,15,37) abc表示新增一列

当想要改exp内容时,误将p写成q,结果新增exq


image.png

该如何将结果改为我想要的结果?


image.png

将代码重新运行一遍
对df多次赋值,以最后一次为准
image.png

4.4修改行名和列名


image.png
image.png

5.1数据框进阶


image.png

5.2 str:查看每一列的数据类型和具体内容

5.3 na.omit(df):去除含有缺失值的行


image.png

5.4两个表格的连接


image.png

5.5 merge


image.png

image.png

大小写不一样

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、数组 元素类型统一 维度可以大于2 一维是向量二维是矩阵 创建数组 array(数据,各维度最大值,维度命名)...
    会飞的海尔阅读 179评论 0 0
  • 过拟合、欠拟合及其解决方案 过拟合、欠拟合的概念 权重衰减 丢弃法 模型选择、过拟合和欠拟合 训练误差和泛化误差 ...
    LinuxLeeSinYY阅读 846评论 0 1
  • 从R对象中提取特定的值 运用[] 提取数据框中特定的值可以通过 对象名[,,,,。。。。。。] 完成,中括号内有...
    医学小咖成长之路阅读 617评论 0 0
  • 请各位读者添加一下作者的微信公众号,以后有新的文章,将在微信公众号直接推送给各位,非常感谢。 如果您觉得这篇文章还...
    MR_LIXP阅读 2,894评论 1 9
  • 启动集群: 1)启动所有的zookeeper,start-all-zookeeper.sh 2)主节点最好一个进程...
    夙夜M阅读 523评论 0 3