11-19-1数据结构区分
1.1向量匹配排序match
11-19-2数据框
2.1向量
2.2向量变矩阵
2.3数据框
2.4list列表
3.1读取数据框
3.2数据框属性描述
4.1数据框取子集
4.1.1根据行名和列名
4.2提取列
4.3数据框编辑:改行或列内容
4.4修改行名和列名
11-19-3
5.1数据框进阶
5.2 str
5.3 na
5.4 两个表格的连接
5.5 merge
1.1 match
y中的第四个元素是x的第一个元素,所以第一个匹配数为“4”,依此类推
x=y[match(x,y)] match(x,y):y中的第几个元素代表对应的x的1,2,3...个元素,所以完整的写法一般为ymatch(x,y),即谁在后面,谁在外面
y按照x的顺序重新排序
2.1 向量
sample(1:100,7)1至100个数中随机取7个数
2.2 向量变矩阵
要求:多个向量的类型相同,长度相同 可用cbind或matrix
可用1个向量变成矩阵或多个向量变成矩阵
此为一个向量变成矩阵
此为多个向量变成矩阵
2.3 数据框:长度相同,数据类型不同
2.4 list列表: 长度可以不同,数据类型可以不同,没有行与列的差别,可以有多级元素
3.1读取数据框
3.2数据框属性描述
维度(几行几列) dim(df)
nrow(df):几行 ncol(df):几列
rownames:行名 colnames:列名
4.1数据框取子集
df[2,2]:数据框的第二行第二列数
df[2,]:数据框的第二行
df[,2]:数据框的第二列
df[c(1,3),1:2]:数据框的第一,第三行的第一第二列数
中括号里的逗号表示维度的分割
4.1.1根据行名和列名
取最后一列;除掉最后一列,其他的都选
能用函数表示的东西尽量不用数字
4.2 提取列
df 只能取一列或一行,不能同时取几行几列
4.3数据框编辑:改行或列内容
df$abc<-c(23,15,37) abc表示新增一列
当想要改exp内容时,误将p写成q,结果新增exq
该如何将结果改为我想要的结果?
将代码重新运行一遍
对df多次赋值,以最后一次为准
4.4修改行名和列名
5.1数据框进阶
5.2 str:查看每一列的数据类型和具体内容
5.3 na.omit(df):去除含有缺失值的行
5.4两个表格的连接
5.5 merge
大小写不一样