library(tidyverse)
①tibble()函数,使用向量会自动重复长度为1的输入,并可以使用刚刚创建的新变量;
* tibble(x=1:5,y=1,z=x^2+y)
②tribble( )函数,可以对数据按行进行编码,列标题以~开头定义,数据条目以逗号,隔开
tribble(~x,~y,~z,
"a",2,3,
"b",1,8)
③提取变量
$ 按名称提取变量
[[ ]] 按名称或位置提取变量
例 wang<-tibble(x=runif(5),y=rnorm(5))
## wang$x #提取数据框中名称为x的元素
## wang[["x"]] #提取数据框中名称为x的元素
## wang[[1]] #提取数据框中第一列的元素
使用dplyr处理关系数据
①连接
合并连接——向数据框中加入新变量,新变量的值是另一个数据框中的匹配观测
筛选连接——根据是否匹配另一个数据框中的观测,筛选数据框中的观测
集合操作——将观测作为集合元素来处理
②内连接——保留同时存在于两个表中的观测 x%>% inner_join(y,by="key")
左连接——保留x中的所有观测 left_join(x,y,by="key")
右连接——保留y中的所有观测 right_join(x,y,by="key")
全连接——保留x和y中的所有观测 full_join(x,y,by="key")