最近发现很多小伙伴都在简书上记录自己的学习生活。听说这是一个很不错的平台,记录之余还可以互相交流,所以跟风也来写一写。我算是接受新事物比较慢的那种人,万事开头难,但是只要开始了就是离目标近了那么一小小步嘛!
最近感叹自己的代码真是丑,在实验室吵了好久,师弟看不下去了给我发了篇教程😂
好的,先从最简单的tibble学起咯
什么是tibble?
tibble是Hadley对数据框做的改良,它继承了数据框,也比它更灵活。tibble可存储list,,支持任意列名,自动添加列名, 不会更改输入(不会自动将字符转换为因子)等等,这些使我们在数据操作中少些限制。
加载R包
想使用tibble类型数据框需要加载tibble包,可以直接加载“tidyverse”包,里面包括了tibble在内,以及常用的tidyr,readr,purrr,dplyr,ggplot2包,数据清洗到可视化一条龙服务。
创建tibble
把已有的data.frame变成tibble:as_tibble()
创建新的tibble:
tibble(1:10, b=LETTERS[1:10]) #直接创建tibble
tribble(
~x, ~y, ~z,
#--|--|----
"a", 2, 3.6,
"b", 1, 8.5
) #数据排列创建tibble
tibble(x=list(a,b)) #list创建tibble
数据查询:
str()
glimpse()
查看tibble行列:
tibble默认显示10行,当然,可自行设置,参考【1】也可采用print(n = 10 , width = Inf)查看更多行或列。
用view()可以查看全部行列(一般用于长管道末尾)
选取列:
df$x
df[["x"]] & df[[1]] 返回向量
df[1] 返回tibble
管道中:df %>% .$x & df %>% .[["x"]]
选取行:
df[2:3,]
增加行:
增加到末尾:add_row(df, x = 99, y = 9)
插入第二行:add_row(df, x = 99, y = 9, .before = 2)
参考资料:
R for Data Science: https://r4ds.had.co.nz/tibbles.html
blog:http://blog.fens.me/r-tibble/