今天的学习内容
关于R包的(cheatsheet),如图,可以很好的帮助自己学习。
接下俩是学习今天的新内容-tidyr,这个过程中需先构架一个数据框。
在tidyr包中需要注意两个函数gather spread。
重点 gather用法:括号里的分别是:数据框名,需合并的列名(两个),合并后的key列名,value列名。
Handle Missing Values
这个讲解中有三个问题需要注意
- 删除整行
- 根据上下文(瞎)蒙一个
- 同一列的空值填上同一个数。
以及需要注意的函数
drop_na()#有空值的,整行删除掉
fill()#根据上一行的数值填充上
repalce_na#空值填进去特定的一个数
第三项需要学习的是Expand tables
complete(data,....,fill=list())
expand(data,...)
对于expand函数我不是很了解于是我就?了呀。
一般来说就是用来显示可能缺失的组合的。
接下来推荐我最喜欢的函数
separate()
separate_row()
separate(data, col, into, sep = “[^[:alnum:]]+”, remove = TRUE,
convert = FALSE, extra = “warn”, fill = “warn”, …)
data:为数据框
col:需要被拆分的列
into:新建的列名,为字符串向量
sep:被拆分列的分隔符
remove:是否删除被分割的列
需要说明的是,分割要注明以那种形式为分割标准。