今天群里曾老师,小洁老师发的两个练习题。昨晚绘图就没问题了。
函数可以现搜 目的要看清楚
R数据科学 学完ggplot2就没有问题了
tidyr dplyr stringr ggplot
tidyr的扁和长
扁的如何转换为长的
tidyr的分与合
separate()
处理NA
drop_na
回头现学NA
stringr
dplyr
基础:
mutate(),新增列
select()按列筛选
filter()按行筛选
arrange()排序
summarise()汇总
count()计算重复值,优势为输出为数据框
进阶:
管道符号!!!必须记住
管道操作:%>%(ctrl + shift + M):上一步的输出作为下一步的输入
x1 = filter(iris,Sepal.Width>3)
x2 = select(x1,c("Sepal.Length","Sepal.Width" ))
x3 = arrange(x2,Sepal.Length)
x = iris %>%
filter(Sepal.Width>3) %>%
select(c("Sepal.Length","Sepal.Width" ))%>%
arrange(Sepal.Length)
有代码问题,问老师。微信群。先记重点
字符串拆分:
y=senctences[1:10]
y2=str_split(y,"",simplify=T)#简化列表为矩阵
连接分为加东西的连接和按原来的连接。
字符检测!太重要了,这就能找到转录因子
str_detect(x2,'h')#检查x2里面有没有h,含有就返回TURE,没有就是FALSE得到长度与x2长度相同的向量,可用来取子集
x2[str_detect(x2,'h')]