登录注册写文章

学习小组Day6笔记--李斯亭

学习小组Day6笔记--李斯亭

R包学习

准备工作

小抄
公众号回复，https://www.rstudio.com/resources/cheatsheets/网站下载
tidyr
一个数据处理包，把数据处理成标准统一的数据框
下载安装

install.packages("tidyr")
library(tidyr)

数据框基础

bioplanet<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18)) #rep是重复；paste连接字符串，其中sep表示分隔符；c是向量

tidyr

reshape data
gather使每个变量（variable）占一列，每个情况（case）和观测值（observation）占一行；key-value表示一种对应关系，各一列：

a<-data.frame(country=c("A","B","C"),
"1999"=paste(c(0.7,37,212),"k"),"2000"=paste(c(2,80,213),"K"))

gather(a,X1999,X2000,key = "year",value = "cases")

或者

gather(a,year,cases,-country)

missing data

drop_na(X,X2) #去掉X这个数据框中X2那列的空值所在的行
fill(X,X2) #填充上一行数值
replace_na(X,list(X2=2)) #把X2这列空值填上2

expand table

complete(X,nesting(X1),fill=list(X2=5))
expand(bioplanet,GeneId,SampleName, Expression) #列出列所有组合值

split cells
seperate和seperate_row，但感觉用起来需要有分隔符，限制较大

总结

tidyr--数据框处理

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

学习小组Day6笔记--单众
思维导图从tidyr包开始学起准备工作：学会获取R包的小抄链接：[https://www.rstudio.co...
单大众阅读 271评论 0赞 2
DAY6 R包学习——tidyr包安装与使用
R包准备先知 R包（又叫小抄）的获取途径方法1：去百度/谷歌XX小抄方法2：找Rstudio的cheatsheet...
喜喜66阅读 7,908评论 0赞 9

学习小组Day6笔记--damon
已经第6天了，好快，今日学习tidyr包。内容及代码来自微信公众号生信星球 cheatsheet R包说明书安装...
Damon伍阅读 392评论 0赞 0
学习小组Day6笔记--🙃D
生信起步第六站-R大哥的“魔法”技能。之前一直很“怨恨”R包，主要因为各种安装可能会遇到各种麻烦，但不可...
忆落_angle阅读 554评论 1赞 1
如果你有一亿多元，你会像他一样把自己打造成Playboy吗？
第一次创业人，他分到了2200万美金。然后他从和三个室友同住的宿舍搬了出来，购买了一套总面积1800平方英尺的新...
九层塔曲奇阅读 477评论 1赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文