学习小组Day6笔记--郝志刚

R语言学习

思维导图

1 获得学习小抄

tidyr包的小抄

2 tidyr包功能

(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并

用的数据处理成标准而统一的数据框(Tidy Data),才能进行进一步的数据处理和作图

3 安装tidyr包

3.1 下载和安装tydir:

install.packages("tidyr")

下载tidyr

3.2 加载tydir包:

library()

image.png

4 数据框

新建数据框(这里直接把新建的数据框赋值给了a)
a<data.frame(GeneId=rep("gene5",times=3),SampleName=paste("Sample",1:3,sep=""),Expression=c(14,19,18))

rep,重复,括号中填要重复的字符和重复次数。

paste,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”。

image.png

5 认识Tidy Data

是一种组织表格数据的方式,提供了一种能够跨包使用的“统一”的数据格式。

5 .1 Reshape Data

准备数据


image.png

变形1

gather(a,X1999,X2000,key = "year",value = "cases")
gather括号里的分别是:
数据框名,需合并的列名(两个),合并后的key列名,value列名。

gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列。

5.2 Handle Missing Values

处理丢失的数据。就是某些单元格有空值的情况。

三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。

5.2.1 获取数据框X

导入:X<-read.csv('doudou.csv')
导出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行删除掉
括号里填数据框名,依据的列名(有空值那一列的列名)

image.png

fill(),根据上一行的数值填充上

image.png

replace_na(),空值填进去特定的一个数值
括号里填数据框名,要填的列名=要填的值

image.png

5.3 Expand Tables

complete(把空值的位置补全)

image.png

expand列出每列值所有可能的组合

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • (以下内容引用于生信星球) 学习内容 第一个R包--tidyr 准备工作: 1.1. 学会获取一个R包的小抄 方法...
    Hocchan_7阅读 4,075评论 0 50
  • 今天新学了一个所谓最简单的R包主要总结如下 新建表格 键值对对应关系key-value,如samplename和e...
    番番番茄小姐阅读 2,571评论 4 0
  • 今天是最后一天了,看看了任务不轻松呀,加快速度搞定,善始善终。 今天的学习任务是学习一个R包的安装和简单应用(笔记...
    丹keepbetter阅读 3,153评论 2 1
  • 他极度痴迷养成类游戏,这次他又想挑战个新难度,选定一个最弱的游戏角色,弱化力量输出属性,缩短血槽长度,降低物理抗性...
    艾迪蓝波阅读 5,526评论 2 56
  • 01 每至寒冬,心情总会忍不住低落,因为冬日将意味着我离那个心碎时刻一步步靠近------ 年少轻狂,把爱情看的比...
    筱昀阅读 3,616评论 0 1

友情链接更多精彩内容