一 安装并使用R包
- 使用install.package函数或者BiocManager::install函数
biocmanager类似于conda,是适用于生物学类大部分的R包网站,可以避免大部分的报错问题。 - 使用library和require函数使用R包
二 学习dplyr包
- 新增列
mutate函数,增加时设定列名称 - 筛选列
select函数,指定想要的列,可以按照列名也可以指定列数,但一般可以直接使用[ , ]的方式使用。 -
筛选行
filter函数,筛选某一列的值是否符合并将行内容返回。
- 对列进行排序
使用arrange函数进行排序,默认为从小到大,可使用dec函数从大到小排序,在排序为字符列时,默认为a-z,否则为z-a。 -
汇总
使用summarise函数,同时联合group_by函数。使用summarise的好处在于可以使用管道符%>%传递
-
计数
使用count函数对结果进行计数统计,可以对字符统计,也可对数字统计,此时数字被视为字符。
- 连接两个数据框
inner_join取两者交集
left_join取左部分
full_jion全部连接,包括空白部分。
anti_join取两者的补集。
8.合并数据框
使用bind_rows合并列,bind_cols合并行。