R(tidyverse包)常用操作

提取列

对列进行选择 select 函数

提取行

对行进行选择 filter 函数
slice():按位置提取行
filter():提取符合特定逻辑条件的行。 例如,iris%>%filter(Sepal.Length> 6)。
filter_all(),filter_if()和filter_at():过滤变量然后选择行。 这些函数复制所有变量或变量选择的逻辑标准。
sample_n():随机选择n行
sample_frac():随机选择一小部分行
top_n():选择变量排序的前n行

根据某一列合并表格
# 保存左侧完整表格
left_join(table1,table2,by="相同的列名") # 两列列名称不同使用(c ("X1"="Y1"))
right_join # 保存右侧
full_join # 取并集
inner_join # 取交集
删除重复行
# 根据所有列删除重复的行(完全一样的观测值):
my_data %>% distinct()
# 根据特定列删除重复值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
# 根据多列删除重复值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
# 选项.kep_all用于保留数据中的所有变量。

根据一个或多个列值删除重复行:my_data%>%dplyr :: distinct(Sepal.Length)
R base函数从向量和数据帧中提取唯一元素:unique(my_data)
R基函数确定重复元素:duplicated(my_data)

对某一列重命名
colnames(表格名称)[列数] <-"重命名"
colnames(gene_raw_express_data)[1] <-"Gene_ID"
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容