R: 快速统计向量中元素出现的次数

前言

  如何用R语言来快速统计向量中每个元素的个数呢?今天我们来分享两个含量函数分别是table、rle,第一个函数用过R的人应该都了解,第二个rle函数就不常见了,可能很多人都不知道。下面我们就展示一下这个函数如何来统计向量中元素的个数。

  • table函数
    首先来展示一下如何用table函数来统计元素个数,例如我们有下面这样的文件,内容如下:
> head(df)
                       gene InputP           mType
1  ENSG00000007376.8 RPUSD1  3.698  protein_coding
2 ENSG00000010256.11 UQCRC1  6.170 retained_intron
3    ENSG00000010361.14 FUZ  4.147  protein_coding
4    ENSG00000015475.18 BID  3.408  protein_coding
5   ENSG00000023191.17 RNH1  3.930  protein_coding
6    ENSG00000030582.18 GRN  5.407 retained_intron

第三列是基因的类型,我们现在想统计一下每种类型的基因型数,示例代码如下:

#统计结果直接生成数据框
> as.data.frame(table(df$mType))
                                Var1 Freq
1                             lncRNA   12
2            nonsense_mediated_decay   18
3               processed_pseudogene    1
4               processed_transcript   22
5                     protein_coding  271
6                    retained_intron   24
7                                TEC    1
8   transcribed_processed_pseudogene    1
9 transcribed_unprocessed_pseudogene    2

是不是很方便快捷,统计结果直接转化为数据框看起来更清晰明了。

  • rle函数
    该函数也可以用来统计向量中元素的个数,但统计之前先把向量排个序,然后再进行统计,示例代码如下:
#使用rle函数统计元素个数,结果转化为数据框
> data.frame(rle(sort(df$mType))[2],rle(sort(df$mType))[1])
                              values lengths
1                             lncRNA      12
2            nonsense_mediated_decay      18
3               processed_pseudogene       1
4               processed_transcript      22
5                     protein_coding     271
6                    retained_intron      24
7                                TEC       1
8   transcribed_processed_pseudogene       1
9 transcribed_unprocessed_pseudogene       2
#rle函数返回的结果是一个list
> str(rle(sort(df$mType)))
List of 2
 $ lengths: int [1:9] 12 18 1 22 271 24 1 1 2
 $ values : chr [1:9] "lncRNA" "nonsense_mediated_decay" "processed_pseudogene" "processed_transcript" ...
 - attr(*, "class")= chr "rle"
>

用rle函数来统计元素个数也是相当的方便,但要注意两个细节,该函数统计前需要对向量先排序,返回的结果是list格式。

最后

  emm,今天就分享到这里,R语言的有好多使用的函数,多了解一点使用起来就会更方便一点。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343