R语言学习-基本统计分析--中

频数表和列联表

本节的数据来源于vcd包中的Arthritis数据集

> library(vcd)
载入需要的程辑包:grid
> head(Arthritis)
  ID Treatment  Sex Age Improved
1 57   Treated Male  27     Some
2 46   Treated Male  29     None
3 77   Treated Male  30     None
4 17   Treated Male  32   Marked
5 36   Treated Male  46   Marked
6 23   Treated Male  58   Marked
一维列联表

可以使用table()函数生成简单的频数统计表

> mytable<-table(Arthritis$Improved)
> mytable

  None   Some Marked 
    42     14     28 

使用prop.table()将这些频数转化为比例值

> prop.table(mytable)

     None      Some    Marked 
0.5000000 0.1666667 0.3333333 

或者使用prop.table()*100转化为百分比

> prop.table(mytable)*100

    None     Some   Marked 
50.00000 16.66667 33.33333 
二维列联表

对于二维列联表,table()的调用格式如下:
table(a,b) 其中a为行变量,b为列变量

> table(Arthritis$Treatment,Arthritis$Improved)
         
          None Some Marked
  Placebo   29    7      7
  Treated   13    7     21

还可以使用xtabs()函数,调用格式如下:
xtabs(~A+B,data=mydata)
其中mydata是一个矩阵或数据框,要进行交叉分类的变量写在~的右边

> xtabs(~Treatment+Improved,data = Arthritis)
         Improved
Treatment None Some Marked
  Placebo   29    7      7
  Treated   13    7     21

此外可以使用margin.table()和prop.table()函数分别生成边际频数和比例

> margin.table(mytable,1)#1代表第一个变量
Treatment
Placebo Treated 
     43      41 
> margin.table(mytable,2)#2代表第二个变量
Improved
  None   Some Marked 
    42     14     28 
> prop.table(mytable)
         Improved
Treatment       None       Some     Marked
  Placebo 0.34523810 0.08333333 0.08333333
  Treated 0.15476190 0.08333333 0.25000000
> prop.table(mytable,1)
         Improved
Treatment      None      Some    Marked
  Placebo 0.6744186 0.1627907 0.1627907
  Treated 0.3170732 0.1707317 0.5121951
> prop.table(mytable,2)
         Improved
Treatment      None      Some    Marked
  Placebo 0.6904762 0.5000000 0.2500000
  Treated 0.3095238 0.5000000 0.7500000

可以使用addmargins()函数可以为表格添加边际和

> addmargins(mytable)
         Improved
Treatment None Some Marked Sum
  Placebo   29    7      7  43
  Treated   13    7     21  41
  Sum       42   14     28  84    
> addmargins(prop.table(mytable))
         Improved
Treatment       None       Some     Marked        Sum
  Placebo 0.34523810 0.08333333 0.08333333 0.51190476
  Treated 0.15476190 0.08333333 0.25000000 0.48809524
  Sum     0.50000000 0.16666667 0.33333333 1.00000000
> addmargins(prop.table(mytable,1),2)
         Improved
Treatment      None      Some    Marked       Sum
  Placebo 0.6744186 0.1627907 0.1627907 1.0000000
  Treated 0.3170732 0.1707317 0.5121951 1.0000000
> addmargins(prop.table(mytable,2),1)
         Improved
Treatment      None      Some    Marked
  Placebo 0.6904762 0.5000000 0.2500000
  Treated 0.3095238 0.5000000 0.7500000
  Sum     1.0000000 1.0000000 1.0000000

使用gmodels包中的CrossTable()函数是创建二维列联表的第三种方法

> library(gmodels)
> library(vcd)
载入需要的程辑包:grid
> CrossTable(Arthritis$Treatment,Arthritis$Improved)

 
   Cell Contents
|-------------------------|
|                       N |
| Chi-square contribution |
|           N / Row Total |
|           N / Col Total |
|         N / Table Total |
|-------------------------|

 
Total Observations in Table:  84 

 
                    | Arthritis$Improved 
Arthritis$Treatment |      None |      Some |    Marked | Row Total | 
--------------------|-----------|-----------|-----------|-----------|
            Placebo |        29 |         7 |         7 |        43 | 
                    |     2.616 |     0.004 |     3.752 |           | 
                    |     0.674 |     0.163 |     0.163 |     0.512 | 
                    |     0.690 |     0.500 |     0.250 |           | 
                    |     0.345 |     0.083 |     0.083 |           | 
--------------------|-----------|-----------|-----------|-----------|
            Treated |        13 |         7 |        21 |        41 | 
                    |     2.744 |     0.004 |     3.935 |           | 
                    |     0.317 |     0.171 |     0.512 |     0.488 | 
                    |     0.310 |     0.500 |     0.750 |           | 
                    |     0.155 |     0.083 |     0.250 |           | 
--------------------|-----------|-----------|-----------|-----------|
       Column Total |        42 |        14 |        28 |        84 | 
                    |     0.500 |     0.167 |     0.333 |           | 
--------------------|-----------|-----------|-----------|-----------|
多维列联表

多维列联表的创建方式与二维列联表的方式差不多,具体代码如下:

#第一个变量是行变量,第二个变量是列变量,第三个变量是分组变量
> mytable<-xtabs(~Treatment+Improved+Sex,data = Arthritis)
> mytable
, , Sex = Female

         Improved
Treatment None Some Marked
  Placebo   19    7      6
  Treated    6    5     16

, , Sex = Male

         Improved
Treatment None Some Marked
  Placebo   10    0      1
  Treated    7    2      5
> ftable(mytable)
                   Sex Female Male
Treatment Improved                
Placebo   None             19   10
          Some              7    0
          Marked            6    1
Treated   None              6    7
          Some              5    2
          Marked           16    5
#计算每个变量的边际数
> margin.table(mytable,1)
Treatment
Placebo Treated 
     43      41 
> margin.table(mytable,2)
Improved
  None   Some Marked 
    42     14     28 
> margin.table(mytable,3)
Sex
Female   Male 
    59     25 
#两个变量组合的边际数
> margin.table(mytable,c(1,3))
         Sex
Treatment Female Male
  Placebo     32   11
  Treated     27   14
> margin.table(mytable,c(1,2))
         Improved
Treatment None Some Marked
  Placebo   29    7      7
  Treated   13    7     21
> ftable(prop.table(mytable,c(1,2)))
                   Sex    Female      Male
Treatment Improved                        
Placebo   None         0.6551724 0.3448276
          Some         1.0000000 0.0000000
          Marked       0.8571429 0.1428571
Treated   None         0.4615385 0.5384615
          Some         0.7142857 0.2857143
          Marked       0.7619048 0.2380952
> ftable(addmargins(prop.table(mytable,c(1,2)),3))
                   Sex    Female      Male       Sum
Treatment Improved                                  
Placebo   None         0.6551724 0.3448276 1.0000000
          Some         1.0000000 0.0000000 1.0000000
          Marked       0.8571429 0.1428571 1.0000000
Treated   None         0.4615385 0.5384615 1.0000000
          Some         0.7142857 0.2857143 1.0000000
          Marked       0.7619048 0.2380952 1.0000000 
> ftable(addmargins(prop.table(mytable,c(1,2)),3))*100
                   Sex    Female      Male       Sum
Treatment Improved                                  
Placebo   None          65.51724  34.48276 100.00000
          Some         100.00000   0.00000 100.00000
          Marked        85.71429  14.28571 100.00000
Treated   None          46.15385  53.84615 100.00000
          Some          71.42857  28.57143 100.00000
          Marked        76.19048  23.80952 100.00000
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容

  •  描述性统计分析 频数表和列联表 相关系数和协方差 t检验 非参数统计 7.1描述性...
    白马少年说阅读 3,249评论 4 3
  • 前面简要介绍了R语言的基本数据结构和基础图形,本节将简单介绍如何得到数据的描述性统计分析,以及进一步了解列联表(也...
    井底蛙蛙呱呱呱阅读 2,169评论 0 1
  • 参考: R语言实战 因为书中列举的方法和知识点比较多,没必要全都掌握,会一种,其他的了解即可。我就简要地整理一下我...
    王诗翔阅读 3,367评论 2 11
  • 流转的岁月将记忆打成了一个又一个碎片,我不知道自己在将来的岁月里会记住多少碎片。又会舍弃多少碎片,我好害怕自己会忘...
    德刃心阅读 309评论 0 0
  • 中午吃饭的时候,媳妇儿悄么声的一副抑制不住的表情对我说,“你知道吗?小M和小J是真的!”我一头雾水,啥真的假的?“...
    浪矢小徒阅读 1,279评论 0 2