MATLAB的Categorical数组

8  Categorical数组

类别(categorical)数组是一种存储有限类别数据的数组类型。类别数组可以提供对非数值数据的高效存储以及操作,另外类别数组还保持了原有类别的名字,这样使用起来更加直观方便。类别数组可以和表(table)数据类型一起使用。

默认情况下,类别数组中包含的类别是没有顺序的。例如,一组离散的宠物类别{'dog' 'cat' 'bird'}是没有顺序的。所以MATLAB采用字母表顺序来对其进行排序,{'bird' 'cat' 'dog'}。顺序类别数组包含的类别是有顺序的,例如尺寸大小的类别{'small', 'medium', 'large'}是具有顺序的。

【例3-55】 类别数组的创建。

本例为读者演示如何创建一个类别数组。用户可以使用categorical函数把数值数组、逻辑数组、字符串元胞数组或者已有的类别数组创建为类别数组。

首先创建一个新英格兰地区州名的一个元胞数组。

>> state ={'MA','ME','CT','VT','ME','NH','VT','MA','NH','CT','RI'};

之后将此元胞数组转换为类别数组。

>> state = categorical(state)

>> class(state)

state =

  Columns 1through 9

     MA      ME     CT      VT      ME     NH      VT      MA     NH

  Columns 10through 11

     CT      RI

ans =

categorical

通过categories函数可以列出类别数组中包含了哪些类别。

>> categories(state)

ans =

    'CT'

    'MA'

    'ME'

    'NH'

    'RI'

    'VT'

从结果可以看到,所有的类别是按照字母顺序来排序的。

【例3-56】 顺序类别数组的创建。

创建一个记录物体尺寸大小的元胞数组:

>> AllSizes ={'medium','large','small','small','medium',...

           'large','medium','small'};

这个元胞数组有三种尺寸,'large'、'medium'和'small'。如果使用元胞数组进行记录的话,那么是没有一种方便的形式来表示small < medium < large这种大小关系的。使用valueset变量用来指明顺序的大小,在调用categorical函数时对顺序参数进行设置就可以实现顺序类别数组的创建。

>> valueset = {'small','medium','large'};

>> sizeOrd =categorical(AllSizes,valueset,'Ordinal',true)

sizeOrd =

  Columns 1through 6

    medium      large      small     small      medium      large

  Columns 7through 8

    medium      small

>> class(sizeOrd)            %查看创建数组的类型

ans =

categorical

类别数组中的顺序,sizeOrd,是保持不变的。同样适用categories函数列出所有类别:

>> categories(sizeOrd)

ans =

    'small'

    'medium'

    'large'

这时,所有类别的列举就不是再按照字母顺序了,而是按照用户定义的small<medium<large顺序来列举的。

创建100各1-44之间的整数向量:

>> x = gallery('integerdata',44,[100,1],1);

然后使用histc函数创建3个箱子,将x中的数值在1-15之间的放进第一个箱子,15-30之间的放在第二个箱子,30-45之间的数值放进第三个箱子。分界点15和30会归入第而2和第三各箱子。

>> [~,bin] = histc(x,[1,15,30,45]);

Bin是一个100×1的向量,用来表示x中的每一个向量是属于哪个箱子的。创建一个顺序类别数组,sizeOrd2,其中三个箱子变成了三个类别,small、medium和large。

>> valueset = 1:3;

>> catnames = {'small','medium','large'};

>> sizeOrd2 =categorical(bin,valueset,catnames,'Ordinal',true);

sizeOrd2是一个100×1的顺序类别数组,它有三个类别small<medium<large。

使用summary函数可以对类别进行求和

>> summary(sizeOrd2)

    small       33

    medium      36

    large       31

通过结果可以看出,有33个元素是属于small这个类别的,36个是属于medium这个类别的,31个是属于large这个类别的。

【例3-57】 类别数组元素的比较。

首先由一个字符串元胞数组来创建类别数组。

>> C = {'blue' 'red' 'green' 'blue';...

'blue' 'green' 'green' 'blue'};             %创建测试元胞数组

>> colors = categorical(C)                     % 转换为类别数组

colors =

    blue      red        green      blue

    blue      green      green     blue

这里我们创建了2×4的类别数组。然后可以通过categories函数查看数组中有哪些类别。

>> categories(colors)

ans =

    'blue'

    'green'

    'red'

然后我们可以使用“==”来比较数组第一行元素是否和第二行元素相等。

>> colors(1,:) == colors(2,:)

ans =

     1     0    1     1

从结果可以看出,只有第二列的两个元素不相等。

我们还可以把整个类别数组colors和单一字符串’blue’来对比:

>> colors == 'blue'

ans =

     1     0    0     1

     1     0    0     1

结果显示在colors数组中一共有4个blue。

通过指定颜色的顺序,我们可以将colors转换为顺序类别数组。例如指定顺序为red<green<blue。

>> colors = categorical(colors,{'red','green''blue'},'Ordinal',true)

colors =

    blue      red        green      blue

    blue      green      green     blue

类别数组中的各元素和转换之前是相同的,检验一下数组中有哪些类别:

>> categories(colors)

ans =

    'red'

    'green'

    'blue'

在设置了顺序之后,就可以对各元素的顺序进行比较。例如比较第一列的元素是否比第二列的元素大:

>> colors(:,1) > colors(:,2)

ans =

     1

     1

第二列中的元素是red和green,按照设定的顺序都比第一列中的blue小,所以均返回了1(true)。

用户还可以查找所有比blue小的元素:

>> colors < 'blue'

ans =

     0     1    1     0

     0     1    1     0

返回结果中为1的元素就是比blue小的元素。

【例3-58】 类别数组元素的组合。

首先创建测试数组,记录的是一个班25名学生午餐饮料是什么。

>> A = gallery('integerdata',3,[25,1],1);

>> A = categorical(A,1:3,{'milk' 'water''juice'});

然后对类别数组A进行统计:

>> summary(A)

    milk       8

    water      8

    juice      9

从结果可以看出有8名学生喜欢喝牛奶,8名学生喜欢水,还有9名学生喜欢果汁。

创建另一个类别数组,用以表示另一个班28人的午餐饮料情况。

>> B = gallery('integerdata',3,[28,1],3);

>> B = categorical(B,1:3,{'milk' 'water''juice'});

B是一个28×1的和A具有相同类别的数组。对数组B进行统计:

>> summary(B)

    milk       12

    water      10

    juice       6

从结果可以看出有12名学生喜欢喝牛奶,10名学生喜欢水,还有6名学生喜欢果汁。

有了两个类别数组之后,我们可以将其组合成为一个新的数组。

>> Group1 = [A;B];           % 组合的方法和普通数值矩阵相同

对总的类别数组Group1进行统计:

>> summary(Group1)

    milk       20

    water      18

    juice      15

Group1是一个53×1的类别数组,包含3个类别:milk,water和juice。

现在我们创建一个新的包含50个学生的类别数组,可选的饮料增加了苏打水。

>> Group2 =gallery('integerdata',4,[50,1],2);

>> Group2 = categorical(Group2,1:4,{'juice''milk' 'soda' 'water'});

对Group2进行统计:

>> summary(Group2)

    juice      18

    milk       10

    soda       13

    water       9

Group2是一个50×1的数组,有4个类别:juice,milk,soda和water.

将Group1和Group2组合:

>> students = [Group1;Group2];

对新建的总数组进行统计:

>> summary(students)

    milk       30

    water      27

    juice      33

    soda       13

可见结果中的数组有4个类别。下面使用reordercats来更改数组中的类别排列顺序:

>> students =reordercats(students,{'juice','milk','water','soda'});

>> categories(students)      % 查看有哪些类别

ans =

    'juice'

    'milk'

    'water'

    'soda'

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,874评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,102评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,676评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,911评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,937评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,935评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,860评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,660评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,113评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,363评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,506评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,238评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,861评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,486评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,674评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,513评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,426评论 2 352

推荐阅读更多精彩内容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi阅读 7,322评论 0 10
  • How to gain control of your free time by Laura Vanderkam ...
    Amazing_B18130阅读 199评论 0 0
  • 找工作?对于广大求职者特别是刚毕业的大学生来说都是一件非常头疼的事。你心仪的企业不要你,要你的企业你不想去,这样...
    绿芭蕉阅读 3,141评论 0 1
  • 所谓孤独,大概就是即使你身在人海也能感受到某种孤僻带来的窒息感吧。 你面前是条什么样的路,是一路平坦还是满眼...
    _声声慢YYH阅读 585评论 0 0
  • 10点钟睡不着,听说这两天跑车挺赚钱,美团和滴滴公司打的正凶,消费者和车主坐收渔翁之利。 我决定出去跑车,继上次开...
    小鱼儿666阅读 677评论 0 2