根据聚类对象的不同可分为以下两种:
- 样本聚类,又称Q型聚类
- 变量聚类,又称R型聚类
SPSS的Classify子菜单中提供了5种分类分析方法:
1.两步聚类
2.K-means(快速聚类)
3.分层聚类
4.分类树
5.判别分析
主要前三种,下面分别介绍
一.两步聚类
优点:
1.能够同时根据连续变量
和分类变量
进行聚类分析
2.适合数据量很大的数据集,并且它可以自动确定类的数目
过程:
第一步,把数据行,即样本预聚类
划分成许多子类
第二步,将这些子类用分层聚类的方法在井陉聚类.在确定最终的类别数量以及各类别中的成员数量时,采用的是BIC或AIC信息标准
例11.1
二.K-means(快速聚类)
三.分层聚类
分层聚类分析也称系统聚类分析
过程
开始把参与聚类的每个样本(或变量)各视为一类,然后根据两类之间的距离或相似性逐步合并,直到所有的样本(或变量)合并为一个大类为止.
例11.3