1、标识重复个案
1)“定义匹配个案依据”
用于确认重复个案的变量列表,可能是一个或多个变量组合。如果某个个案的所有这些变量值与另一个个案都相同,则视为重复个案。
2)在匹配组内的重复标准
对于重复的个案,按照所选变量进行升序或降序排列,变量列表的顺序很重要,即重复的个案先按照第一个个案标准排序,如果仍然相同,再按第二个变量标准排序,每个变量都可以分别设置不同的升序或降序。
3)“基本个案指示符”
对于重复个案,指定其中一个为主个案,其余的为重复个案,可以讲第一个或最后一个个案设为主个案,主个案取值为1,重复的个案取值为0
4)连续计算每个组合中的匹配个案
在每一个匹配组合中为个案创建序列值为1到n的变量。序列值基于每一组中当前个案的顺序,也就是原文件顺序,也可以是任何指定的排序变量决定的顺序。
实例:以ID为标准,将重复个案按分析升序、年龄降序排列。
具体分析步骤拆解:
输出结果如下:
结果解读:
红色框标识ID为5的有3个重复,以最后一个个案为主个案,按分数升序排列,且生成了连续计数变量“匹配顺序”
蓝色框同理
2、标识异常个案
暂不介绍,对初学者不太适用