为了精简量表的题项,减少测量模型中题项的数目,可以通过信度、因子负荷以及题总相关等信息对问卷中的题目进行删减。然而在实践中 ,这些方法在使用时是逐步进行的,不同的步骤会导致删减的结果不同,从而产生主观选择实施步骤而导致的错误。
Leite等(2008)提出了使用蚁群算法进行量表题项的精简。采用蚁群算法可以避免逐步使用各种指标进行问卷简化时所产生的偏差。通过综合考察各种模型拟合状况的参考指标,蚁群算法可以比其他方法更好地简化问卷题目。
蚁群算法的逻辑来源于蚂蚁如何解决食物源与巢穴之间的最短路线的问题。蚂蚁们为了找到最短路线,首先会随机选择通往食物源的路线,然后在路线上留下信息素,用来吸引同伴。那些最短的路径会更快地聚集信息素,因此会吸引更多的蚂蚁,从而形成良性循环,直到蚂蚁们汇聚到最短的路径上。
该算法首先从问卷中随机抽取N个题目(对应着N个路线)作为一个简版的问卷。然后用指定的各种指标对问卷进行评估,比如使用信度、关联指标或者是模型拟合指数,如果评估结果良好,则简版问卷中题目的概率权重(对应着信息素的量)就会增加。多次重复上述过程,那些最可能具有良好评估结果的题目的概率权重会越来越大,更可能被抽取出来,从而形成良性循环,产生最终的抽取结果,形成简化问卷。
R语言的ShortForm包提供了用来简化问卷的蚁群算法的代码。这里提供一个例子来说明如何使用ShortForm包提供的蚁群算法进行题项的精简。
# 测量模型按照lavaan包接受的方式来表达。此处测量模型的验证性因子分析是lavaan包作为分析工具。
# 接下来,创建一个题项名称的列表
# 本例中,所有的体现都测量是“Ability”的观测指标。
list.items <- list(c('Item1','Item2','Item3','Item4','Item5',
'Item6','Item7','Item8','Item9','Item10',
'Item11','Item12','Item13','Item14','Item15',
'Item16','Item17','Item18','Item19','Item20',
'Item21','Item22','Item23','Item24','Item25',
'Item26','Item27','Item28','Item29','Item30',
'Item31','Item32','Item33','Item34','Item35',
'Item36','Item37','Item38','Item39','Item40',
'Item41','Item42','Item43','Item44','Item45',
'Item46','Item47','Item48','Item49','Item50',
'Item51','Item52','Item53','Item54','Item55','Item56'))
# 加载一个随机生成的数据集
data(simulated_test_data)
# 最后,对antcoloy.lavaan的参数稍微做调整
abilityShortForm = antcolony.lavaan(data = simulated_test_data,
ants = 5, evaporation = 0.7, antModel = exampleAntModel,
list.items = list.items, full = 56, i.per.f = 20,
factors = 'Ability', steps = 3, fit.indices = c('cfi', 'rmsea'),
fit.statistics.test = "(cfi > 0.95)&(rmsea < 0.05)",
summaryfile = 'summary.txt',
feedbackfile = 'iteration.html',
max.run = 500)
abilityShortForm[[1]] # 显示最后的运算结果
蚁群算法的结果显示的是哪些题项予以保留。若某题项的计算结果显示为1,则该题项予以保留;若为0则建议删去。
蚁群算法的计算需要基于R中用于潜变量建模的lavaan包,因此其模型设定的语法可参考潜变量建模lavaan包的使用说明。