一、教育测量的质量指标
教育测量的质量指标包括信度、效度、难度和区分度。

二、各指标详解
1.信度
(1)计算信度系数的方法
①稳定性系数:又称重测信度,是指用统一量表对相同被试(一组人)在不同时间测验两次都实得分数的相关系数。可以用重测法用一份试卷对同一被试测验两次即可。两次间隔时间2~4周且<6个月。若两次测验的结果比较一致,有很大的稳定性,测验信度就很高,测验结果就是可靠的。
②等值性系数:又名复本信度,是用两个等值但具体内容不同的量表,在最短时距内对相同被试先后施测两次所获得的两组对应分数的相关系数。复本在测验的内容、题数、格式、难度、平均数、标准差等方面应与原测验一样,否则,估计的等值性系数就会出现较大的误差。
③内部一致性系数:把一次测验人为地分成两个部分,比较两个部分的一致程度,从而估计信度系数。有两种估计方法:分半信度和库德尔–理查森公式法。
a.分半信度:将一次测验分成假定相等且独立的部分来计分。通常以奇数题目为一组,偶数题目为一组,计算两组的相关系数,最后用斯皮尔曼–布朗公式矫正,求得整个测验的信度系数。
b.库德尔–理查森公式法:以各个问题的正确反应数为基础,或根据个人总分的平均数和标准差计算信度系数。该方法只需测验一次。
④评分者信度:即多个评分者对同一批人的答卷进行评分的一致性程度。评分者信度计算公式需区分评分者的人次数。两人评N份试卷,可用户斯皮尔曼等级相关公式计算,三人或三人以上评N份试卷,则需要计算肯德尔和谐系数。适用场景:在语文学科作文打分时经常会用到评分者信度。
(2)提高测验信度的方法
①适当增加测验题目的数量。
②测验的难度要适中。
③测验的内容应尽量同质。
④测验的程序应统一。
⑤测验的时间要充分。
⑥评分要尽量做到客观化,减少评分误差。
⑦被试情绪要平稳。
2.效度
(1)效度系数分类

(2)影响效度的因素
①测验组成方面②测验实施方面③被试主观状态方面④估计效度所依据的效标方面⑤样本方面
(3)提高效度的方法
①控制系统误差②精心编制量表③妥善组织测验④扩充样本容量⑤合理处理效度和信度的关系
3.难度
(1)计算测验难度的基本公式
①客观题难度计算公式:答对改题人数/参加测试总人数
②主观题难度计算P=考生在这道题的平均得分/这道题的满分
(2)用极端分组法计算试题的难度
①用极端分组法计算客观题的难度:高分组(前27%)答对该题的百分比与低分组(后27%)答对该题的百分比之和的平均数
②用极端分组法计算论文试题的难度:高分组得分总数+低分组得分总数-2×应试总数的25%×这道题的最近的分除以2×应试总人数×(这道题最高分-这道题最低分)
(3)控制测验难度的基本方法:
控制影响题目难度因素(考察知识点都多少、考查能力的复杂程度或层次的高低、考生对题目的熟悉程度、命题的技巧性)
4.区分度
(1)区分度的计算方法:
①用极端分组法计算区分度(简便、易理解但不精确)
a.客观题区分度的计算:高分组难度-低分组难度 b.论文试题区分度的计算:高分组得分总和-低分组得分总和除以应试总人数的25%×(这道题最高分-这道题最低分)
②用内部一致性系数计算区分度:相关法——点二列相关法计算客观题区分度、二列相关法计算多项选择题区分度、Φ相关系数法计算两个产量都是二分名义的区分度)
(2)提高区分度的方法
①使题目的难度适中②着重考查复杂的学习结果