读书笔记--李筱秋
测验的信度
信度是评价一个测验是否合格的重要指标之一,也是标准化心理测验的基本要求之一,测验的结果可靠,信度高!
信度的概念
信度是指同一受测者在不同时间内用同一测验(或用另一套相等的测验)重复测量所得结果的一致程度。就像射击打靶,同一人在昨天和今天都打靶的结果,今天打靶五次都中靶心,昨天打靶五次都脱靶,这人打靶很牛的信度就不高。
几次测量的分数大体相同便说明测验的性能稳定、信度高,反之若测验的性能不稳,则信度低。
信度只受随机误差的影响。随机误差越大,信度越低。
信度的指标(信度用什么指标来表示?)
1、信度系数与信度指数
信度是以信度系数为指标,是一种相关系数。
信度指数的平方就是信度系数。
2、测量标准误
SE=Sx…(见书346页),SE为测量的标准误,Sx是所得分数的标准差,rxx为测验的信度系数。从公式中可以看出,测量的标准误与信度之间的关系(互为消长)是:①信度越低,标准误越大;②信度越高,标准误越小。
信度评估的方法
估计信度的方法一般有:①重测信度;②复本信度;③内部一致性信度;④评分者信度。
1、重测信度:使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数。
用重测法估计信度,最适宜的时距随测验的目的、性质和被试者的特点而异,一般是2~4周较宜,间隔时间最好不超过6个月。
2、复本信度
复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在内容上的等值性。
如果复本信度考虑到两个复本实施的时间间隔,并且两个复本的施测相隔一段时间,则称:①重测复本信度;②稳定与等值系数。
复本信度的缺点有:①如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;②由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题;③对于许多测验来说,建立复本是十分困难的。
3、内部一致性信度
分半信度
通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。
同质性信度
同质性信度主要代表测验内部所有题目间的一致性。
4、评分者信度
一般要求在成对的受过训练的评分者之间平均一致性达到0.90以上,才认为评分是客观的。
信度与测验分数的解释
1、解释真实分数与实得分数的相关
rxx为信度系数。下列情况属于极端情况:①rxx=0;②rxx=1.00。
2、确定信度可以接受的水平
确定可以接受的信度水平的一般原则是,当rxx<0.70时,测验不能用于对个人做出评价或预测,而且不能作团体比较。0.70≤rxx<0.85时,可用于团体比较;rxx≥0.85可用于个人和团体
3、解释个人分数的意义
信度系数在解释个人分数的意义时的作用是:①估计真实分数的范围;②了解实得分数再测时可能的变化情形。
“大约有 95%的可能性真分数落在所得分数±1.96SE的范围内,或有5%的可能性落在范围之外”的描述,其置信区间为X-1.96SE < XT ≤X+1.96SE。
4、比较不同测验分数的差异
甲被试在韦氏成人智力测验中言语智商为102,操作智商为110。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.87和 0.88,那么甲被试的操作智商不显著高于言语智商。
影响信度的因素
1、样本特征
一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度。对不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来会影响信度。
2、测验长度
一般来说,在一个测验中增加同质的题目,可以使信度提高。
下列描述中正确的是:①测验越长,测验的测题取样或内容取样就越有代表性;②测验越长,被试者受猜测因素的影响就越小;③测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。
增加测验长度的效果应遵循报酬递减率原则。
3、测验难度
对于不同平均能力水平的团体,题目的难度会影响信度系数。
难度对信度的影响,只存在于某些测验中,如:智力测验、成就测验、能力倾向测验等;不存在难度的测验:人格测验、兴趣测验、态度量表等。
4、时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大。
专栏: 信度的特殊问题
1、速度测验的信度
2、分测验的信度
(有余力或对此部分感兴趣的亲们可细读)