第三节 测验的信度 第一单元 信度的概念
信度的定义
信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
信度只受随机误差(随机效应)的影响。
第二单元 信度(可信的程度)评估的方法
一、重测信度
使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数。
人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化。
优点:提供有关测验是否随时间变化的资料
缺点:易受练习和记忆的影响
一般是两周到四周较宜,间隔时间最好不超过六个月。
二、复本信度:以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数
复本信度反映的是测验在内容上的等值性,故又称等值性系数。
如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。
优点:避免重测信度的一些问题(记忆、学习效应等)复本信度局限性:
其一,如果测量的行为受练习的影响,则复本信度只能减少而不能完全消除这种影响;
.其二,由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。
.最后,对于许多测验来说,建立复本是十分困难。
三、内部﹣致性信度
(一)分半信度
通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。
(二)同质性信度
代表测验内部所有题目间的一致性。
各题目得分有较高正相关时,测验是同质的;即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,则测验为异质的。
四、评分者信度
随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。
一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。实际上有多少误差的来源,便有多少估计信度的方法。
第三单元影响信度的因素
分数分布范围越大,相关越高,信度越高。
一、样本特征
(一)样本团体异质性的影响
.一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。.(二)样本团体平均能力水平的影响
对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。
二、测验长度
一般来说,在一个测验中增加同质的题目,可以使信度提高。
第一,测验越长,测验的测题取样或内容取样就越有代表性。
第二,测验越长,被试的猜测因素影响就越小。增加测验长度的效果应遵循报酬递减率原则,有时反而会引起被试的疲劳和反感而降低可靠性。
三、测验难度
难度太大或太小,使得分数范围缩小,信度会降低。
平均难度0.5,信度最大。
四、时间间隔
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;
第四节 测验的效度
一、效度的定义
效度(有效的程度)是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。
效度受随机误差和系统误差影响。
效度的性质
(一)效度具有相对性
是什么测验就用在什么地方
在评鉴测验的效度时,必须考虑其目的与功能。
(二)效度具有连续性
用效度是较高还是较低来评价
信度和效度的关系:
一、信度是效度的必要而非充分条件
信度好效度未必好,效度好信度一定好
二、效度是受信度制约的
信度不可信又谈何可靠?