2024-01-08呼建荣,中原焦点团队,坚持分享819天

第三节 测验的信度                            第一单元 信度的概念

信度的定义

信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。

信度只受随机误差(随机效应)的影响。

第二单元 信度(可信的程度)评估的方法

一、重测信度

使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数,叫重测信度,又称稳定性系数。

人的多数心理特征如智力、性格、兴趣等,具有相对的稳定性,间隔一段时间,不会有很大变化。

优点:提供有关测验是否随时间变化的资料

缺点:易受练习和记忆的影响

一般是两周到四周较宜,间隔时间最好不超过六个月。

二、复本信度:以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数

复本信度反映的是测验在内容上的等值性,故又称等值性系数。

如果两个复本的施测相隔一段时间,则称重测复本信度或稳定与等值系数。

优点:避免重测信度的一些问题(记忆、学习效应等)复本信度局限性:

其一,如果测量的行为受练习的影响,则复本信度只能减少而不能完全消除这种影响;

.其二,由于第二个测验只改变了题目的内容,已经掌握的解题原则,可以很容易地迁移到同类问题。

.最后,对于许多测验来说,建立复本是十分困难。

三、内部﹣致性信度

(一)分半信度

通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。

(二)同质性信度

代表测验内部所有题目间的一致性。

各题目得分有较高正相关时,测验是同质的;即使所有题目看起来好像测量同一特质,但相关很低或为负相关时,则测验为异质的。

四、评分者信度

随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。

一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。实际上有多少误差的来源,便有多少估计信度的方法。

第三单元影响信度的因素

分数分布范围越大,相关越高,信度越高。

一、样本特征

(一)样本团体异质性的影响

.一般而言,若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。.(二)样本团体平均能力水平的影响

对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。

二、测验长度

一般来说,在一个测验中增加同质的题目,可以使信度提高。

第一,测验越长,测验的测题取样或内容取样就越有代表性。

第二,测验越长,被试的猜测因素影响就越小。增加测验长度的效果应遵循报酬递减率原则,有时反而会引起被试的疲劳和反感而降低可靠性。

三、测验难度

难度太大或太小,使得分数范围缩小,信度会降低。

平均难度0.5,信度最大。

四、时间间隔

以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;

第四节 测验的效度

一、效度的定义

效度(有效的程度)是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。

效度受随机误差和系统误差影响。


效度的性质

(一)效度具有相对性

是什么测验就用在什么地方

在评鉴测验的效度时,必须考虑其目的与功能。

(二)效度具有连续性

用效度是较高还是较低来评价

信度和效度的关系:

一、信度是效度的必要而非充分条件

信度好效度未必好,效度好信度一定好

二、效度是受信度制约的

信度不可信又谈何可靠?

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容