题目的难度(Item Difficulty)是指试题的难易程度,是评价考试非常重要的一个指标。难度值(用P表示)可以用得分率(或通过率)等技术指标来衡量。在实际分析过程中,对于客观题和主观题,难度的操作定义不同。客观题的难度,以正确回答该题的人数占参加测验的总人数的比率来表示,如40%的人答对了某个题目,该题目的难度就是0.4。主观题的难度,以考生在该题上的平均分占满分的比率来表示,如满分60分的作文,考生平均得分42分,则难度为42/60=0.7。当考生人数很多,统计全部考生很困难时,也可以采取一种简便的分组取样法:先把考生按考试得分的高低顺序排列,然后在两极按一定比例分别划出高分组和低分组,再分别计算两极端组考生答对某题的人数百分比或得分比率,最后求它们的平均值。
题目的难度值的取值范围在0~1之间,当题目难度值为1时,说明100%的考生都答对了该题或者在该题上取得了满分,题目非常容易;当题目难度值为0时,说明没有考生答对题目或得分,题目非常难。可见,难度值与题目的实际难度是一种反序的关系,即P值越大,难度越小。另外,题目难度是具有相对性的具体性的概念。任何一个题目的难度值都是以一定的被试为对象计算出来的,其数值的高低依赖于选取的被试。对于奥数班学生来说很容易的题目,可能对于普通学生来说很难。
题目的难度水平多高合适,这主要取决于考试目的、题目形式以及考试的性质。例如,老师在某单元教学之后,要了解学生对所学内容的掌握情况所做的单元测验,几乎每道题都会有很高的通过率,不能因此说这些题目在难度上是不合适的。如果测验的目的是用于选拔,则建议将难度控制在接近录取率左右。例如,要从高中生中选拔15%的人参加奥数竞赛,那些通过率或得分率很高的题目是不合适的,必须提高题目的难度,并使测验总体难度接近0.15。