一、教学评估的基本含义
标准化测验:测验项目是给定的,通常在一致的环境下施测,评分过程有统一的程序。
课堂评估:由教师选择和创造的评价方式,有许多不同的形式——单元测验、小论文、档案袋、完成项目、动手操作、口头报告等。
1、测量与评估
测量:用数量(数字)表示评价的过程。
评估:用来获取学生表现的程序。
(1)形成性评估和终结性评估(按照功能或用途划分,评估的两种形式)
形成性评估:为了制订计划或实施诊断而在教学之前或教学过程中进行的一种不给出等级的测验。
终结性评估:教学之后评价成绩的测验。
形成性评估和终结性评估的主要区别在于运用评估结果的方式不同。任何一种评估类型——传统方式、行为方式、项目完成、口语表达、档案袋等,都可以用作形成性或终结性的目的。如果评估的目的是为了提高教学水平,帮助学生指导自己的学习,评估就是形成性的;如果目的是为了评价最后的成就(同时决定课程学分),评估就是终结性的。
(2)常模参照测验:个体分数与其他人的平均分进行比较的测验。
三种不同类型的常模团体(用团体的平均分作为评价其他学生在某测验上表现的标准):班级(或学校)内部、学区和全国样本。
常模参照测验特别适合只有少数顶尖选手才能进入的项目,不太适合测量情感目标或动作技能目标。
(3)标准参照测验:个体分数与某个设定的标准进行比较的测验。
标准参照测验测量的是对某些特定目标的掌握程度,并非对所有情境都适用。
2、信度和效度
在形成测验和解释结果时,信度、效度和无偏性是必须考虑的三个重要因素。
信度:测试结果的一致性。
效度:测验测到想测事物的程度。
一个测验要有效,首先必须是可信的。这个测验是可信的,但不是有效的。信度和效度是所有评估过程都需要考虑的问题,而不仅仅限于标准化测验。课堂测验也有信度和效度。
无偏性:评估偏见:评估工具因学生的性别、社会经济地位、种族、宗教和一些其他的群体特征而造成冒犯学生或不公平对待学生的性质。包含两种形式:不公平性和冒犯性。
教师应该关心测量中的文化偏见,将文化因素和认知因素区分开来,让同事核查测验的偏见问题。
二、课堂测验评估
1、使用课本上的测验:如果课本测验的质量很高,与你的测验计划相符合,同时与你的教学目标相一致,那么运用这些测验就是一个不错的选择。检查每个题目的阅读水平,对不适当的题目进行修改。
2、客观题:多选题、连线题、判断题、简答题、填空题,得分的答案不需要解释。多选题含题干、选项、干扰项三部分,编写题干和选项需要巧妙的构思。
3、论述题:主要用来测量重要的、复杂的学习结果。题目为学生提供了清晰精确的任务,同时指明了答案中应该包含的要素。
三、真实课堂评估
1、真实性与表现性评估
真实性评估:考查学生在真实情境中的技能和能力的评估方法。就是让学生去表现,这种表现可能是思维表现、身体表现、创造性的表现或其他形式。
表现性评估:为了展示学习效果,要求学生开展一项活动或制作一个物品的评估形式。
2、档案袋和成果展示
档案袋:对学生某个领域作品的收集,展现了学生的成长、自我反思和成就。过程性档案袋记录了学生学习进步的过程,最佳工作档案袋展示了学生最后的成果。
成果展示:一种表现性评估或学习展示,具有公开性,常常需要花额外的时间进行准备。
3、评价档案袋和行为表现:
1、评分准则:用于确定学生行为质量的规范。教师可以选取一个教学领域及下属分支,然后就此设计一个准则。
2、信度、效度和公平性:真实性评估并不能保证信度、效度和公平性(无偏性)。使用准则是让评估更可信、更有效的一种方式。可是,基于准则的评估结果并不一定能预测与任务相关的行为表现。同样,评分者可能基于个体的外貌、谈吐进行打分,也可能对少数族群学生的行为表现或资源匮乏的群体抱有偏见,这些偏见会让少数族群学生在形成性评估中处于不利的地位。
3、非正式评估:是不需要评分的评估方式,主要用来收集多种信息以帮助教师进行决策。包括学生观察和核查表、提问、学生自我评估等。在非正式评估中,日记是被非常灵活和广泛使用的方式。学生常常需要按照一定频率完成个人或小组日记。
四、评分
1、常模参照评分与标准参照评分
常模参照评分:通过与他人比较来评估学生的学习成就。
标准参照评分:根据学生对课程目标的掌握程度进行评估。
2、分数对学生的影响
(1)失败的价值:应该尽量避免在学校发生低分数和失败。当教师帮助学生发现了努力学习和成绩改善之间的联系的时候,某种水平的失败对于大多数学生而言反而是有益的。
(2)留级:让一个学习有困难的学生简单地留级或升级,都不能保证这个学生学习的进步。除非与班里其他学生相比岁数更小或情感上不成熟而不得不留级外,一般而言最好的方法是让学生继续升级,并在暑假为他提供额外的教学支持。差异化教学能够阻止问题的发生。
3、分数与学习动机:教师可以运用分数来激励学生的学习,但是,评价应该支持学生的学习动机——而不是为了得到好的分数而学习。如果分数反映了有意义的学习,那么为分数而学习和为学习而学习就是同一件事情了。
4、与家长进行沟通:教师与家长的交流绝不是简单地告诉家长孩子的分数,交流的方式多种多样:对成绩单进行说明;学生作品的档案袋或成果展示;打电话,尤其是要报告好消息;学校提供开放时间;让学生主持会议;成立家庭作业热线;学校或班级网页;家访。
五、标准化测验
1、平均数、中数、众数和标准差:平均数(算术平均数)、中数(中间的分数)和众数(出现次数最多的分数)都是对集中趋势的测量。标准差反映了分数与平均数的离散程度。正态分布是一种钟形曲线的频数分布。很多分数都聚集在中间,越往两边,分布的分数就越少
2、分数的不同类型:百分等级表明有百分之多少的人的分数等于或低于某个体分数;年级当量表明学生得分跟某个年级平均分的匹配程度;标准分是基于标准差得到的。T分数和z分数都是常见的标准分。标准九也是一种标准分,整合了百分等级等元素。
3、当前测验存在的问题
关于标准化测验的矛盾主要聚焦于以下几个方面:测验的作用及其解释、过多通过测验来评估学校、对测验分数的不当解释以及对教师的测验。如果测验符合重要的课程目标,接受测验的学生在某个合适的阶段确实学习了这些课程,测验本身没有偏差,学生能够理解测验文字,施测方法正确,那么测验结果就能够提供一些反映学校质量的信息。可是对实际测验的行动研究发现了一些令人担忧的结果,它可能会限制课程内容的扩展或逼迫学生尽早退学。教师应该运用测验的结果去改善教学,而不是对学生形成刻板印象或仅仅证明自己对学生的低期望。
4、量化评估对教师的启示
教学和测验的好坏主要取决于教师能否(1)意识到并对学生的差异作出反应(2)制定明确的学习结果(3)使用前测和形成性评价监控学生的进步(4)采用多样化的教学方式确保每一个学生都能取得进步(5)确保学生知道终结性测验成功的标准,并且这些测验是与既定的学习目标相联系的(6)提供不同的评估形式,确保学生能够有机会、无障碍地展现自己学到的内容。