三个基础性问题
第一个问题是我们需要什么类型的证据证明学生达到了教学目标和理解?
第二个问题是假定已经开发了一些特定的、与需求相关的任务,那么,在学生的反应、作品或行为中,哪些具体特征可以用来判断他们达到了哪些预期效果?
第三个问题,与检测评估的信度和效度有关。我们所计划的证据,能使我们推断出学生的知识、技能和理解吗?
一个非自然的过程
一旦目标确定,我们更习惯像一个活动设计者或一位教师那样去思考,很容易无意识的进入阶段3(设计教学、活动和作业),而没有首先考虑,我们需要学生有什么样的表现和作品。
逆向设计要求我们克服这种自然的习惯,否则我们的设计可能没有聚焦预期结果或缺少与预期结果的联系,更多地依靠“运气”产生结果,提升学生能力。Ubd模板和逆向设计过程的主要价值就是为改变忽视评估完整性的思维习惯提供工具和方法。
当只站在活动设计者的角度进行思考时,我们很可能得到的是类似在诸论中“苹果”单元案例的教学结果。尽管一些学生可能会获得重要的理解并符合一定的标准,但他们可能只是凭运气和偶然因素,而非通过精心的设计获得这些理解的。
要关注具体评估的质量。如果我们不能频繁而细致的应用逆向设计,就无法在具体评估中提供展示教与学效果的相应反馈。依据设计标准更注重自我评估和同行评议,将极大改善学校中的评估实践。
从“快照”到“剪贴薄”
有效的评估不是一张快照,更像是收集了纪念品和图片的剪贴薄。有效的评估者不会仅在教学结束时一考了之,而会在教学过程中使用各种方法和形式收集大量证据。
这个评估连续统包括对理解的检查(如口头提问、观察、对话),传统随堂测验、测试,开放式问答题以及表现性任务与项目。它们在规模(从简单到复杂)、时间范围(从短期到长期)、情境(从非真实到真实)以及框架(从高度结构化到非结构化)等方面各不相同。由于理解是随着探究和反思的进行逐渐形成的,对理解的评估应该是随着时间的推移而形成的“证据集”,而不是单个“事件”(如常见的教学结束前的随堂测验)。
假如我要关注理解,我们会把表现性任务或项目抛锚在单元或课程中,因为他们能提供证据表明学生是如何结合实际情况运用知识的。我们关于理解的理论认为在具体情境中的应用是激发和评估持久理解的恰当手段。更多传统评估(随堂测验、测试、问答题、习题集)可用来评定学生的基本知识和技能,这些知识和技能对学生们的最终表现有帮助。
真实表现——必要而非虚饰
理解在学生表现中得以揭示,当学生们将核心概念、知识和技能应用于各种情境下的挑战性任务时,就显示了他们的理解。因此,对理解的评估必须建立在基于表现的真实任务上。真实的任务是指什么呢?
具有与真实世界相联系的情境。把任务设置在一个复制或模拟人们在现实世界中检验知识与能力的情境中。
需要自主判断和创造性。学生必须理智和高效的应用知识和技能来应对挑战或解决相对非结构化的难题。现实挑战要求学习者理解问题的本质,而不是根据某些特定的提示或线索来测试毫无关联的知识点。即使当目标很明确时,学生也必须制定计划和过程来解决难题和回答问题。
让学生探索主题。学生必须在科学、历史或任何其他学科中开展探究和实践工作,而不是通过背诵或复述来证明自己学到的或已经知道的内容。学生的工作是模仿该领域中人们所做的工作,或与之类似。
呈现关键的、具有挑战性的情境,能够获得与成人在真实工作与生活中一样的真正的“测试”。真实的挑战,包括充满“混乱”的具体情况和有意义的目标:重要的制约因素、“干扰声音”、目的和工作对象。
评估学生高效且有效地利用全部知识和技能来协作完成复杂的、多阶段任务的能力。虽然训练和测试有时是恰当的,但是利用学生表现进行评估的效果往往超过所有单项训练的总和。
允许有适当的机会来复述、练习、查阅资料并得到反馈,从而改善学生的表现和作品。如果我们想让学生通过在情境中应用信息、技能和相关资料来证明自己的理解,就没有“神秘”测试的必要了。
在测试中要求较高的真实性,这在研究与实践中并不是全新的观点。
在发散性思维中,解决难题的办法是不可能提前预设的。
基于真实工作的评估要求,学生(和老师)在以下两个方面达成重要共识:
第一,要学习成人在学校之外的更大环境中是如何真正运用(或不用)他们在学校中学到的知识和技能的。
第二,要知道离散的课堂是如何变得有意义的,即它们如何引导学生获得更高质量的表现或熟练完成更重要的任务。
学生也需要体会到为了获得更好的表现,努力训练和测试是值得的。