学习评价最有效的工具就是量规,但是对于量规,之前我是陌生的,不了解的。虽然闫老师专门给我们讲过量规,但我对这个概念依然是模糊的,不能把它有效的运用到我的教学中去。为了对他有更进一步的了解,我先读了闫老师推荐的这本书《如何编制和使用量规》,今天就把我浅浅的读书的一些理解与大家进行分享,如有不当之处,还请大家批评指正。
首先我们要搞明白什么是量规?
量规是针对学生学习制定的,它包含一组清晰连贯的标准,以及这组标准下各层级的表现质量描述。
听上去是不是很简单?好像我们也会编制,也会使用。咱们团队的魏艳萍老师,姬豪杰老师就把这个工具运用到了自己的教学中。我也尝试着去使用过。遗憾的是,在实践中量规常常被误解和使用。
焦老师经常鼓励我们,先用起来,要敢于尝试,在不断摸索中,我们会慢慢趋向正确。
当量规被正确的编制和使用时,它是帮助和提高教师教和学生学的有力工具。
有效量规的两个必备要素?
(1)量规中必须包含有关学生学习表现的(而非任务的)清晰合理的标准;
(2)量规中必须包含连续的表现质量层级描述。
量规的本质是描述性的,而非评估性的。当然,可以用量规进行评估,但是操作方法是将表现与描述进行匹配而不是评判。量规的优劣取决于标准的选择及其对各层级表现进行的描述。有效的量规离不开适宜的标准描述以及良好的表现描述。
量规的用途
和其他的评估工具一样,量规只能在特定的领域起作用。量规的主要用途是对学习表现进行评估。一类表现是你在学生完成任务的过程当中观察到的,比如学生朗读一篇课文或者讨论一道应用题的解题思路;另一类表现则包含在学生学习的具体成果当中,比如一份完成的手抄报或者一篇写好的作文。
一般测试题或者口头问题都有明确答案,且可以用对或者错进行评估。有说法称,此类问题是唯一不适宜用量规进行评估的问题类型,但当你想要评估学生问题回答的合理、完整以及适合程度时,此类测试题也能够反映出可以用量规测量不同层级的表现质量。
量规是对学生行为表现的描述而不是评判。基于量规的质量评估结果中包含了对表现做出的描述,可以被用作反馈和教学。这与不使用量规、直接给定分数或等级的质量评定有明显区别。
量规的种类和特点
通常,量规根据其内部构成不同,可以衍生出两种分类方法。
其一,量规依据的是单个标准还是整体标准?
其二,量规是综合的,可以适用于多种任务的,还是具体的、只能应用于一类任务或评估的?
根据不同的分类标准,可以设计不同类型的量规。每一种量规都有各自的优缺点。
解析型和整体型量规
从图表1.2中我们能够看出来,解析型量规描述的是各个标准下的学生学习情况,而整体性量规综合应用整体标准,对学生学习质量进行全方面评估。
解析型量规足以满足大多数课堂教学的需要。学生在分层标准的指引下会根据不同学习内容的需要投入不同程度的关注,因而解析型量规能更好地促进教学和推动形成性评估。分层标准聚焦还有利于推动总结性评估(评分),该评估可用于设计大单元教学以及制定年度教学计划等决策。
当学生无需知晓也接触不到最终的总结性评估内容,并且所有的评估信息除评定等级外没有其他用途的时候,使用整体性量规会优于解析型量规。例如,刚刚结束的期末考试。这种教学情形下,只需要给出整体结论,无需针对每项标准进行独立分析,使用整体型量规会显得更加便捷。
总体来说,在课堂教学中,解析型量规要优于整体性量规,因此在本书中多数的示例都是解析型的量规。整体型的量规是对全部标准的综合应用。使用者只需要从整体出发,但又不能从笼统的判断维度得出类似“优、良、中、差”的评估。真正的整体型量规同时满足量规各方面的规定和要求,以良好的学生学习标准以及标准达成过程中的观察内容为依据。
一般量规和具体任务量规
一般量规使用的标准和表现描述是概括了或者能够应用于不同任务的,同时这些任务必须服务于统一学习成果。例如写作或者解决数学难题。一般量规的应用标准指向整体学习成果而不是某一具体任务,例如它会列出问题良好解决的所有特征,而不针对某一具体问题的解决。
具体任务量规,顾名思义,就是适用于不同任务的量规。它包含了问题的答案、推理阐释、事实和概念列表。
从表中我们能够看出来,一般量规和具体任务量规的优缺点。
请看一般任务量规的优势:
1.可以在任务开始之前与学生分享量规。
一般量规不会直接给出问题答案,相反,学生需要通过自己的努力获取必要信息。一般量规是学生聚焦学习目标本身以及任务完成的途径。因此,一般量规的应用过程也是逐步建立良好技能表现概念的过程。例如,学生会认识到有效的问题解决需要提供清晰的推理和论证。
2.可以用于多种不同任务
一般量规关注的是知识和技能的发展,而不是完成某项具体任务。
一般量规关注的是学生知识和技能的发展,那么量规能够,也理应适应全方位学习任务要求。当然,我们无法一次性提供给学生同一领域内的所有可能任务,就像我们不能要求学生写尽人的性格特征一样,每一项任务都应具备一定的知识和技能要求,而且这些知识和技能会随着练习的深入而逐步得到发展。
为什么使用具体任务量规?
具体任务量规能够为评分提供参考,它规定了在具体任务中学生答案应包含的详细内容,与一般量规相比,使用者在学生表现的评分上无需达到过高的推理水平。评分者可借助具体任务量规快速掌握可靠的评分技能。同样,教师也能通过短时间练习连贯应用该类型的量规。 具体任务量规只适用于评分,除了特定用途外,一般不使用集体任务量规,因为他无法开展形成性评估。
我们开展学习评价最主要的目的是让学生缩小差距,量规明确了学生的学习要求,帮助学生理解了学习目标和成功标准,促进了学生的学习。
二、量规的编制和选择
那么,我们如何编制量规呢?
编制量归取决于两个重要的因素:标准和表现层级描述。
焦校:应该既有维度,又有层级
(一)确定合适的标准
当我们准备单独编制、选取或者与学生共同构建一个量规的时候,首先要问的问题是:什么样的标准能够与量规待评估任务的优秀作品相符合?
使用量规最有价值的地方之一:他们成了学生努力的目标。
考虑到任务评估的对象,选取作品中最合适、最重要的部分,将其作为标准。这些标准不应该一概而论的指向任务自身的特征,而应当指向任务所预示学习结果的特征。这些标准所描述的质量,正是老师和学生应该关注的学生学习的证据,能够促进学生的进一步发展。
如何编制表现层级描述?
层级最重要的一方面是:应当使用人们在作业中亲眼看到的内容,而不是用其总结出的质量结论来描述表现。
量规的常见误区是在标准确立后,又额外将评估量表添加到量规中,比如优秀、良好、一般、差劲,这样就不是量规了——它们是老式的评分量表。是终结性评价。
我记得焦校在群里提到过,量规最好不要以评分为目的。
闫老师也提到:特别提醒一句,我们用量规量的是学生的作业、作品,技能、表现,可不是衡量学生本人,不能把学生分成三六九等。
表现曾经描述可以一般性的描述一系列任务,也可以针对某具体任务进行描述。你必须明确自己所需要的表现层级描述究竟是一般性的还是针对具体任务的。大多数情况下一般性描述更受青睐。
(二)表现层级
表现层级需要明确的另一方面是究竟应该有多少层级的问题。这一问题的最终答案是概念化的:根据表现质量中有意义的区别,尽可能多的描述层级。而对于一些简单任务,可以有两个层级——可接受和重组,或已掌握和尚未掌握。
实际上我们在编制量规的时候,并不想要过多的难以总结的、不协调的评估结果,我们需要使用或多或少的层级,来描述表现质量的连续性。所以我们要尽可能选择与评分要求相符的多种层级。不少课堂中,对此存在着四个(如优秀、良好,合格、不合格)或五个(如ABCDF)层级。
(三)各层级表现描述
一旦确定了层级的数目,我们就需要对每一标准的每一层级进行表现描述。
编写这些描述的一个常见方法:先预期大多数学生可以达到的表现层级(如良好)并描述它,然后由此判断其余描述——或低于(如合格,不合格)或高于(如优秀)它。
另一常见方法:首先针对最高级别(如A)进行描述,接着是低于它的层级(如BCDF)。这些方法展示了两种不同的评估法。在基于规范的评分中,应当依据高于预期的成就,对优秀层级进行描述。在传统评分中,A就是学生努力的目标。
不论是从标准的良好级别还是从其最高级别入手,都不需要对不同的表现层级编写4到5个完全不同的描述,应当对连续的表现质量层级进行描述。这些层级应相互区分。还必须能够描述出每一层级的不同之处,并且以学生作品为样本举例说明这些描述。
描述学生表现必须考虑到通向成功有多种不同的方法。好的量规并不笼统的束缚或扼杀学生。描述一定要谨慎用词,清晰明了,并且以逐层表现中的相同要素为依据。
(四)设计量规
设计量规主要有两种方法:自上而下法和自下而上法。使用这两种方法并不一定会编制出相同的量规。所选取的方法最好要与目标相契合。对于新引入的概念和技能,最好使用自上而下法——让学生通过观察运用了所提供标准和层级的作品样本来熟悉量规。这样可以增进学生对高质量作品的理解。
自下而上法共建量规最适用于学生对一般学习结果已有一定程度了解的情况。
自上而下法
自上而下法是演绎性的。该方法以一个来描述待评估内容和表现的概念框架为起点。当课程和规范对预期内容和表现已有明确界定时,可使用自上而下法。
下面介绍使用该方法的几个步骤:
1.创建(或根据已有资源改编)一个成就概念框架
比如:怎样才是优秀的记叙文?
2.根据使用这些维度和表现层级的一般评分量规
编制时,必须通过微观分析(每条标准对应一个量表)或宏观整合(所有标准同时对应一个量表)的方式组织标准,然后对每一层级的表现进行描述。一般量规可以,且必须让教师与学生共享。
3.在教师评分方面,可以根据具体学习目标,基于待评分表现修改一般评分量规。
4.在任意情况下,(量规仍具一般性或已根据更具体的学习目标发生改变),使用量规评估几名学生的表现,并根据需要修改量规以待最终使用。
自下而上法
自下而上法是归纳性的。该方法以用多个学生作品样本构建评估框架为起点。当你仍在定义内容和表现描述,或当你想要引导学生构建自己的评估手段时,可使用自下而上法。
下面介绍使用该方法的几个步骤:
1.收集十几份学生作品样本。
作品应该与你正构建的量规表现相关联,这些样本须取自几个不同的学习任务,因为你希望量规反应的内容和表现描述能够适用于一般学习结果而不是特定任务。
2.独自或指导学生将作品分为三类:高、中和低。
3.独自或引导学生对每个作品的归类原因进行具体描述。
要具体说明已完成哪些任务,并解释问题未能正确解决的原因:是解决问题时使用无关信息,还是问题本身被小题大做了,抑或是其他某些原因。
4.分析作品描述和提取标准或维度的异同。
5.对步骤4所指出的每一条标准,依据维度对其进行质量描述,有多少层级就描述多少。
小结:优秀的量规能够为学生阐明学习目标(即使学生从未接触过该内容),是学习以及形成性评估的基础。最重要的是,优秀的连量规可以帮助学生自主学习。
三、量规的使用
如果学生在学习前已经知道要学什么,他们会取得更好的学习效果。因此,量规成为与学生分享学习目标的良好媒介。
(一)如何使用量规分享学习目标和成功标准
1.要求学生提出关于量规的明确问题
给学生几份量规,让他们讨论量规的每条标准的内容和意义,记录下自己的问题,试着与同伴一起解决问题,如果仍有无法解决的问题,可以在所有学生中进行大组讨论。如果讨论过后,学生对这些问题还不明确,就需要进一步修订量规。
2.要求学生用自己的语言陈述量规
让学生用自己的语言陈述量规,是一个理解的活动,让学生用自己的语言陈述量规,不仅可以帮助他们理解量规,也可以帮助老师检验他们的理解效果。
为了使学生理解其学习目标和成功标准,并用自己的语言讨论量规,在布置任务前就要将量规发给学生,帮助学生理解量规,让学生清晰地呈现出老师试图让学生学习的知识和技能。
学生参与构建量规,可以帮助他们在整体上获得学习归属感,在具体任务和评估过程中获得成就感,同时帮助他们学到更多东西。
3.要求学生将作品样本与量规相匹配
将作品样本与量规相匹配,这是通过归纳诱导,使学生理解标准意义概念的一种方法。
教师需要向学生展示从极差到极好的各种作品的样本,学生根据量规的标准和表现层级描述对作品进行分类。当学生见过相同标准的几个不同样本后,他们开始概括意义,他们开始将标准中重要的、关键的属性提炼出来,通过这样的方式来巩固关于标准和表现层级的概念。
4.每次只探讨并教授一条标准
在学生开始活动或任务前呈现量规。每次只呈现一条标准,若其中还有新的概念,可以通过一节微课来辅助呈现刚开始使用量规的时候,通常会有让学生感到生疏的术语,我们要让学生朗读每一条标准的所有表现层级,并从该标准中找出不熟悉的词语,随后要求学生对这些术语进行定义、描述并举例说明,帮助学生真正理解量规的含义。
(二)如何使用量规实现教师和同伴反馈
形成性评估是一种主动的和有意的学习过程。它旨在提高学生的学习成就感,将教师和学生联合起来,连续、系统的收集学习证据。
形成性评估与形成学习有关,也就是说这种评估所提供的信息可以促进学习进步。如果没有进一步的学习发生,那么不论目的是什么,这种评估都不是形成性的。
如何使用量规来帮助学生厘清学习目标,这是形成性评估的基本策略。
如何使用量规实现反馈、促进进步?
如何利用量规促进学生的自我评估与和目标设定,以及如何借助量规帮助学生提出关于任务的有效问题。
由于量规将学习标准一一列举了出来,并沿着连续的层级描述了每一层级的表现,因此为反馈提供了良好的框架。接下来我们将展示几种策略,以量规为基础,帮助我们来完成教师和同伴反馈。
1.基于量规反馈表中的教师反馈
教师可以借助编制良好的、一般的解析量规与学生进行分享和反馈。找出一条最匹配学生当前作品情况的标准,圈出其表现层级,以此来实现反馈。
这种将量规中的一般反馈的具体描述层级与学生作业相结合的方式,足以让众多学生不仅能够了解接下来的学习目标,还能在复习中促进学习。
2.黄色和蓝色混合成绿色
老师和学生都可以使用荧光笔,完成教师对学生作品的反馈和学生的自我评估。
双色荧光笔可以在同一作品中,对教师评估和学生自我评估两种视角进行比较,学生使用黄色荧光笔,教师使用蓝色荧光笔。当两个主体对量规中所描述表现的证据达成一致时,其所标出的颜色将会变成绿色。通过这样的对比,我们能够获得重要的信息。
如果标记区域大部分都是绿色,说明学生和教师都正以一种相同的方法来理解任务,并且在某种程度上对它的质量达成了共识。
如果大部分区域都是黄色,说明学生标出了教师没有标出的证据,这也许是因为学生尚未弄清标准的意义,或是学生高估了作品。
如果大部分区域都是蓝色,说明教师标出了学生没有标出的证据,这也许是因为学生尚未弄清楚标准的意义,或是学生低估了作品。
当教师和学生对于标准相关的学生作品的价值出现分歧时,这些分歧就可以为教师书面反馈、学生质疑或集体讨论奠定良好的基础。
3.同伴反馈
同伴之间可以利用量规相互反馈。量规为同班讨论提供框架结构,使学生能够更容易地将注意力集中在标准而非个人对作品的反应上。量规还可以促进对话交流。由于学生使用量规语言讨论彼此的作品,因此他们在交换信息的同时,也加深了自己对于标准意义的概念的理解。
同伴反馈最简单的形式,包括学生结对合作。教师必须根据具体任务,将兴趣、能力或合作相匹配的学生结对。
同伴反馈在教室里能够产生最佳的效果,因为在这里,建设性批评被认作是学习的重要组成部分。
当你进行同伴反馈时:
1.仔细阅读或观察同伴的作品。讨论作品,而非完成作品的人。
2.使用量规中的术语来解释和描述你在作品中的发现。
3.提出自己的建议和意见,并解释为什么认为这些建议能够有助于作品的改进。
4.听取同伴的评论和问题。
当你收到同伴反馈时:
1.听取同伴的评论。在作出回应前,花时间好好思考一番。
2.将同伴的意见与量规对比,确定其中哪些意见你会在修订中采纳。
3.感谢同伴的反馈。
最后,反复的实践练习会让同伴反馈变得越来越好。当使用同伴反馈时,观察结对学生并针对他们作出的反馈,对该反馈进行同之前一样的反馈。看看学生使用量规的方法、他们描述作品的清晰程度、他们的哪些建议可以改进作品,他们起到了多大作用等,并提出意见。
同伴交换反馈结果可以或多或少让学生从中学到一些技能。
(三)如何使用量规实现学生的自我评估和目标目标设定
学生努力想要达成的优秀作品质量被编码于量规中,因此量规是学生监控自己任务的合理参考点。
1.快速检查
每当学生做任务或项目时,在结束前留出一分钟对学生设计的每一条策略进行检查:
我今天做了这个吗?
它对我有帮助吗?
2.常规日记(反思日志)
管亮云老师在一次分享中提到,她在期末复习阶段采用了让学生写反思日志的方法。
学生在写日记的时候,应该针对下面一些类似的问题进行反思:
我是否确实使用了原计划的策略,他是否帮助我改进了作品?策略具体在于哪一点起到了作用?原因是什么?
3.小组思考,不予分享
在任务讨论的最后阶段,留出5分钟让学生进行小组合作,每位小组成员描述计划使用的策略情况。策略是否被采用,有助到何种程度以及设计该策略的原因。
4.使用量规,图示个人任务进程
将量规呈现给学生在任务中期要求他们对照各条标准在量规上标记出其作品所处等级。
5.图示长期学习过程
贯穿任务始终的一板量规可以用来图示一个报告期、一个学期甚至一个学年的学习进程。
不同目的学生可以使用一般连规评估基础技能或使用基于标准的评分量规,来把握对基础技能和标准的学习进度。
通过这个任务进程的图例,我们能够看出来它是为行成性评估服务的,反映的是学生的实践与学习。这个图表是该学生在学习时把握其学习进程的一种方式,她最终会从数学知识的总结性评估中获得评分。
这个图表只是描述展现了学生的学习“步骤”。评估只是学生实践、学习、展示所知的机会,图表的目的就在于让学生看到学习曲线。上升的柱条表表示进步,水平或下降的柱条说明没有进步。图表展示能够帮助学生关注表现层级,并为下一步制定计划。
高效、自律的学生会使用量规自行确认自己的作品是否包含其旨在达到的质量水平。而大部分,或者多数学生在使用量规提出关于新任务的有效问题时,更多还是需要支架和结构的帮助。我们可以和学生一起构建学生易懂的量规,在构建时,必须使用第一人称的叙述,保证可以将其转换为“我是否”的问题,这样训练实质上是对学生准确理解其学习目标大有益处。
四、量规和评分
我们还是习惯于使用测试分数和百分数,所以在使用量规评分的时候,往往会出现使用不当的情形。所以接下来我们说一下如何正确使用量规来进行评分。
我们所说的“批作业”或者“改试卷”,指的是单独为某项任务提供等级评估,除此之外我们还可以通过评分对一组个人成绩进行整合,最终结果显示为成绩单上的等级。
量规使用的是有序分类,即连续的质量表现描述。基于此,许多教师在实际操作中出于习惯,或者过度依赖成绩录入软件,将量规转化为百分数使用,其做法实际上已经违背了原本的评估意图。
评分量规即学生使用的形成性评估量规,该量规可以帮助学生理解学习任务,监督和改善学习过程。如果已经将量规应用于形成性评估,那么该项任务的主要“等级”应反映出学生在每条标准上的最终表现层级。这部分内容是对学生学习的描述,因此对学生来说至关重要。其中一个比较好的做法是,圈出学生在每条标准下的最终学习表现描述,确保其能真正反映学习意图。
其实我与大家的分享是照本宣科,理解的也不够深入,一知半解,起到一个抛砖引玉的作用,希望在座的各位大咖同伴,能够把自己对于教育评价的相关内容与我们进行分享交流,帮助我们更好地理解和运用。