高考作文评分交给人工智能?有效制止背作文和套作文

朱海鹏

来源:澎湃新闻网     转载自:http://culture.ifeng.com/a/20171128/53651549_0.shtml

【嵌牛导读】在高考评分中,作文往往是最耗费工作量,也最具争议的一项。近年来,由于高考作文评价体系屡遭质疑,相关领域的专家学者开始思考运用机器评分,来取代准确度不高且耗时耗力的人工批改。11月26日,华东师范大学中文系副教授徐默凡,在华东师范大学一场有关“应试作文写作质量的计量和计算”的研讨会上,就机器在作文评分中的实现可能性进行了探讨,并对当下的应试作文评分进行了反思。


研讨会现场

【嵌牛鼻子】高考作文评分体系,机器评分,自然语言处理模型,数据统计

【嵌牛提问】高考作文机器评分的机理是什么?又是否真的可行呢?

【嵌牛正文】

    据徐默凡介绍,目前有望运用于机器评分的自然语言处理模型有三类,分别是基于规则识别、数据统计和神经网络的自然语言处理。

    所谓基于规则识别的自然语言处理,是基于一定的规则对作文进行句法分析和语义分析,从而掌握对语言的理解和表达。徐默凡认为,这条路对于作文机器评分是走不通的。因为首先,人类自身并未建构起准确的作文评分标准;其次,作文评价标准涉及到的因素比句子理解更多,思想、逻辑、结构、语言等要素难以规则化。

    第二种模型则是基于神经网络的自然语言处理。它的原理在于运用脑科学和仿生学,模仿人脑对信息的处理方式。然而在徐默凡看来,这种模型也不适合用于机器评分。除了训练复杂度高,费时费力之外,无法对它的信息处理过程进行探测和评估,因而结果的可解释性差。更重要的是,这种模型牵涉到了关键的智能伦理问题。AlphaGo的横空出世令人惊诧,而相比围棋,作文更是人类智能的体现。如果将作文评分交给人工智能,很容易引起伦理上的反感甚至恐慌。高考这一事关很多人前途的重大考试,若完全交由人工智能去判断评分,很有可能会造成“机器将会主宰人类社会”的联想。

    于是相比之下,基于数据统计的自然语言处理才是更适合机器评分的模型。这种数据统计的基本原理是,一个句子是否合理,不必了解它的句法语义,只需要考察它在人类说过的话中出现的可能性大小如何:出现的可能性越大,即越合理;可能性越小,则越不合理。理论上,进行这种自然语言处理时,需要把人类讲过的所有话都统计一遍;然而在现实中,进行词频统计就已绰绰有余。“词频统计现在已经是比较成熟的研究成果了,”徐默凡说,“在实际中,也可以考虑到前后文的关联和影响。只是考虑的词越多,意味着计算也会越复杂。”

    徐默凡指出,数据统计可以有效禁止背作文和套作文的行为。如今中高考已成为了背作文和套作文的重灾区,同一个教师教出的学生背诵了一样的范文,因而考试时写出相似的作文,这一普遍现象若依靠人工力量是很难被察觉的。这里就是机器大显身手的地方了。它可以通过统计给出重复率百分比,并自动摘要出不同考生所写的相同事例,再由人工鉴定是否是作弊。

    此外,作文的语言规范度也可以使用统计测量。通过计算每篇作文的概率值,概率值越高说明语言用法越常规,以此就可以识别不规范的语言用法。“当然,概率低也有一种可能,那就是作文在语言上进行了创新,使用了一些新颖的表达。在此使用统计法,至少可以挑出概率低的表达,进而进行人工筛查,重点关注,再根据不同类型的作文要求赋分。”徐默凡说。

    在对现有的技术成果在实现机器评分的可行性上进行分析讨论后,徐默凡又引入了一个话题:作文真的可以测量考生的语文水平吗?

    高中语文老师主要将精力用在了总结应对高考作文的技巧上,只教学生应付考试的方法,而疏忽了真实语文能力的培养。因为学生只要掌握了应试技巧,就能够在高考作文中拿到高分,然而这并不足以证明其语文能力的优秀。从另一方面看,这也证明了现今的高考作文命题与评分机制在衡量考生语文水平的高低上存在一定的困难。因而作文能否体现语文水平,又是怎样测量语文水平的,成为了一个值得深思的话题。

    徐默凡表示,很多人认为作文水平只能整体感知,因此机器无法胜任,人类也无法公正。但这一问题并非无解。他犀利地指出,既然目前的作文评价量表可以将考生的作文水平分解为语言表现、思想内涵等等,为何不为每一项能力的评估专门设计一套试题?让作文从繁琐而模糊的评分体系中解脱开来,换以更清晰也更有针对性的试题,岂不更好?

    对于这一颇具革命性的提议,现场专家学者不尽赞同。“能写出一篇篇幅较长的文章,就是对考生能力的最大肯定。并且中国有漫长的写文章的传统,不可轻易中断。”在场的一位学者说。看来,有关应试作文的命题评分体系的改革,还有很长的路要走。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容

  • 我应该回到趋势玩法去。 毕竟趋势玩法即可以玩百家乐,快乐彩,还可以用趋势玩期货。 1,概率是可行赢的,数理上是赢的...
    喜欢爬山阅读 4,882评论 0 0
  • 过去,总是急于让外界了解"我“,于是会加"好友“,现在,为了不被关注,准确说,不被挑剔,选择将好友分类,以便对世界...
    白沙雁阅读 111评论 0 0
  • 忽然而来的悸动 一个高大的身影,一个独特的眼神,一些聊天记录⋯ 某种情愫似乎暗中生长⋯ 谁也控制不了,谁也解释不了...
    虾仔饼阅读 363评论 0 2
  • 我是日记星球212号星宝宝万儿,我在参加日记星球第十一期21天蜕变之旅,这是我在日记星球写的第224篇日记。 ...
    万儿阅读 196评论 0 2
  • 天亮了 梦醒了 你走了很久了。
    六月半幺阅读 136评论 0 0