一文说清楚中高考人机评分标准!

前两天一个很偶然的机会,带着儿子逛进了科大讯飞的线下店,店员小姐强力向我推荐了一下他们的旗舰产品——讯飞翻译机。她看我带着儿子,就对我说:“国家中高考人机口语考试都是使用科大讯飞的标准,从小拿这个机器练习口语,今后就能得高分”。她无心的这句推销语,对于我来说却觉得十分惊讶。大家都知道,高考可是国考,任何涉及到触碰高考公正性的因素,都会立刻排查,一查到底。人机口语考试在很多地方都占了30 分左右,国家怎么可能把这么重要的考试标准让一家商业公司制定?但从这位推销员的逻辑来看也没有错,很多地区的人机考试确实是使用讯飞的软件,讯飞的算法在决定着你的口语得分,这么说起来,讯飞的标准就是国家的标准。

但我相信事实没这么简单,我总认为国家不太可能把高考的评判标准让一家公司来控制。带着这个疑问,我搜寻了大量资料(射手理工男的好奇心呀!),终于把整个问题搞清楚了。只能说,有时候一个错误结论的获得往往是因为你只掌握了一半的信息,当你突然看到全局的时候,就会发现之前看起来非常合理的逻辑是多么可笑。

在开始为大家揭秘以前,我们先搞清一个问题,就是口语考试为什么不直接使用老师人工测评,而要借助人工智能?简单的来说主要是因为教师资源不足。我们举个例子,上海每年有5万左右的高中考生,如果都需要老师来测评的话,将组织大量的老师。而且不同老师评判标准不一致,这也会引起家长的质疑,所以比较合理的方式最少要请两位以上老师对同一位同学进行评判,这又进一步加大了对老师的需求。并且,口语测评是一个重复单调的事情,老师长时间进行测评,自身评判的标准也会不稳定,也就是说每位老师每天还不能让他们评测很长时间,这就更进一步要求有足够多的教师资源。所以大家看出来了,口语测评这件事情非常耗费老师资源,而它又是一个重复单一的工作,这类工作最好交给机器去做。

那如果使用机器进行测评的话,测评打分的标准从哪里来,是机器自己决定,还是要参考延续老师打分的标准?这个问题是核心问题,如果是机器自己决定标准,那机器背后的公司其实就掌握了国考的标准。如果是要延续老师的打分标准,那么这就和某家人工智能厂商自己的评判标准没关系,人工智能提供商的目标是要尽可能的模拟老师的打分标准。

对于大部分人来说,之所以能够认可讯飞推销员所说的逻辑,认可讯飞的标准就是国考听说的标准,就是因为大家对正式考试的流程不够熟悉,以为考试分数的评判就是机器阅卷后直接给出的。在这里,我就详细的把中高考听说阅卷流程向大家解释一下:

口语考试流程.png
  1. 搜集学生录音数据
    口语考试完毕后,系统会自动搜集所有考生的录音数据,保存在U盘,封装在密封袋中,由安保一路护送到教育部门所设定的批卷中心。这种方式防止了通过网络上传所带来的黑客攻击,数据篡改等问题。

  2. 10%的试卷老师人工批改
    所有的录音数据进行入库处理,然后抽样10%的试卷,让老师人工进行打分。并且每份试卷最少要两位以上老师进行打分,对于多位老师打分差异比较大的试卷,会再次请总负责老师进行评定,最终给出分数。

  3. 机器学习
    10% 的试卷已经人工批改后,就开始把这些数据作为标准放到人工智能系统中进行训练,系统会充分学习老师打分的技巧,然后生成打分模型,计算模型的各种参数,最终形成一套与老师打分标准基本一致的打分系统。

  4. 利用生成的打分系统对其他90% 的试卷进行打分
    这套系统是充分学习老师的打分标准生成的,接下来的90%的试卷,就直接使用这套系统进行打分,从而大量减少了老师的工作。

  5. 抽样检查
    最后这步也非常关键,机器对90% 的试卷打分后,老师还要进行抽样检查,直到确保机器是按照老师标准进行打分后,整个阅卷过程才算结束。

通过以上流程,你应该了解到,正式考试批卷的过程中,人工智能的工作就是要最大化的学习老师批改的标准,然后把它批量应用在其他试卷上。每次正式的中高考,都是要经过这个过程的,各地区批改考卷的老师选择不同的话,机器学习出来的标准都是不一样的。所以这个标准并非是掌握在某家公司手中,而是牢牢掌握在国家手中,这样的过程才能体现出公正原则。

最后,我想再解答一个大家关注的问题,如果中高考的标准是根据当地批卷老师所制定的标准,那平时训练的时候,应该以什么标准为好呢?其实各大口语测评软件,都是搜集了大量的样本数据,然后根据这些数据训练出了一个综合的标准,这个模型主要是为了帮助学生纠正口音,查漏补缺,并熟悉考试流程。原则上这类人机口语软件都能起到类似效果,因此重点不在于软件,平时训练更多的应该关注内容,看看内容是否是符合当地教学特点,毕竟每个地区的题目类型和难度都不一样,及早熟悉当地题目,对考试还是很有帮助的。

相信通过以上的分析,大家对人机口考的流程已经了解了,也知道口考的评判标准并不是由某一家公司制定的。整个中高考口语考试,看起来虽然是机器在打分,但机器是在模拟批卷老师的标准,这个过程非常的公正,公开,透明。人机口考中人工智能技术的运用,并非为了替代老师,而是要以老师为标准,帮助老师减少工作量,今后如果再有任何公司声称自己是口语考试标准,并以此向你推销产品,你心里一定要清楚,对方就是在耍流氓。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容