摘要:标注跨文档事件共指链接是一项耗时且认知负荷高的任务,这会损害标注质量和效率。为解决这一问题,我们提出一种模型参与(model-in-the-loop)的事件共指消解标注方法,其中机器学习模型仅推荐可能存在共指关系的事件对。通过先模拟标注过程,再使用一种新颖的、以标注者为中心的召回率-标注工作量权衡指标,比较了多种底层模型和数据集的结果,从而评估该方法的有效性。最终提出一种方法,能在大幅减少完全人工标注所需工作量的同时,获得97%的召回率。代码与数据可在[此 https 链接]获取。
评注:第17届语言学标注研讨会(LAW-XVII)短文。10页,6张图,1张表。
学科:计算与语言(cs.CL)
引用方式:arXiv:2306.05434 [cs.CL]
提交历史:2023年6月6日(星期二)18:06:24 UTC(v1)FINISHED