自然语言处理——7.4 分词与词性标注结果评价方法

两种测试

  • 封闭测试 / 开放测试
  • 专项测试 / 总体测试

评价指标

  • 正确率(Correct ratio/Precision,P)

测试结果中正确切分或标注的个数占系统所有输出结果的比例。假设系统输出N个,其中,正确的结果为n个,那么,

{\rm{P = }}\frac{n}{N} \times 100\%

  • 召回率(找回率)(Recall ratio,R)

测试结果中正确结果的个数占标准答案总数的比例。假设系统输出N 个结果,其中,正确的结果为 n个,而标准答案的个数为M 个,那么,

{\rm{R = }}\frac{n}{M} \times 100\%

两种标记:
R_{OOV} 指集外词的召回率;
R_{IV} 指集内词的召回率。

  • F-测度值(F-Measure):正确率与找回率的综合值。

计算公式为:
F - measure = \frac{{({\beta ^2} + 1) \times P \times R}}{{{\beta ^2} \times P + R}} \times 100\%

一般地,取\beta=1,即:

F1 = \frac{{2 \times P \times R}}{{P + R}} \times 100\%


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容