Precision(P): 可匹配真值框的预测框占所有预测框的比例。
Recall(R): 可与预测框匹配的真值框占所有真值框的比例。
F1-score:
-
Evaluation Protocols for Text Detection
是真值框的面积, 是预测框的面积, 是预测框和真值框的相交面积, 是预测框和真值框的面积和.
1. the IOU based PASCAL Eval
满足
2. the overlap based DetEval
满足 &&
大部分数据集的评价标准都是符合两者其中之一,但是可能会有一些小的修改,一些不同的方法如下:
- ICDAR2003/2005
匹配的分数定义为相交面积占包含预测框和真值框的最小矩形面积的比例
只考虑了one-to-one的匹配 -
ICDAR2011/13
- MSRA-TD500
还没看懂。。。
参考:Scene Text Detection and Recognition: The Deep Learning Era