数据集
该数据来自真实场景的门牌号,来源自The Street View House Numbers Dataset, SVHN。训练集数据包括3W张照片,验证集数据包括1W张照片。数据包括彩色图像,对应的编码类别和字符位置框。
赛题任务
赛题任务为识别图像中的门牌号数字,数字范围为0-9,字符'0' ~ '9'分别对应编码0 ~ 9。评测标准为识别准确率:
比赛有测试集A和测试集B,各自包括4W张照片,提供给选手的测试集A没有给出字符位置框信息。
数据集示例
数据(训练集、验证集和测试集)的标注使用JSON格式,并使用文件名进行索引。如果一个文件中包括多个字符,则使用列表将字段进行组合。JSON的一组图像及对应标注如下所示:
000018.png
"000018.png":
{"height": [54, 54], "label": [6, 0], "left": [220, 253], "top": [177, 167], "width": [28, 31]}
标签对应描述:
top: 左上角坐标X
height: 字符高度
left: 左上角最表Y
width: 字符宽度
label: 字符编码
赛题难点
- 图像中的字符数目不定
-
注意审题:门牌号数字,因此识别数字的前提是,数字是门牌上的字符。
label: 1,6,4
label: 3,2,8
- 图像周围可能有环境干扰,如其他字母字符, 字符在图像中面积很小
000205.png
000052.png
- 噪声和模糊
000064.png