摘要
在DeepPrior上做了改进:1. 基础网络结构换成ResNet;2. 改进手部定位网络; 3. 数据增强
关键
-
训练数据增强
旋转
放缩
平移
-
Online Augmentation
在训练时对输入图片做上述(旋转,缩放,平移)操作,保证每个epoch模型看到的都是不完全相同的输入。这能很好的提升鲁棒性。
-
更加鲁棒的先验
使用增强的数据PCA初始化瓶颈层
-
手部定位网络
DeepPrior默认手部即距离摄像头最近的物体,从而截取出手部区域。本文在DeepPrior基础上,应用CNN回归预测中指的掌指关节点用于修正边界框。
- 基础网络结构
取消平均池化,加入两个全连接层
结果
相较于DeepPrior有不错改善