DeepPrior++: Improving Fast and Accurate 3D Hand Pose Estimation总结

文章链接

摘要

​ 在DeepPrior上做了改进:1. 基础网络结构换成ResNet;2. 改进手部定位网络; 3. 数据增强

关键

  1. 训练数据增强

    1. 旋转

    2. 放缩

    3. 平移

    4. Online Augmentation

      在训练时对输入图片做上述(旋转,缩放,平移)操作,保证每个epoch模型看到的都是不完全相同的输入。这能很好的提升鲁棒性。

    5. 更加鲁棒的先验

      使用增强的数据PCA初始化瓶颈层

  2. 手部定位网络

    DeepPrior默认手部即距离摄像头最近的物体,从而截取出手部区域。本文在DeepPrior基础上,应用CNN回归预测中指的掌指关节点用于修正边界框。

  1. 基础网络结构

​ 取消平均池化,加入两个全连接层

结果

​ 相较于DeepPrior有不错改善

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容