Hand PointNet: 3D Hand Pose Estimation using Point Sets总结

文章链接

摘要

  1. 基于PointNet++,直接处理3D点云数据预测输出3D手势

关键

  1. PointNet++

    接受深度图作为输入,转换为点云,并下采样为N个点。每个点取坐标值和曲面法线向量作为初始特征输入,p = (p_x, p_y,p_z, n_x, n_y, n_z),使用PointNet++提取特征

  2. Oriented Bounding Box(OBB) 归一化视角

    OBB是一个紧贴输入点云的边界框,OBB的方向由点云的PCA主成分分析得到(根据特征值降序排序)


    p^{cam}为p在摄像机坐标系下的坐标,p_{obb}为OBB归一化后的坐标,R^{cam}_{obb}为3D旋转矩阵,p^{-obb}为形心坐标,L_{obb}为边界框的最大边长。
    所以, P^{nor}为最终的归一化坐标

  3. 手势回归网络

  1. 降维表示(瓶颈层)即增加几何约束

    使用PointNet++提取1024维全局特征向量,通过三层全连接层映射为F-dim(降维表示即增加约束)

  2. 参考DeepPrior网络结构设计预测网络,损失函数为

    1. \alpha_t即点云降维后的特征向量。X_t^{nor}为归一化后的真值, \cal F为PointNet++,将真值经PointNet++网络提取特征降维与\alpha_t做loss

      在训练阶段


      其中\Phi_t^{nor}为最终的归一化坐标值,E^T基于训练集的主成分,u为均值

      在测试阶段


      所以


      即得到最终预测的摄像机坐标

    2. 第二项为L_2正则化项

  3. 指尖修正网络

选取初始预测点的k-近邻点作为输入,归一化输入到PointNet++修正3D位置。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容