性能SOTA、适用多种类型物体,国防科技大学单张RGB-D图像预测物体对称性

姓名:韩宜真

学号:17020120095

转载自:https://mp.weixin.qq.com/s/rw5adn-xb7aEskugyvx7rw

【嵌牛导读】本文提出了一种面向单张 RGB-D 图像的对称检测网络 SymmetryNet。

【嵌牛鼻子】对称性 卷积神经网络 点云处理网络

【嵌牛提问】这种对称检测网络是怎样实现的?

【嵌牛正文】

在这篇论文中,来自国防科技大学和普林斯顿大学的研究者提出了一种面向单张 RGB-D 图像的对称检测网络 SymmetryNet。实验结果表明,该检测网络显著优于其它已有方法,性能达到了 SOTA,尤其是在没有训练过的物体上优势明显。此外,SymmetryNet 能够准确地检测出多种不同物体的对称性,包括被遮挡的物体、包含多个对称面的物体等。

作为大多数物体的基本几何属性,对称性广泛存在于我们的生活中。理解物体的对称性是计算机理解真实世界以及机器人智能交互中的重要问题。因此,对称性检测在图像分割、物体检测以及机械臂抓取等任务中有着广泛的应用前景。

三维物体对称性检测是经典的几何问题,由于对称性具有明确的数学定义(即物体在进行对称变换后具有几何不变性),传统的三维对称检测方法往往首先检测对称对应点(symmetric counterpart),再通过聚类或投票算法得到物体的对称面 / 轴。但是,这类算法的使用范围通常仅限于几何完整的合成三维模型或者高质量的重建三维模型,无法处理物体观测缺失的情况,例如无法通过单张 RGB-D 图像判断物体的对称性。

近日,国防科技大学和普林斯顿大学的研究者提出面向单张 RGB-D 图像的对称检测网络 SymmetryNet,相关论文被 ACM Transactions on Graphics (SIGGRAPH Asia 2020) 收录。


论文链接:https://arxiv.org/abs/2008.00485

数据和代码链接:https://github.com/GodZarathustra/SymmetryNet

方法

不同于从观测数据中检测对称对应点的传统方法,SymmetryNet 从大量数据中学习总结物体对称性出现的规律,进而通过 RGB-D 图像直接预测物体的对称性。


图 1:SymmetryNet:输入 RGB-D 图像,输出物体对称面 / 轴。

其核心思想是在检测物体对称面 / 轴的同时预测输入点云的对称对应点,这样做的好处是能够提高对称检测的精度和泛化能力。SymmetryNet 能够检测物体的反射对称(reflectional symmetry)和旋转对称(rotational symmetry),并且能够自动判断物体对称面 / 轴的数量,实现动态多输出。


图 2:SymmetryNet 网络结构。

SymmetryNet 包括特征提取和对称性预测两个模块。RGB 图和点云首先分别经过一个卷积神经网络和点云处理网络,得到逐点特征,逐点特征随后通过 weighted average pooling 层计算得到全局特征。逐点特征和全局特征拼接之后被用来预测物体对称面 / 轴。

SymmetryNet 的创新点之一是将物体对称面 / 轴的预测和对称对应点预测结合起来,对这两个相互关联的任务同时训练,从而提升对称检测的精度和泛化能力。如下图 3 所示,对于当前点 P_i,网络不仅预测物体的对称面 / 轴参数 O_i 和 n_i,同时还预测点 P_i 的对称对应点。其中,反射对称物体的对称对应点为 Q_i,旋转对称物体的对称对应点则为一个围绕对称轴的圆环。

此外,为了处理具有多个对称面 / 轴的物体,SymmetryNet 每次输出多个对称面 / 轴,再利用分类器判断输出每一个输出的有效性。对于含有多个对称面 / 轴的物体,SymmetryNet 通过求解 optimal assignment 优化方程计算预测对称面 / 轴与真值的匹配关系,进而计算 loss 并进行回传。


图 3:SymmetryNet 同时预测对称面 / 轴(蓝色部分)以及对称对应点(橙色部分)。

实验

为了验证算法有效性,SymmetryNet 在多个数据集上进行了实验测试,实验选用 PR 曲线作为评价标准。其中,ShapeNet 数据集上的定量实验结果如下图 4 所示。从图中可以看出,SymmetryNet 显著优于其它已有方法,性能达到了 state-of-the-art,尤其是在没有训练过的物体(Holdout category)上优势明显。


图 4:SymmetryNet 在 ShapeNet 数据集上的测试结果。

下图 5 展示了若干个对称性检测结果,可以看出 SymmetryNet 能够准确地检测出多种不同物体的对称性,包括被遮挡的物体、包含多个对称面的物体等。

图 5:SymmetryNet 对称性检测结果。

对称性是连接几何和语义的桥廊,理解分析物体对称性是计算机感知真实世界的重要方式。因此,对称检测可以为计算机视觉、机器人学中的多种任务提供理论和信息支持,具有十分广阔的应用前景。将图像分割、形状补全、位姿估计、机器人抓取等任务与对称检测结合,有望实现精度更高并且更加鲁棒的算法。

此外,研究实现高效的对称数据标注方法,或者实现对称检测网络的自监督训练,对于该研究方向同样具有重要意义。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,843评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,538评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,187评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,264评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,289评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,231评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,116评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,945评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,367评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,581评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,754评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,458评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,068评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,692评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,842评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,797评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,654评论 2 354

推荐阅读更多精彩内容

  • [TOC] 摘要 Abstract 我们提出了一种用于动态环境的基于实时深度边缘的RGB-D SLAM系统。 ...
    liampayne_66d0阅读 1,366评论 1 0
  • 人脸是人体最重要的生物特征之一,而人脸研究主要集中在人脸识别方面,人脸的表达模型分为2D人脸和3D人脸。2D人脸识...
    安静的少女阅读 2,889评论 1 4
  • 1 摘要 上一章节介绍了OpenCV中可用的图像变换函数,这些技术本质上都是通过一种映射关系将图像转换为另一个图像...
    RichardJieChen阅读 1,043评论 1 1
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,523评论 16 22
  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    迷月闪星情阅读 10,562评论 0 11