GVCNN: Group-View Convolutional Neural Networks for 3D Shape Recognition CVPR2018论文阅读笔记

GVCNN notes

思路总结与方法概括

GVCNN和MVCNN一样,也是一种基于多视图(multi-view)的、对三维物体进行识别分类的网络结构。

在MVCNN中,各个view的CNN特征通过一个view pooling层被整合成一个特征向量。这么做的缺憾在于,view pooling层并不能关注每个view的区分性。而实际上,在使用multi-view来对一个三维物体进行表示时,有些view之间的相似性可能会很高,而有些view之间的差别却比较大,挖掘出这些view之间的相互联系也许能够帮助网络更好地进行物体识别。

而GVCNN的核心思路便是基于上述的观测,它提出了一个c,用于对不同的view-level特征进行分组,并以组为单位对view-level特征进行聚合从而得到group-level的特征,最后通过一个学习到的权重来将group-level特征整合成一个全局特征描述子,以用于最终的分类。引入Grouping Module的好处在于,它考虑了view之间的组内相似性和组间区分性:相似度高的view被分到了同一组,组内特征对最终结果的影响因子是相同的;而不同的组间具有相对明显的区分性,因此每个组对最终结果的影响程度会不同。

具体结构

整体流程
架构
  1. 表示一个三维物体的多个view首先被送入一个全卷积网络(Fully Convolutional Network)进行初步的特征提取,得到每个view的Raw View Descriptor,这里的FCN对于各个view而言是共享的。假设我们用 n 个view来表示一个三维物体,那么经过FCN,我们就会得到 NRaw View Descriptor
  2. 提出得到的Raw View Descriptor接着被送入余下的CNN中进行进一步的特称提取,得到与每个view相对应的Final View Descriptor。类似地,这里的CNN也是view间共享的。相应地,这里我们也会得到 NFinal View Descriptor
  3. 同时,由第1步提取得到的所有Raw View Descriptor还会被一起送入Grouping Module来进行组别的划分,并计算出各个组别的对应权重。Grouping Module有两个计算结果,分别是图中的Grouping Scheme和Grouping Weight。其中Grouping Scheme用来对view-level的特征进行分组。而Grouping Weight则是分配给各个组的权重,用于接下来的特征整合。Grouping Module的具体细节将会在下文讨论。
  4. 接着,由第2步得到的 NFinal View Descriptor会根据第3步计算得出的结果来进行分组,分组的个数依赖于具体的数据,我们将分组个数记作 m
  5. 接下来,在各个组内进行view pooling操作(文章里使用的是average pooling),得到 MGroup Descriptor
  6. 根据第3步得出的Grouping Weight对第5步得到的Group Descriptor进行加权求和,得到最终的全局描述子shape descriptor
  7. 使用一个全连接层对第6步得出的全局描述子进行分类。
Grouping Module
分组模块

前面提到,Grouping Module的输出有两部分。一个是Grouping Scheme,用来确定如何划分组别。一个是Grouping Weight,是分配给每个组别的权重,权重表示每个组对最终的全局特征描述子的贡献度。

1. 计算区分度

在对各个view进行组别划分之前,先要得到每个view的区分度(Discrimination Scores),然后才能根据每个view的区分度来对其进行分组。Grouping Module的输入是 NRaw View Descriptor,这 NRaw View Descriptor首先被分别输入到一个共享的全连接层中,得到 N 个相应的输出值。假设输入的一组view为S = \{I_1,I_2,...,I_N\}, 对应的全连接层的输出值为\{O_{I_1},O_{I_2},...,O_{I_N}\},那么每个view的区分度的计算方式为:
\xi(I_i) = sigmoid(log(abs(O_{I_i})))
引入sigmoid函数,就使得区分度的取值落在0~1之间。注意到当sigmoid的输入高于5或小于-5时,其函数值便会趋向1或者0,这将不利于分组的进行。为了使得取值分布更加均匀,作者在sigmoid之前引入了abs和log函数。

2. 根据区分度进行分组

有了每个view的区分度,便可以对其进行分组了。分组的思路十分简单,具体如下:

首先将区间(0, 1)平均划分为 N 个子区间,接着依次查看每个view的区分度,区分度落在同一个子区间的view就被认为属于同一个组。最后便得到 M 个互不相交的分组 \{G_1, G_2,...,G_M\},并且有 1\le M \le N

3. 计算每个分组的权重

分组的权重用于对Group Descriptor进行加权平均,已得到最后的shape descriptor。因此,权重的计算原则是:一个区分性高的组,应分配一个高的权重,反之则应该分配一个小的权重。权重的计算方式为:
\xi(G_j) = \frac{Ceil(\xi_{I_k} \times |G_j|)}{|G_j|}, \ \ \ \ I_k \in G_j
不过感觉论文这里应该漏了累加或者Max之类的操作符,因为单从公式上来看,并不知道I_k的具体取值。具体细节可能要去代码中查看了。。

实验

实验证明,GVCNN相对于MVCNN有2到3个百分点的提升。但有一部分的提升实际上是来自于GoogLeNet(GVCNN所使用的CNN baseline)相对于VGG-M(MVCNN所使用的CNN baseline)的优势。这样看来,Grouping Module所带来的实际性能提升其实只有一个百分点左右。

比起分类准确率的提高,论文中对Grouping Module的讨论和实验展示其实才是点睛之笔。

分组结果

从展示的分组样例可以看出,Grouping Module对view的组别划分还是十分到位的。虽然最后的精度提升不是十分明显,但Grouping Module的作用仍值得肯定。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容