论文简记 | Deep Voxels 文章解读《Deep Voxels: Learning Persistent 3D Feature Embeddings》

一 写在前面

未经允许,不得转载,谢谢~~~

开始尝试一下论文简记,简单记录论文的精华,对于真的非常需要细读的文章后续再扩充,立一个每周可以输出两篇简记的flag (赶论文除外嘻嘻)(๑>ڡ<)☆

二 主要内容

2.1 motivation

1. 关于GAN

  • GAN生成网络已经在各种图像修复、图像生成上做的很好了;但是为同个场景生成不同视角下的图像还是一个很具有挑战性的任务。
  • 这就要求网络能够学习到latent 3D representation(潜在的3D特征表示)来支持变换角度等3D操作;

2. 关于3D deep learning

  • 3D deep learning主要是对物体进行三维重建,这几年兴起了相应的研究;
  • 但大多数的网络模型和方法都依赖于人工标注的3D数据,这个对于数据集的要求就很高,常见的标注数据有:
    - grid;
    - signed distance fields;
    - point clouds;
    - mesh;
  • 利用这个信息及模型可以重构出三维的几何形状,但是确不能生成彩色图,因为不知道如何将颜色信息表示在高分辨率的三维形状下。(即恢复出来的3D形状就仅仅是shape而已,丢失了原图的纹理信息)

除了这两点,也有学习如何将地位的图像特征解码到novel view下,但是对于生成效果并不好。

2.2 related work

以前不会可以记录相关工作,但是自己尝试写过论文以后觉得这块其实很重要,记录下来也是为了方便有兴趣的同学检索相关论文~

  • neural image synthesis;
  • 3D deep learning;
  • deep learning for view synthesis;
  • model-based rendering;
  • image-based rendering;

2.3 main work

网络结构示意图:


本文将3D operations引入到2D生成模型中,来学习几张multi-view图像中包含的潜在3D特征,主要的阶段如下:

  1. 训练阶段:接受multi-view的图像输入,然后用global optimization模型进行编码学习到 latent 3D voxel presentation;
  2. 测试阶段:从学习到的latent 3D voxel presentation潜在3D特征表示中进行2D rendering,得到各个novel view下的新图像;

这样的好处是不需要3D数据的监督信息,利用2D re-rendering的loss来指导网络进行参数更新即可。

总结来说,整篇文章的想法就是通过在2D网络中引入3D操作学习潜在的3D特征表示,但学习到的也仅仅是feature,这就不需要数据集具有精准的3D形状标注数据,也不需要构建出物体的准确几何信息,然后用2D rendering网络来生成新的图像,利用新生成新生成图像与原有图像之间的2D rerendering loss进行迭代更新。

三 所需数据集

整个网络是scene-specific的,即适用于特定的一个scene,所以相应的训练语料也是遵守这个原则。

训练语料表示:


  1. 共有M个samples;
  2. 每个sample由{S,T0,T1}三张不同view的image构成,其中S表示source image(图像+camera pose),T0,T1表示target views;
  3. 训练过程中的语料是动态生成的:
  • <T0,T1> 是随机集N个registered multi-view images中选出来的两张图像;
  • 然后再source images中选择相机角度与T0最接近的5张,在这top-5中随机选择一张作为S,构成{S,T0,T1}
    -这样做的目的是让S中的点大部分都能在T0中可见,然后有鼓励网络生成的新图也能与相对ramdon view的T1保持一致。

四 实现细节

目前的内容只是从宏观的角度简单记录了一下,整体网络结构图:



整体来说,输入一张S经过整个网络得到两张新生成的图,然后通过与T0,T1比较,得到一个L1 loss,通过判别器得到一个对抗loss,两个loss共同作用促进网络更新。


这篇文章应该会再回读,到时候再更新细节信息。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,100评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,308评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,718评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,275评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,376评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,454评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,464评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,248评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,686评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,974评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,150评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,817评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,484评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,140评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,374评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,012评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,041评论 2 351