论文笔记 - OSVOS: One-Shot Video Object Segmentation

项目地址:http://www.vision.ee.ethz.ch/~cvlsegmentation/osvos/

摘要


本论文解决了半监督视频物体分割的问题,即只给第一帧的掩模(mask)从视频背景中分离出物体。我们提出OSVOS的方法,该方法基于神经网络结构,可以成功将ImageNet数据集学习到的特征迁移到视频分割任务中,并且以极大的优势取得了state-of-the-art水平。

1.介绍——从预训练网络到OSVOS


卷积神经网络在图像分类、物体检测、图像分割等任务中取得了巨大成功,但是一个严重的问题是依赖于大量的训练数据。这篇论文研究了如何只给定一帧图片的掩模将视频中的物体分割出来,提出了一种半监督视频分割CNN模型:OSVOS。图1展示了OSVOS的结果,红色是第一帧掩模,绿色是预测结果。


图1

本文第一个贡献是将图像识别任务中的预训练CNN模型迁移到只有一张图片标注(one-shot)的视频分割任务中。然后,将它在人工分割的视频数据集上训练。最后在测试阶段,只在一帧人工标注的图片finetune。图2展示了这一方法的概览。


图2

第二个贡献是OSVOS独立处理视频的每一帧,同时以副产品的形式取得了不错的时间连续性。考虑到物体在两帧之间变化不大,我们独立处理每一帧图片,与主流方法着重考虑时间连续性不同。这些主流方法在渐变的连续帧之间取得了不错的分割性能,但是对于遮挡和不完整的运动情况效果不太好。运动检测确实是当前视频分割算法中的关键组成,但是相关计算却是一个很大的问题。我们认为时间连续性并不是现在一定要考虑的问题,我们更应该关注如何提高分割的准确性。另一方面,我们的模型也展示了深度学习的方法在独立处理每一帧时也能保证优异的时间连续性。自然的,OSVOS有以下有点:在遮挡时也可以进行分割,不局限与某些运动,不需要处理时序信息也就没有时序错误累积。

第三个贡献是OSVOS可以在速度与准确性的权衡之间作多种选择。用户可以选择更高准确率或者更高分割速度,实验显示OSVOS每帧181ms的速度可以取得71.5%的准确率,每帧7.83s的速度取得79.7%的准确率。另外,用户可以标注更多的视频帧来提高准确率,实验显示每个视频标注2张可以取得84.6%的准确率,标注4张可以取得86.9%的准确率。


2.相关工作


视频物体分割与跟踪

大多数半监督视频物体分割强调时间连续性,通过前一帧的掩模来预测下一帧的掩模,同时为了减少计算会使用superpixels,patches,object proposals等方法。与这些方法不同,OSVOS独立处理每一帧,更准确更快速。对于视觉跟踪(使用边界框替代分割)的情况也是类似。

用于分割的全卷积神经网络

全卷积神经网络(FCNs)大大推进了语义分割任务的进度。FCN的作者将最后的全连接层改为1×1的卷积,这样可以训练任意大小的图片,并且大大减少网络参数,同时也需要较少的标记数据。反卷积层可以用于上采样,在预测感兴趣区域过程中很有作用,但是这种结构训练参数庞大并且需要大量数据。受到FCNs的启发,深度网络的中间网络层也被用来作轮廓检测。

3.One-Shot 深度学习


我们训练了用于分离前景和背景的二元FCN,接着又在包含物体的大量数据上训练通用前景物体识别模型(“It is this particular object.” ),最后在一个小的特定实例上finetune以分割出特定物体(“It is this particular object.” )。

3.1. 端到端可训练前景FCN

4.实验验证


5.结论


使用深度学习方法分割视频物体依赖于大量训练数据,而人类则需要一个训练样本,这篇论文表明了计算机也可以复制这种能力:我们提出的OSVOS,在通用数据集预训练神经网络并在一张训练样本上finetune,最终在DAVIS数据集上取得state-of-the-art水平。我们独立处理每一帧,但是分割结果依然取得很好的时间连续性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容