DeepLab系列之V1

  1. DeepLab系列之V1
  2. DeepLab系列之V2
  3. DeepLab系列之V3
  4. DeepLab系列之V3+

概述

作者发现Deep Convolutional Neural Networks (DCNNs) 能够很好的处理的图像级别的分类问题,因为它具有很好的平移不变性(空间细节信息已高度抽象),但是DCNNs很难处理像素级别的分类问题,例如姿态估计和语义分割,它们需要准确的位置信息。

  1. 两个问题要处理:
  • 重复池化和下采样导致分辨率大幅下降,位置信息丢失难以恢复
  • 空间不变性导致细节信息丢失
  1. 处理方案:
  • 空洞卷积
  • Fully-connected Conditional Random Field (CRF)

3.优势

  • 速度很快,DCNN 8fps,CRF需要0.5秒
  • 准确率高,当时在PASCAL的语义分割集上效果最好
  • 结构简单,DCNN和CRF的组合

网络结构—DCNN

  1. 啥是空洞卷积?
    论文中给出了示意图:

    Input stride 也就是空洞因子或者膨胀因子,在同样的卷积核大小下,通过增加Input stride可以增大卷积核的感受野。更好的示意图:

    可以发现感受野从3变成 了5,近似的扩大了2倍,卷积核大小仍为3x3,Input stride为2,现在都叫dilate rate
  2. Finetune VGG-16
    重温VGG-16结构图:



    作者为了加载预先在ImageNet训练好的VGG-16模型,并保证图片仅缩放了8倍做了如下修改:

  • 把全连接层(fc6、fc7、fc8)改成卷积层(做分割嘛)
  • 把最后两个池化层(pool4、pool5)的步长2改成1(保证feature的分辨率)
  • 把最后三个卷积层(conv5_1、conv5_2、conv5_3)的dilate rate设置为2,且第一个全连接层的dilate rate设置为4(保持感受野)
  • 把最后一个全连接层fc8的通道数从1000改为21(分类数为21)
  1. 加速训练
    第一个全连接层fc6,通道数从4096变为1024,卷积核大小从7x7变为3x3,后续实验中发现此处的dilate rate为12时(LargeFOV),效果最好。

网络结构—CRF

通常网络中分类准确率和位置准确性是一对矛盾的存在,有一些工作尝试在保证分类准确率的条件下解决位置问题:

  • 利用卷积网络中多个层次的信息
  • 利用超像素,把位置问题交给底层次的分割处理(此处低层次分割是无语义分割)

一般利用到条件随机场(CRFs)来处理分割中不光滑问题,它只考虑到目标像素点的附近点,是一个短距离的CRFs。由于网络中得到的结果已经比较光滑了,更希望的是修复一些小的结构,所以用到了全连接的CRF模型。它的能量函数:

  • 目标就是要最小化能量函数,先看第一项:

    这一项保证了分类的准确率,准确率越高P(x)越接近1(0到1),此项值越小。
  • 再看第二项:

    此处有:

    说明只考虑标签不相同的两个像素点,因为是全连接所以这两个点为模型中任意两点!!!

    为其右边式子的权重,右边的它是一个高斯核函数

    此高斯核函数具体为:

    此核函数主要由两个像素点的位置颜色决定,位置为主,颜色为辅。右下角带有αβγ的参数和w1w2参数,试验时由w2=3γ=3决定,搜索最优。
    效果如图所示:

    可以看到DCNN output的边缘虽然比较光滑,但是缺少了很多细节信息,而随着CRF的迭代优化,细节更加突出。
  • 高斯核是啥呢?
    借用百度的原话:
    高斯核函数形式为 k(||x-xc||)=exp{- ||x-xc||2/(2*σ2) } 其中xc为核函数中心,σ为函数的宽度参数 , 控制了函数的径向作用范围。分布如图所示:

网络结构—MLP

作者也尝试融合了多层次信息,前四个pool层之后都额外接了两个卷积层,第一个卷积层128 3x3,第二卷积层128 1x1,和最后一个softmax层concat之后会有5*128=640个通道,训练这部分分支时,固定其它网络的参数。
发现多层次融合后能提升细节信息,但是没有CRF来的明显。

实验

  1. 以下是自对比实验


  • MSc—多层次融合
  • CRF—全连接条件随机场
  • LargeFOV—fc6的dilate rate为12

从图中可以发现DeepLab-CRF-LargeFOVDeepLab-CRF-LargeFOV的mean IOU相同都为67.64,说明7x7的卷积核和dilate rate为12的3x3卷积核效果一样,而3x3的卷积核参数更少。

  1. 与FCN-8s和TTI-Zoomout-16的效果对比

    从上到下依次为原图真值图被对比的效果图DeepLab-CRF的效果图
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,287评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,346评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,277评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,132评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,147评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,106评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,019评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,862评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,301评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,521评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,682评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,405评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,996评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,651评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,803评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,674评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,563评论 2 352