RCNN 粗略理解

前沿知识了解【5】https://www.cnblogs.com/skyfsm/p/6806246.html

做图像识别,我们很简单的一个想法就是,拿一个大小不同的矩形框,在图像上不同的滑动。在理论上,我们总会找到一个大小适合的矩形框恰好标记了这个物体。但这种做法,消耗的时间和计算量都非常的大。后来就有人提出,我们先对图像提取出可能存在物体的候选框(Selective Search),然后对这些候选框进行识别(即CNN操作)。

Selective Search:

简单的方法,根据颜色,纹理之类的信息去把图片划分成不同区域,哪怕是精度不高也可以相对于穷举搜索大量减少计算量。就是这么简单的搜索剪枝思路,几乎成为了当前深度学习物体识别领域的基本原则之一了。
作者的实现,首先通过简单的区域划分算法,将图片划分成很多小区域,再通过相似度和区域大小(小的区域先聚合,这样是防止大的区域不断的聚合小区域,导致层次关系不完全)不断的聚合相邻小区域,类似于聚类的思路。这样就能解决object层次问题,实际上也是非常成熟的技术。
其次,作者为了保证能够划分的完全,对于相似度,作者提出了可以多样化的思路,不但使用多样的颜色空间(RGB,Lab,HSV等等),还有很多不同的相似度计算方法。

训练模型方式

一般来说是通过 Fine-Tuning 的方式来训练网络(类似迁移学习),首先使用 ImageNet 的数据集去训练网络(如:AlexNet, VGG)等。这种训练的方式,目的在于给 Fine-Tuning 时候留一个好的初始化的参数值(W,b)。对数据开始做proposal 的操作,一般一张图片可以生成1000~2000个候选框,将这些候选框与原始框进行IOU处理,将小于0.5的框舍弃。剩下的框对原始的网络进行 fine-tuning 的学习。之后去掉,网络结构中的softmax层,我们只需要利用网络来进行特征的提取。其中, f6 或 f7 层的提取出来的语义特征来进行 SVM 的操作,在 SVM 分类时,我们需要将 IOU 处理时候的阈值提高(即选择 0.3)这样,使得 SVM的分类时的数据更加精细,来训练SVM。其中,pool 5 层出来的抽象图像信息来进行线性回归的训练操作(详细可以参考博客【2】【3】)。

训练过程图解

  1. 使用 Selective Search 寻找出多个候选框:
  1. CNN 的训练模式
    前面选出的候选框中,将IOU > 0.5 【可选择】,设定为正样本, 其余为负样本:
  1. 通过CNN网络筛选出特征,训练SVM
    整理对于候选框要进行新一轮的筛选,来进行SVM的训练
  1. 回归器的训练:

P.S: 因为 NMS 步骤不需要训练,这里就没有列举出该步骤。

RCNN 的缺点

(1)首先RCNN的训练方式,如前面所写,是多级流水线的方式,它是逐步叠加的,这就造成了在训练阶段的开销过大。
(2)RCNN在做测试的时候,它需要先获取每个候选框,然后对每个候选框都在网络中做一次正向传播来做一次进行特征提取。这就导致了一张图的某些区域需要被计算多次,导致计算量过大。

参考博客:
【1】https://www.cnblogs.com/skyfsm/p/6806246.html
【2】https://blog.csdn.net/bixiwen_liu/article/details/53840913
【3】https://blog.csdn.net/abc15766228491/article/details/82320111
【4】https://blog.csdn.net/qq_28132591/article/details/73549560?utm_source=copy
【5】https://www.cnblogs.com/skyfsm/p/6806246.html
【6】https://blog.csdn.net/zijin0802034/article/details/77685438
【7】https://zhuanlan.zhihu.com/p/23006190

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,869评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,716评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,223评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,047评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,089评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,839评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,516评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,410评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,920评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,052评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,179评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,868评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,522评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,070评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,186评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,487评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,162评论 2 356

推荐阅读更多精彩内容