目标检测—Fast R-CNN

本文记录的目的是方便自己学习和复习,有误之处请谅解,欢迎指出。

    Fast R-CNN建立在R-CNN和SPP的工作基础之上,使用了多种创新方法提升检测速度和准确率。

    1、首先基础卷积神经网络使用更优秀的CNN模型VGG16

    2、不单独对候选区图像进行卷积,直接对整张图像卷积,避免重复卷积计算

    3、不单独训练SVM分类器,使用Softmax

    4、候选区坐标回归模型训练嵌入网络

    5、将整个框架整合到一个网络中,进行端对端(end-to-end)的训练

一、基本流程 

Fast R-CNN框架
Fast R-CNN流程

    (1)使用选择性搜索(SS)为图像搜索候选框,与R-CNN一致

    (2)输入图像至VGG16提取整个图像的 feature map,将原图候选框映射至对应 feature map

    (3)通过ROI pooling,将候选框 feature map 转成需要的固定大小

    (4)输出候选框的类别概率

    (5)bounding box坐标修正

二、ROI pooling

    ROI pooling解决了R-CNN重复卷积的工作,直接将候选区域坐标映射至 feature map对应区域,然后经过ROI后,不同大小尺寸的候选区输出得到固定大小feature map。怎么将不同尺寸的候选区转换为相同大小呢?下面具体介绍。

    假设某个ROI pooling的大小为H*W,我们需要输出的特征图尺度为h*w,需要解决的问题是怎么划分原特征图区域得到h*w

    1)输出特征图h*w中的每一小块占原特征图H*W多大区域?这里就需要计算,ROI pooling使用平均分块策略,每块大小为\frac{H}{h}  \times \frac{W}{w},除不尽怎么办,向下取整。

    2)现在获得了每小块区域的大小,再进行最大池化。

具体例子:

    假设:某层整图卷积特征图大小为8\times 8,经过投影,将候选区区域投射至该层特征图后大小为5 \times 7,需要输出后大小变为2 \times 2

    某层整图卷积8\times 8特征图

    某候选区投影后,位置信息(左上角(0,3),右下角坐标(7,8)),大小为5 \times 7

    开始计算输出2 \times 2特征图每小块占多大区域。平均每块大小为,5/2 = 2.5,7/2=3.5,向下取整。第一块位置(0,0)大小2 \times 3,第二块位置(0,1)大小2 \times (7-3)=2\times4,第三块位置(1,0)(5-2) \times 3=3\times3,第四块位置(1,1)(5-2) \times (7-3)=3\times4。具体如下图

    最后max pooling得到

三、多任务损失(分类损失与坐标回归损失)

    R-CNN分类损失与回归损失是分开单独训练,Fast R-CNN将其一起整合至网络训练,进行加权组合训练多任务损失。分类损失和回归损失均有些许区别,后面介绍。具体公式如下:

    R-CNN采用SVM二分类合页损失,Fast R-CNN为对数损失函数L_{cls}(p,u) 表示分类损失,对于K+1类(包括背景),P={p_{0},p_{1},p_{2},....,p_{k} }u=0,1,2,3,...,k。公式如下

分类损失

    回归损失与R-CNN基本一致,主要在外面改成一个平滑函数smooth_{L_{1} }(x) 。公式如下

回归损失

    关于t_{i}^u -u_{i} 不做详细解释,R-CNN中有过讲解,其实就是回归候选框的偏移量和缩放量,使得预测框、候选框据离与真实框、候选框据离之间的差距尽可能小,让预测框与真实框更接近

    为什么增加一个平滑函数?主要为了限制梯度变化,当预测框与真实框差距较大时,梯度值不会过大。先看下L2与smooth L1的函数图像与导数形式

L2导数
smooth L1导数

    观察L2损失可以看到,当x增大时,x导数也随之增大。在训练初期,预测框与真实框差距过大时,导师梯度较大,训练不稳定

    观察smooth L1导数,在x较小时,对x的梯度也会变小,当x很大时,x梯度绝对值上线为1,不至于破坏网络参数

四、SVD全连接层加速

    另外一个改进点是在全连接层,使用奇异值分解(SVD)加快计算。学过矩阵论的应该有所了解,SVD就是矩阵论中的重要知识点。公式,图解如下

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,794评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,050评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,587评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,861评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,901评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,898评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,832评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,617评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,077评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,349评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,483评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,199评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,824评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,442评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,632评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,474评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,393评论 2 352

推荐阅读更多精彩内容