深度学习完全攻略!(连载十一:YOLO原理理解)

翻了翻之前的文件夹,找到这个之前整理的YOLO理解文档,在此基础上,做了一些修改,特做更新。

我相信很多同学在理解YOLO的时候是有很多疑惑的,尤其是1个cell,两个 bounding box,20个类别,简直头大。这篇文章带你来理解,如果有错误,不吝赐教。

相比于RCNN系列的算法,YOLO将分类问题转换为回归问题。关于RCNN系列,会在后面更新,请不要捉急。

既然是回归问题,就要用回归的思维来看待。什么意思呢?比如说,我们预测2019年12月的房价,它是有很多因素共同起作用,每个因素可以看作x,有了历史数据,假设房价是线性变化,那么我们只需要求得系数,就可把12月的x带进去,就得到了房价。整么来理解YOLO呢?

首先,图像就是输入,如果把图像分成块的话,每个块就是x,现在有很多这样的图像,那么只需要求得一组系数,对于新来的一幅图x’,就可以把x’带进去,就知道这个块或这幅图是什么东西。那么这个系数就可以看作是bounding box(就是把目标框住的那个框框)。虽然每个块只需要一个bounding box,但是,这个bounding box到底长什么样,我们不知道。与其这样,倒不如1个cell里面多高几个bounding box,那个好就用那个,反正,最后我只用其中一个就行了。开始的时候,我们并不知道bounding box的形状,只知道有几个。怎么办呢,别捉急。让CNN去学习吧。我们有几千万的训练集,还怕啥。我想这应该就是YOLO的核心思想了。我想,稍微分析下,应该就看出来,这种方法准确度应该是有问题的,而实验也证明了这一点。这很类似于RCNN中的bounding box regression(请参考我的其他博客)。

好吧,我表示原始论文看起来真他呀费劲。

找了很久,这篇博客写的也不错,可以看看。

<u>https://segmentfault.com/a/1190000016692873?utm_source=tag-newest</u>

话不多说,上菜。我感觉还是不要按照原文的思路来,太费劲了。

第一,先说一说IOU,置信度

先上图。

图片1.png

把图像分成77的块,那么对于输入的图像就可以构建一个77*30的张量,这些标签都是已知的。

图片2.png

P(object):就是说这个cell中存在物体的概率。怎么定义是否有目标呢?如果目标的中心点在这个cell里面,那么就认为有目标,如果不在,就没有目标。取值为0和1.

定义置信度:如果cell里面有目标,那么就用IOU来计算预测值(预测的bounding box)和真实值(真实的bounding box)差异。

P(class|objet):就是说这个cell存在物体,而且是某个类的概率。

那么最终,对于某个cell的一个box 预测某个类的概率就表示为:

P(class|objet)P(object)IOU

比如说上面的情况,只有一个类。

我们就可以定义这样的训练标签,如果有错误请指出。

【000000000000000000000000000000 // 第一个cell
000000000000000000000000000000
.......
1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0.7,0.02,0.14,0.14,0,0,0,0 // 第23个cell
........
000000000000000000000000000000】 // 第49个cell

第二,再说一说网络结构

此处是截图

图片3.png

下面这个图视乎更直观一点。原始图像卷啊卷,就被卷成了7730这样的张量。这家伙跟cell有什么关系呢?比如说,cell是77的,卷啊卷,最后原始图像中的一个块,就成了77中的一个点。

图片4.png

第三,然后说一说训练过程

在上面我们可以看到,YOLO就是一个网络,卷积,池化,全连接,最后输出一个7730的tensor。此处应该有个图,我想应该很直观了,那就用本文的第一个图吧。

我觉得我们不能被有些博客给迷惑了。好吧,还是说说这个最终的tensor是个啥样的。就是这样的,一条粗粗链子。对于整个网络来说,你给他一幅图,它卷啊卷,池啊池,啪,输出一个7730的张量。假设这个张量就是OK的,就是我们想要的,那么,我们按照张量的结果,进行解析,就可以在图上画出这个(x,y,w,h)对应的区域。好了,一般情况下第一次肯定不可能就得到好的结果,那怎么办呢?我们在输入训练图像的时候,是不是有标签呢,而且是不是也有对应的类别的信息呢。整,把这些信息搞成7730的张量,这样不就可以用反向传播去迭代了嘛。一遍一遍的训练。你会发现,最后输出的张量,越来越是我们想要的。就是这么神奇。

第四,总结一下吧

我自己还是挺喜欢YOLO的,简单有效,思路清奇。YOLO有很多小细节,推荐的博客里面有介绍,我就不说了。后续会继续更新V2和V3版本。本文已同步至公众号,欢迎订阅。


qrcode_for_gh_3d990a2340da_258.jpg
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容