Stanford cs231n

计算机视觉概述


computer vision 针对视觉数据的研究
视觉传感器的增长和发展(eg 手机)

超级多的视觉数据
思科2015研究:估计到2017 互谅网上大约80%的流量都是视频
但是视觉数据很大,接下来的问题就是如何用算法开发和利用这些数据

视觉数据真的很难理解
另一个统计youtube 每一秒 就有长达5h的视频传到youtube(eg 我的一个朋友,网易实习,视频标记,分类)

计算机视觉跨学科领域(生物,物理,cs,math)。。。

cv历史背景


视觉的历史很久很久以前,水里的动物进化出了眼睛,以为澳大利亚研究者,进化出眼睛,视力功能促进了物种数量的爆炸。视觉对于智慧的动物至关重要。
照相机的历史,留住世界。

60s研究动物的视觉处理机制,用猫来研究,观察什么会引起神经皮层的反应。视觉处理起始于视觉世界的简单结构,边缘。再认识复杂的。

《vision》david marr 70s
边缘,曲线,2.5曲面----》3d模型
同样是70s,识别和表示现实世界的试题,每个对象都由简单的几何图组成

80s,重建和识别视觉空间

目标分割

2000 face detection,adaboost实时面部检测
2006 fujjika面部检测的相机

90-00 一个非常有影响力的思想方法是:基于特征的目标识别,SIFT特征
某些特征在变化中具有整体性和不变性,所以目标识别的首要任务就是在目标上确认这些关键的特征。

整体场景识别,空间金字塔特征,方向梯度直方图

2006-2012 pascal visual object challenge 目标识别的数据集

训练数据不够,出现过拟合,组件ImageNet数据集(目标检测)

imagenet大规模视觉是被竞赛,140图像,1000类别
2012 错误率显著下降。--CNN算法(重点)

图像分类问题


2015 微软残差网络 152层
1998手写数字识别,类似2012的alexnet网络

突破性进展
1 计算能力提升,GPU具有超高并行计算能力
2 data 带标签数据集Pascal imagenet

Lecture02

image classification pipeline


图像是一堆数字,每个数字三个值组成rgb

图像识别有很多挑战:illumination deformation变形,遮挡,背景干扰

数据驱动方法


之前使用硬编码规则,计算图像边缘,将形状分类号,但是这样不可推演,对于每一个物体都要重新编写一套规则
现在:使用数据驱动的训练,抓取数据集,训练机器分类图像,总结,生成一个模型,来识别新的图像


image.png

训练函数 接受输入图片和标签输出 模型
预测函数 接受模型 对图片预测

image.png

寻找最相近的图片

image.png

在训练集中找到最相似的图片,找到其标签,这个时候就可以说测试图片是什么类别

NN分类器
对于两张图片比较
什么样的比较函数
曼哈顿距离:


image.png
image.png
image.png

k赋值大,决策边缘光滑
白色区域表示没有获得k邻近的投票,没有最近的点

k-最近邻算法


image.png

曼哈顿距离 每个像素之前的距离总总和
欧氏距离(距离是确定的,无论在什么坐标系中)


image.png

与实际解决的问题有关的超参数

机器学习中,我们关心的不是尽可能拟合,而是要让我们的分类器,我们的方法,在训练集以外的未知数据上表现更好。


image.png

测试集是个我们的算法一个评估,即在没遇到的数据上算法表现将会如何


image.png

验证集,分验证集和测试集,最后一步接触到测试集,确保测试集数据得到严格的控制


image.png

交叉验证适合于小的数据集


image.png

深度学习中,大型模型不使用


image.png

knn不适合用于图像分类


image.png

维度灾难 高维空间的像素很多


image.png
image.png

线性分类

linear classification


image.png
image.png
image.png

image.png

image.png

但是在现在参数化的过程中,


image.png

image.png

image.png

测试的时候我们需要的是参数

image.png

b是偏置项

image.png

线性分类是一种模板匹配方法


image.png

线性分类器每个类别只能学习一个模板

image.png
  • 回顾:


    image.png

    image.png

线性分类器可以解释为每个种类的学习模板,对图里的每个像素以及10个分类中的一类,矩阵w里都有一些对应的项,告诉我们那个像素,对那个分类有多少影响,也就是说矩阵w里的每一行,都对应一个分类模板,如果我们解开这些行的值(成图片的大小),那么每一行又分别对应一些权重,每个图像像素值和对应的那个类别的一些权重,将这行分解回图像的大小,我们
就可以可视化学到的每个类的模板

还有一种对线性分类器的解释是,学习像素在高维空间的一个线性决策边界,其中高伟空间就对应了图片能取到的像素密度值

如何选择w?

损失函数


image.png
image.png
image.png

image.png

image.png
定量的衡量

定量的衡量w是好是坏

image.png
image.png

image.png

给出y的预测

二元svm。两个类,要么是正例要么是负例,推广到多分类SVM(支持向量机),推广到多个类别识别


image.png

image.png
image.png

SVM函数只关注于正确的分数比

一个损坏函数的全部意义在于量化不同的错误到底有多坏

加入正则项


image.png

其他损失函数:
Softmax loss


image.png

目标是促使我们计算得到的概率分布,就是通过softmax计算的结果,去匹配上述的目标概率分布,即正确的类别应该具有几乎所有的概率

svm vs softmax?

优化函数

optimization


对于参数w的一些设置,w所带来的损失,使用迭代,改进


image.png

这就是普遍使用的方法:梯度下降


image.png

函数下降最快的地方

image.png
image.png

最后网络收敛
步长是一个超参数,在那个方向前进多少距离,这个步长也被叫做学习率
(他是你需要设定的一个重要参数)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,542评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,596评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,021评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,682评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,792评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,985评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,107评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,845评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,299评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,612评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,747评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,441评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,072评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,828评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,069评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,545评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,658评论 2 350

推荐阅读更多精彩内容