Stanford cs231n

计算机视觉概述

computer vision 针对视觉数据的研究
视觉传感器的增长和发展（eg 手机）

超级多的视觉数据
思科2015研究：估计到2017 互谅网上大约80%的流量都是视频
但是视觉数据很大，接下来的问题就是如何用算法开发和利用这些数据

视觉数据真的很难理解
另一个统计youtube 每一秒就有长达5h的视频传到youtube（eg 我的一个朋友，网易实习，视频标记，分类）

计算机视觉跨学科领域（生物，物理，cs，math）。。。

cv历史背景

视觉的历史很久很久以前，水里的动物进化出了眼睛，以为澳大利亚研究者，进化出眼睛，视力功能促进了物种数量的爆炸。视觉对于智慧的动物至关重要。
照相机的历史，留住世界。

60s研究动物的视觉处理机制，用猫来研究，观察什么会引起神经皮层的反应。视觉处理起始于视觉世界的简单结构，边缘。再认识复杂的。

《vision》david marr 70s
边缘，曲线，2.5曲面----》3d模型
同样是70s，识别和表示现实世界的试题，每个对象都由简单的几何图组成

80s，重建和识别视觉空间

目标分割

2000 face detection，adaboost实时面部检测
2006 fujjika面部检测的相机

90-00 一个非常有影响力的思想方法是:基于特征的目标识别，SIFT特征
某些特征在变化中具有整体性和不变性，所以目标识别的首要任务就是在目标上确认这些关键的特征。

整体场景识别，空间金字塔特征，方向梯度直方图

2006-2012 pascal visual object challenge 目标识别的数据集

训练数据不够，出现过拟合，组件ImageNet数据集（目标检测）

imagenet大规模视觉是被竞赛，140图像，1000类别
2012 错误率显著下降。--CNN算法（重点）

图像分类问题

2015 微软残差网络 152层
1998手写数字识别，类似2012的alexnet网络

突破性进展
1 计算能力提升，GPU具有超高并行计算能力
2 data 带标签数据集Pascal imagenet

Lecture02

image classification pipeline

图像是一堆数字，每个数字三个值组成rgb

图像识别有很多挑战：illumination deformation变形，遮挡，背景干扰

数据驱动方法

之前使用硬编码规则，计算图像边缘，将形状分类号，但是这样不可推演，对于每一个物体都要重新编写一套规则
现在：使用数据驱动的训练，抓取数据集，训练机器分类图像，总结，生成一个模型，来识别新的图像

image.png

训练函数接受输入图片和标签输出模型
预测函数接受模型对图片预测

image.png

寻找最相近的图片

image.png

在训练集中找到最相似的图片，找到其标签，这个时候就可以说测试图片是什么类别

NN分类器
对于两张图片比较
什么样的比较函数
曼哈顿距离：

image.png

k赋值大，决策边缘光滑
白色区域表示没有获得k邻近的投票，没有最近的点

k-最近邻算法

image.png

曼哈顿距离每个像素之前的距离总总和
欧氏距离（距离是确定的，无论在什么坐标系中）

image.png

与实际解决的问题有关的超参数

机器学习中，我们关心的不是尽可能拟合，而是要让我们的分类器，我们的方法，在训练集以外的未知数据上表现更好。

image.png

测试集是个我们的算法一个评估，即在没遇到的数据上算法表现将会如何

image.png

验证集，分验证集和测试集，最后一步接触到测试集，确保测试集数据得到严格的控制

image.png

交叉验证适合于小的数据集

image.png

深度学习中，大型模型不使用

image.png

knn不适合用于图像分类

image.png

维度灾难高维空间的像素很多

image.png

线性分类

linear classification

image.png

但

但是在现在参数化的过程中，

image.png

测试的时候我们需要的是参数

image.png

b是偏置项

image.png

线性分类是一种模板匹配方法

image.png

线性分类器每个类别只能学习一个模板

image.png

回顾：

image.png

image.png

线性分类器可以解释为每个种类的学习模板，对图里的每个像素以及10个分类中的一类，矩阵w里都有一些对应的项，告诉我们那个像素，对那个分类有多少影响，也就是说矩阵w里的每一行，都对应一个分类模板，如果我们解开这些行的值（成图片的大小），那么每一行又分别对应一些权重，每个图像像素值和对应的那个类别的一些权重，将这行分解回图像的大小，我们
就可以可视化学到的每个类的模板

还有一种对线性分类器的解释是，学习像素在高维空间的一个线性决策边界，其中高伟空间就对应了图片能取到的像素密度值

如何选择w？

损失函数

image.png

定量的衡量

定量的衡量w是好是坏

image.png

给出y的预测

二元svm。两个类，要么是正例要么是负例，推广到多分类SVM（支持向量机），推广到多个类别识别

image.png

SVM函数只关注于正确的分数比

一个损坏函数的全部意义在于量化不同的错误到底有多坏

加入正则项

image.png

其他损失函数：
Softmax loss

image.png

目标是促使我们计算得到的概率分布，就是通过softmax计算的结果，去匹配上述的目标概率分布，即正确的类别应该具有几乎所有的概率

svm vs softmax？

优化函数

optimization

对于参数w的一些设置，w所带来的损失，使用迭代，改进

image.png

这就是普遍使用的方法：梯度下降

image.png

函数下降最快的地方

image.png

最后网络收敛
步长是一个超参数，在那个方向前进多少距离，这个步长也被叫做学习率
（他是你需要设定的一个重要参数）

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,287评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,346评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,277评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,132评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,147评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,106评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,019评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,862评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,301评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,521评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,682评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,405评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,996评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,651评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,803评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,674评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,563评论 2赞 352

Stanford cs231n

计算机视觉概述

cv历史背景

图像分类问题

Lecture02

image classification pipeline

数据驱动方法

k-最近邻算法

线性分类

linear classification

损失函数

优化函数

optimization

推荐阅读更多精彩内容