登录注册写文章

CS231N 学习笔记 Lecture_3 & 4 损失函数和优化器神经网络简介和BP

CS231N 学习笔记 Lecture_3 & 4 损失函数和优化器神经网络简介和BP

视频在b站上有

线性分类器：定义一个loss函数，然后做optimization----使得loss最小。在W空间中搜索最佳的W

A loss function tells how good our current classifier is.

多分类SVM：

对所有类别进行总和，除了正确的类别Yi。公式中，如果正确的分类比错误的分类大（在一个安全区域内，设置为1），那么loss为0

比如说有一个W使得loss为0，也会有其他的W使得loss为0，即其不唯一。比如2W也使得loss为0

Regularization用于防止过拟合

常见的Regularization方法：

最常用的是L2（也称为weight decay），L2正则化是在惩罚欧几里得的规范。加正则化项是迫使模型倾向于简单的模型

Softmax Classifier：

Optimization

第一种方法：random search，随机初始化W，然后挑选loss最小的

第二种：梯度下降

gradient check：http://blog.csdn.net/lanchunhui/article/details/51279293

计算整个数据集上的loss会很慢，所以使用minibatch，Stochastic Gradient Descent(SGD)随机梯度下降

Numerical gradient：每次用一个很小的值更新W，然后计算loss值，接着估计gradient

Analytic gradient：求偏导数

在神经网络之前的方法，取特征然后进行分类，常见的特征1. 颜色，各个颜色的多少 2. 边缘信息 Histogram of Oriented Gradients方向直方图 3. bag of words

BP：

从节点之后传递回来的梯度乘以local的梯度，再反向传递回去。

加法相当于将梯度分配给之前的每个节点，都相同。max相当于路由，只传递给较大的那一个节点。乘法相当于梯度switcher，转换器吧，收到其他节点输入值的影响。

分支的反向传回来的梯度相加

Neural Network：

对于之前的线性方程f=Wx，进行修改f=W2max(0, W1x) W1相当于去学习一些模版，W2是这些模版的加权

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

李理：Theano tutorial和卷积神经网络的Theano实现 Part1
本系列文章面向深度学习研发者，希望通过Image Caption Generation，一个有意思的具体任务，深入...
imGeek阅读 5,843评论 0赞 8
CS231n (winter 2016) : Assignment1
前言：以斯坦福cs231n课程的python编程任务为主线，展开对该课程主要内容的理解和部分数学推导。该课程的学...
Deepool阅读 49,552评论 33赞 88

cs231n系列1-6:神经网络第二部分：设置数据与损失函数
说明：本系列文章翻译斯坦福大学的课程：Convolutional Neural Networks for Vis...
Warren_Liu阅读 8,829评论 0赞 0
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念
谷歌开发者机器学习词汇表：纵览机器学习基本词汇与概念姓名：钟航转载自：http://mp.weixin.qq....
XavierZHH阅读 5,945评论 0赞 7
开发者必看：超全机器学习术语词汇表！
A 准确率（accuracy）分类模型预测准确的比例。在多类别分类中，准确率定义如下：在二分类中，准确率定义为...
小小孩儿的碎碎念阅读 7,510评论 0赞 9

赞1赞

赞赏

手机看全文