登录注册写文章

day4

day4

最小二乘法：在线性回归中，最小二乘法就是试图找到一条直线，使所有的样本到直线上的欧式距离之和最小。

均方误差对应了常用的“欧式距离”

特征缩放

在梯度下降算法中，常常会用到特征缩放。比如，两个特征之间的差距特别大，一个为1到3，另一个为1到2000，会导致梯度下降算法非常的不好用，这时候就会用到特征缩放。整体化为大致-1到1之间的范围。

还有一种情况，叫做均值归一化（mean normalization），如有有一个特征均值为a，那么用(Xi - a)来替代Xi，这样让这个特征的均值为0.

特征缩放的目的是：将梯度下降的速度变得更快让梯度下降收敛所需的循环次数更少

均值归一化

离差标准化，是对原始数据的线性变换，使结果值映射到[0 - 1]之间。

Paste_Image.png

如果要让均值在[-1，1]之间，可以让分子部分x-均值

z-score标准化，这种方法给予原始数据的均值（mean）和标准差（standard deviation）进行数据的标准化。经过处理的数据符合标准正态分布，即均值为0，标准差为1，转化函数

Paste_Image.png

在梯度下降算法的实用计较

在梯度下降算法中，学习率α的选择应该适中，如果太大的话会反向效果，导致误差函数值上升，如果太小，会需要进行多次梯度下降算法，太过复杂。
一般来说α的选择可以取值为：0.001，0.01，0.1，1，...

最后编辑于：2017.12.10 04:23:18

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

CS231n (winter 2016) : Assignment1
前言：以斯坦福cs231n课程的python编程任务为主线，展开对该课程主要内容的理解和部分数学推导。该课程的学...
Deepool阅读 49,347评论 33赞 88
机器学习算法小结与收割offer遇到的问题
机器学习是做NLP和计算机视觉这类应用算法的基础，虽然现在深度学习模型大行其道，但是懂一些传统算法的原理和它们之间...
在河之简阅读 20,557评论 4赞 65
菜鸟实习日记~day4(预处理+Resnet+VGG)
科研： 1.数据预处理（归一化）去均值，这是最常见的图片数据预处理，简单说来，它做的事情就是，对待训练的每一张图...
飞翔的小瓜瓜阅读 1,627评论 0赞 0
写给紫煊的100封情书 59/100
紫煊：我亲爱的宝贝！妈妈真真切切觉得你是个“好孩子”！最近，你有些自卑和沮丧，总在问我“妈妈，我是个...
窚煊阅读 213评论 0赞 1
170218－万物简史1
宇宙从无到有，从宇宙的结构和组成出发，用通俗的方式展示宇宙的结构。然后定位到我们的地球。从测量地球大小和重量，到地...
譕紥惗阅读 215评论 1赞 0

赞1赞

赞赏

手机看全文