机器学习(5)——代价函数误差分析

代价函数简介

  代价函数(Cost Function),通常也被称为损失函数(Loss Function)。这类函数是机器学习乃至整个数据科学学科中最为重要的一类函数模型,它直观的将数据的拟合程度呈现在我们面前。对于机器学习的目标,无非也就是最小化误差,也就是让代价函数最小化。训练模型的过程就是优化代价函数的过程,代价函数对每个参数的偏导数就是梯度下降中提到的梯度,防止过拟合时添加的正则化项也是加在代价函数后面的。因此我觉得有必要花点时间进行讨论一番。
  我们先做一个代价函数的简单的定义,代价函数:假定有样本数据(x_i,y_i),函数模型为f,参数为\omega。拟合曲线用f(\omega^Tx)表示。代价函数是一个有点抽象的东西,理论上能反应拟合函数f(\omega^Tx)与真实值y差异的函数都可以用来作为我们的代价函数。通常代价函数写成C(\theta),不过我们一般会进行求均值,写成J(\theta)。代价函数是一个关于\theta的函数,这点很好理解,因为我们知道,对于给定的算法,误差期望应该是一定的,但是拟合函数参数的变化却会影响误差。算法在寻找最优参数的过程,我们记为:
\underset{\theta}{min}J(\theta)

几种常见的代价函数

  平均绝对误差(L1误差函数): 平均绝对误差(MAE)其实就是类似统计学中的标准差,它的具体公式如下:
MAE=\frac{\sum_{m=0}^m{\left |y-y_i \right |}}{m}
  它的图像:

MAE.png

  均方误差函数(L2误差函数): 均方误差函数(MSE)也就是我们熟知的方差,它广泛的运用在一些线性问题上,下式中底的2,是为了方便求导约去,并无实际意义,它的公式如下:
MSE=\frac{\sum_{m=0}^m(y-y_i)^2}{2m}

  它的图像:
MSE.png

  平滑平均绝对误差(Huber损失): Huber损失相比于平方损失来说对于异常值不敏感,但它同样保持了可微的特性。它基于绝对误差但在误差很小的时候变成了平方误差。我们可以使用超参数
\delta
来调节这一误差的阈值。当
\delta\rightarrow 0
它就退化成了MAE,而当
\delta\rightarrow\infty
则退化为了MSE,其表达式如下,是一个连续可微的分段函数:
L_\delta(y,f(x))=\left\{\begin{matrix} \frac{1}{2}(y-f(x))^2,&\left |y-f(x)\right|<\delta\\ \delta\left |y-f(x)\right|-\frac{1}{2}\delta^2,&otherwise \end{matrix}\right.

  它的图像:
Huber.png

  对于Huber损失来说,
\delta
的选择十分重要,它决定了模型处理异常值的行为。当残差大于
\delta
时使用L1损失,很小时则使用更为合适的L2损失来进行优化。
  Huber损失函数克服了MAE和MSE的缺点,不仅可以保持损失函数具有连续的导数,同时可以利用MSE梯度随误差减小的特性来得到更精确的最小值,也对异常值具有更好的鲁棒性。而Huber损失函数的良好表现得益于精心训练的超参数
\delta

  Log-Cosh损失函数: Log-Cosh损失函数是一种比L2更为平滑的损失函数,利用双曲余弦来计算预测误差:
L(y,y^p)=\sum_{i=1}^nlog(cosh(y_i^p-y_i))

  它的图像:
Log-Cosh.png

  它的优点在于对于很小的误差来说
log(cosh(x))\approx\frac{x^2}{2}
,而对于很大的误差则与
|x|-log2
很相近。这意味着log cosh损失函数可以在拥有MSE优点的同时也不会受到异常值的太多影响。它拥有Huber的所有优点,并且在每一个点都是二次可导的。
  但是Log-cosh损失并不是完美无缺的,它还是会在很大误差的情况下梯度和 hessian 变成了常数。
  交叉熵CrossEntropy代价函数: 我们在之前已经极为详细的讲述过交叉熵的概念了,交叉熵通常用于分类问题上的代价函数,尤其在逻辑回归,神经网络中使用的更多。
J(\omega)=-\frac{1}{m}[\sum_{i=1}^my^ilogh_\omega(x^i)+(1-y^i)log(1-f_\omega(x^i))]

一点比较:

  均方误差(MSE)在误差较大点时的损失远大于平均绝对误差(MAE),它会给异常值赋予更大的权重,模型会全力减小异常值造成的误差,从而使得模型的整体表现下降。
  所以当训练数据中含有较多的异常值时,平均绝对误差(MAE)更为有效。当我们对所有观测值进行处理时,如果利用MSE进行优化则我们会得到所有观测的均值,而使用MAE则能得到所有观测的中值。与均值相比,中值对于异常值的鲁棒性更好,这就意味着平均绝对误差对于异常值有着比均方误差更好的鲁棒性。
  但MAE也存在一个问题,特别是对于神经网络来说,它的梯度在极值点处会有很大的跃变,及时很小的损失值也会长生很大的误差,这很不利于学习过程。为了解决这个问题,需要在解决极值点的过程中动态减小学习率。MSE在极值点却有着良好的特性,及时在固定学习率下也能收敛。MSE的梯度随着损失函数的减小而减小,这一特性使得它在最后的训练过程中能得到更精确的结果。

  当然还有很多的代价函数,例如分位数损失等等,我们在这里就不进行一一展开讲述了,感兴趣的读者可以自行了解。
  下一章,我们将仔细的讲解如何通过梯度进行最小化我们的代价函数。

Reference

5 Regression Loss Functions All Machine Learners Should Know
MachineLearning CostFunction

我的掘金:WarrenRyan

我的简书:WarrenRyan

欢迎关注我的博客获得第一时间更新 https://blog.tity.online

我的Github:StevenEco

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容