导数、偏导数、方向导数、梯度、梯度下降

原作者:WangBo_NLPR 原文:https://blog.csdn.net/walilk/article/details/50978864
原作者:Eric_LH 原文:https://blog.csdn.net/eric_lh/article/details/78994461

前言

机器学习中的大部分问题都是优化问题,而绝大部分优化问题都可以使用梯度下降法处理,那么搞懂什么是梯度、什么是梯度下降法就非常重要!这是基础中的基础,也是必须掌握的概念!
提到梯度,就必须从导数(derivative)、偏导数(partial derivative)和方向导数(directional derivative)讲起,弄清楚这些概念,才能够正确理解为什么在优化问题中使用梯度下降法来优化目标函数,并熟练掌握梯度下降法(Gradient Descent)。
文章小节安排如下:
1.导数
2.导数和偏导数
3.导数和方向导数
4.导数和梯度
5.梯度下降法

导数

一张图读懂导数和微分:

这是高数中的一张经典图。
导数的定义如下:
导数的定义
反映的是函数在某一处沿轴正方向的变化率。再强调一遍,是函数f(x)x轴上某一点处沿着x轴正方向的变化率/变化趋势。直观来看,也就是在x轴上某一点处,如果f'(x)>0,说明f(x)的函数值在x点沿x轴正方向是趋于增加 ;如果f'(x)<0,说明f(x)的函数值在x点沿x轴正方向是趋于减少的。
这里补充上图中的等符号的意义及关系如下:
:的变化量;
:的变化量趋于0时,则记做微元;
:,是函数的增量;
:,是切线的增量;
当时,和都是无穷小,是的主部,即

导数和偏导数

偏导数的定义如下:
\frac {\partial } {\partial x_f} f(x_0,x_1,...,x_n)=\lim_{\Delta x \rightarrow 0} \frac{\Delta y} {\Delta x} = \lim_{\Delta x \rightarrow 0} \frac {f(x_0, ..., x_j + \Delta x, ... ,x_n)-f(x_0,...,x_j,...,x_n)} {\Delta x}
可以看到,导数与偏导数本质是一致的,都是当自变量的变化趋于0时,函数值的变化量与自变量变化量比值的极限。直观来说,偏导数也是函数在某一点上沿坐标轴正方向的变化率。
区别在于:
导数,指的是一元函数中,函数y=f(x)在某一处沿x轴正方向的变化率;
偏导数,指的是多元函数中,函数y=f(x_1,x_2,...,x_n)在某一点处沿着某一坐标轴(x_1,x_2,...,x_n)正方向的变化率。

导数与方向导数

方向导数的定义如下:
\frac {\partial} {\partial l}f(x_0,x_1,...,x_n)=\lim_{\rho \rightarrow 0} \frac {\Delta y} {\Delta x} = \lim_{\rho \rightarrow 0} \frac {f(x_0+\Delta x_0, ..., x_j+\Delta x_j, ..., x_n + \Delta x_n) - f(x_0, ...,x_j...,x_n)} {\rho}
\rho = \sqrt {(\Delta x_0)^2+...+(\Delta x_j)^2+...+(\Delta x_n)^2}
在前面导数和偏导数的定义中,均是沿坐标轴正方向讨论函数的变化率。那么当我们讨论函数沿任意方向的变化率时,也就引出了方向导数的定义,即:某一点在某一趋近方向上的导数值。
通俗的解释是:
我们不仅要知道函数在坐标轴正方向上的变化率(即偏导数),而且还要设法求得函数在其他特定方向上的变化率。而方向导数就是函数在其他特定方向上的变化率。

导数和梯度

梯度的定义如下:
gradf(x_0,x_1,...,x_n)=(\frac {\partial f} {\partial x_0},...,\frac {\partial f} {\partial x_j}, ..., \frac {\partial f} {\partial x_n})
梯度的提出职位回答一个问题:
函数在变量空间的某一点处,沿着哪一方向有最大的变化率?
梯度定义如下:
函数在某一点的梯度是这样一个向量,它的方向与取得最大方向导数的方向一致,而它的模为方向导数的最大值。
这里需要注意三点:
1)梯度是一个向量,即有方向有大小;
2)梯度的方向是最大方向导数的方向;
3)梯度的模是最大方向导数的值。

导数与向量

提问:导数与偏导数与方向导数是向量么?
向量的定义是有方向(direction)和大小(magnitude)的量。
从前面的定义可以这样看出,偏导数和方向导数表达的是函数在某一点沿某一个方向的变化率,也是具有方向和大小的。因此从这个角度理解,我们可以把偏导数和方向导数看作是一个向量,向量的方向就是变化率的方向,向量的模就是变化率的大小。
那么沿着这样一种思路,就可以如下理解梯度:
梯度即函数在某一点最大的方向导数,函数沿梯度方向函数有最大的变化率。

梯度下降法

既然在在变量空间的某一点处,函数沿梯度方向局域最大的变化率,那么在优化目标函数的时候,自然是沿着负梯度方向去减少函数值,以此来达到我们的优化目标。
如何沿着负梯度方向减少函数值呢?既然梯度是偏导数的集合,如下:
gradf(x_0,x_1,...,x_n)=(\frac {\partial f} {\partial x_0},...,\frac {\partial f} {\partial x_j}, ..., \frac {\partial f} {\partial x_n})
同时梯度和偏导数都是向量,那么参考向量运算法则,我们在每个变量轴上减少对应变量值即可,梯度下降法可以描述如下:
Repeat \{ x_0 : = x_0 - \alpha \frac{\partial f} {\partial x_o} \\ ........ \\ x_j := x_j - \alpha \frac{\partial f}{\partial x_j} \\ ........\\ x_n:=x_n - \alpha \frac{\partial f} {\partial x_n} \}
以上就是提嘟嘟下降法的由来,大部分的机器学习任务,都可以利用Gradient Descent来进行优化。


总结

概念 物理意义
导数 函数在该点的瞬时变化率
偏导数 函数沿坐标轴方向的变化率
方向导数 函数在某点沿某一特定方向的变化率
梯度 函数在某一点沿梯度方向变化率最大
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,313评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,369评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,916评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,333评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,425评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,481评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,491评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,268评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,719评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,004评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,179评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,832评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,510评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,153评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,402评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,045评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,071评论 2 352

推荐阅读更多精彩内容

  • 本篇系列地介绍了导数、偏导数、方向导数、梯度和梯度下降算法。 导数 导数的定义:导数反映的是函数在某一点处沿正方向...
    残剑天下论阅读 882评论 0 3
  • 转载-刘建平Pinard-www.cnblogs.com/pinard/p/5970503.html 在求解机器学...
    商三郎阅读 3,501评论 0 2
  • 导数 导数反应的变化率:一个函数在某一点的导数描述了这个函数在这一点附近的变化率。导数的本质是通过极限的概念对函数...
    Arya鑫阅读 5,960评论 0 8
  • 前言   一年前就自学过,并且参加过机器学习的培训课。由于现在开始专注学习计算机视觉算法,所以需要复习下数学基础。...
    applecai阅读 784评论 0 1
  • 1.梯度 在微积分里面,对多元函数的参数求∂偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。比如函数...
    kang_james阅读 1,153评论 1 2