Levenberg-Maquardt Algorithm 推导


前置知识

1. 牛顿法

作用:1. 求根 2.求极值

  1. 求根

    目标: 求解 f(y)=0 的根

    计算穿过初始点(x_0,f(x_0)) 并且斜率为 f'(x) 的直线与x轴的交点可得

    0=(x-x_0)f'(x_0)+f(x_0)

    迭代公式: x_{n+1}=x_n-\frac{f(x_n)}{f'(x_{n})}

  2. 求解一维无约束最小值

    目标: 求解 min f(x) , x\in R 的根

    牛顿法也可用来求解函数的极值。极值点是导数为0,可用牛顿法求导数的零点。

    f(x+\Delta) 的二阶泰勒展开为 f(x+\Delta)=f(x)+f'(x)\Delta+\frac{1}{2}f''(x)\Delta^2

    求解 \frac{\partial f(x+\Delta)}{ \partial \Delta}=0

    可得 f'(x)+f''(x)\Delta=0
    \Delta=-\frac{f'(x_n)}{f''(x_{n})}

    迭代公式: x_{n+1}=x_n-\frac{f'(x_n)}{f''(x_{n})}

  3. 求解高维无约束最小值

    高维情况下泰勒二阶展开为

    f(\mathbf x+\mathbf \Delta)=f(\mathbf x)+\nabla f(\mathbf x)\Delta+\frac{1}{2}\Delta ^TH(f(\mathbf x))\Delta

    因此迭代公式:x_{n+1}=x_n-[H(f(x_n))]^{-1}\nabla f(x)

优点

  • 牛顿法是二阶收敛,比一般梯度下降法更快收敛,特别是当初始点距离目标足够靠近。

缺点

  • 应用求极值的时候需要目标函数二次可微,而梯度下降法只需要可微
  • 需要 Hessian 矩阵正定,遇到 f 的极值点,或者初始点距离目标远时候可能无法收敛
  • 每次迭代需要求 Hessian 的逆矩阵,运算量非常大

2. 高斯-牛顿法

作用:降低牛顿法的计算量,提高计算效率

最小二乘法问题

对于向量函数 {\bf f}:R^m\to R^n,m\ge n

最小化 ||f(x)|| 或者找到 x^*=argmin_x\{F(x)\}

这里 F(x)=\frac{1}{2}\sum_{i=1}^m(f_i(x))^2=\frac{1}{2}{\bf f}({\bf x})^T{\bf f}({\bf x})

牛顿法推导

已知牛顿法迭代公式: x_{n+1}=x_n-[H(f(x_n))]^{-1}\nabla f(x)

F(x) 的梯度 \nabla F(x)=\begin{bmatrix}\frac{\partial (\frac{1}{2}\sum_{i=1}^m(f_i(x))^2)}{\partial x_1}\\\vdots\\\frac{\partial (\frac{1}{2}\sum_{i=1}^m(f_i(x))^2)}{\partial x_n}\end{bmatrix}=\begin{bmatrix}\sum_{i=1}^{m}f_i\frac{\partial f_i}{\partial x_1}\\\vdots\\\sum_{i=1}^{m}f_i\frac{\partial f_i}{\partial x_n} \end{bmatrix}= \begin{bmatrix} \frac{\partial f_1}{\partial x_1} & \cdots & \frac{\partial f_1}{\partial x_n} \\ \vdots & \ddots & \vdots \\ \frac{\partial f_m}{\partial x_1} & \cdots & \frac{\partial f_m}{\partial x_n} \end{bmatrix}^T\begin{bmatrix}f_1 \\ \vdots \\ f_m \end{bmatrix}

\nabla F(x)=J_f^Tf

Hessian 矩阵有 H_{jk}=\sum_{i=1}^m(\frac{\partial f_i}{\partial x_j}\frac{\partial f_i}{\partial x_k}+f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k})

忽略二阶导数项有: H_{jk}\approx \sum_{i=1}^mJ_{ij}J_{ik}

所以: H\approx J_f^TJ_f

高斯-牛顿迭代公式: x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n) s.t. |\frac{\partial f_i}{\partial x_j}\frac{\partial f_i}{\partial x_k}|\gg |f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}|

优点

  • J_f满秩,此时二次项 |f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}| 可以忽略,高斯牛顿和牛顿法都会收敛
  • 无需计算 Hessian 矩阵

缺点

  • |fi||f_i\frac{\partial ^2f_i}{\partial x_j\partial x_k}| 比较大,会导致难以忽略该二次项,高斯牛顿法的收敛速度会很慢,甚至无法收敛。

Levenberg-Maquardt 算法

根据目标函数F(x) 二阶近似得到:

F(x+h)\approx F( x)+\nabla F(x)h+\frac{1}{2}h^TH_Fh\approx F( x)+J_f^Tfh+\frac{1}{2}h^TJ_f^TJ_fh

我们定义下降方向为 L(h)

L(h)\equiv F( x)+J_f^Tfh+\frac{1}{2}h^TJ_f^TJ_fh​ S.T. h = x_{n+1} - x_n= \Delta ​

高斯牛顿法迭代公式:
x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n)

LM迭代公式: x_{n+1}=x_n-[J_f^TJ_f+\mu I]^{-1}J_f^Tf(x_n)
or
[J_f^TJ_f+\mu I]h=-J_f^Tf(x_n)

作用:结合了高斯牛顿法与梯度下降法的特点,引入阻尼因子来调节算法特性。

因子作用

  • \mu\gt 0 时保证系数矩阵正定,从而确保迭代的下降方向
  • \mu 很大时,退化为梯度下降法: x_{n+1}=x_n-\frac{1}{\mu}J_f^Tf(x_n)
  • \mu 很小时,退化为高斯牛顿法: x_{n+1}=x_n-[J_f^TJ_f]^{-1}J_f^Tf(x_n)

\mu的计算

  • 初始取值:\mu 的初始值\mu_0J(x_0)^TJ(x_0) 矩阵的元素个数有关:

    \mu_0=\tau*max_i\{a_{ii}^{(0)}\}

  • 更新: 由系数 \varrho 来控制,这里:

    \varrho=\frac{F(x)-F(x+h)}{L(0)-L(h)}

    ​ 分子的目标函数在步长 h 下的实际变化,分母为目标函数二阶近似的变化:

    L(0)-L(h)=(F(x))-(F(x)+h^TJ^Tf+\frac{1}{2}h^TJ^TJh)=-h^TJ^Tf-\frac{1}{2}h^TJ^TJh

    可以看出

    • \varrho 越大,表明 LF 的效果越好,可以缩小 \mu 以使得 LM 算法接近高斯牛顿法
    • \varrho 越小,表明 LF 的效果越差,所以增大 \mu 以使得 LM 算法接近梯度下降法并减少步长 h

if\,\varrho>0\,\mu =\mu * max\{\frac{1}{3},1-(2\varrho-1)^3\}\\else\,\mu =\mu * v;v=2

u 和 p 关系曲线图

\mu\varrho 关系曲线图

LM算法流程图

LM算法流程图

Reference

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353