无约束最优化(三) 拟Newton法

  Newton法的优缺点都很突出。优点:高收敛速度(二阶收敛);缺点:对初始点、目标函数要求高,计算量、存储量大(需要计算、存储Hesse矩阵及其逆)。拟Newton法是模拟Newton法给出的一个保优去劣的算法。

  拟Newton法是效果很好的一大类方法。它当中的DFP算法和BFGS算法是直到目前为止在不用Hesse矩阵的方法中的最好方法。

基本思想

  考虑Newton迭代公式
x_{k+1}=x_{k}-G_{k}^{-1} g_{k} , \ \ k=0,1, ···
  这里搜索方向为p_{k}=-G_{k}^{-1}g_{k},步长因子为1。

  我们从以下两点考虑对Newton迭代公式的改进:

  (1) 为避免求逆矩阵,设想用某种近似矩阵H_{k}=H(x_{k})替换-G_{k}^{-1},上式则变为
x_{k+1}=x_{k}-H_{k} g_{k} , \ \ k=0,1, ···
  这时搜索方向为p_{k}=-H_{k}g_{k},步长因子仍为1。

  (2) 为了取得更大的灵活性,考虑更一般的公式
x_{k+1}=x_{k}-t_{k}H_{k} g_{k} , \ \ k=0,1, ···
  这时搜索方向仍为p_{k}=-H_{k}g_{k},但步长因子取为最优步长因子。上式是代表面很广的一类迭代公式。例如,当H_{k}=E时,它是最速下降法公式。当H_{k}=G_{k}^{-1}时,它是阻尼Newton法公式。

  这样的H_{k}存在吗?又如何来求呢?假如存在,那么为使H_{k}确实近似G_{k}^{-1}并易于计算,我们要对H_{k}人为地附加某些条件。主要是三点:

  第一,为保证搜索方向p_{k}=-H_{k}g_{k}是下降方向,如果\nabla f(x_{0})^{T}p < 0,则p方向是函数f(x)在点x_{0}处的下降方向得到:
p_{k}^{T} g_{k}<0 \Rightarrow-g_{k}^{T} H_{k} g_{k}<0 \Rightarrow g_{k}^{T} H_{k} g_{k}>0
  要求每一个H_{k}都是对称正定矩阵,可以保证该式成立。

  第二,为易于计算,要求H_{k}H_{k+1}之间具有简单的迭代形式。最简单的迭代关系为
H_{k+1}=H_{k}+E_{k}
  E_{k}称为校正矩阵,上式称为校正公式

  第三,为使H_{k}确实近似G_{k}^{-1}要求每一个H_{k}必须满足拟Newton条件。那所谓的拟Newton条件是啥呢?

  我们假设目标函数f(x)具有连续的二阶偏导数,将f(x)在点x_{k+1}处作Taylor级数展开:
f(x) \approx f\left(x_{k+1}\right)+\nabla f\left(x_{k+1}\right)^{T}\left(x-x_{k+1}\right)+\frac{1}{2}\left(x-x_{k+1}\right)^{T} G_{k+1}\left(x-x_{k+1}\right)
  对上式两端求梯度有:
\nabla f(x) \approx g_{k+1}+G_{k+1}\left(x-x_{k+1}\right)
  令x=x_{k},则有:
g_{k} \approx g_{k+1}+G_{k+1}\left(x_{k}-x_{k+1}\right)
  所以,当G_{k+1}正定时,有
x_{k+1}-x_{k} \approx G_{k+1}^{-1}\left(g_{k+1}-g_{k}\right)
  对于正定二次函数,上式近似将变为等式。

  因此,如果迫使H_{k+1}满足类似于上式的等式
x_{k+1}-x_{k} = H_{k+1} \left(g_{k+1}-g_{k}\right)
  那么H_{k+1}就有可能很好地近似于G_{k+1}^{-1}上式称为拟Newton条件拟Newton方程

  记:
s_{k}=x_{k+1}-x_{k} \\ y_{k} = g_{k+1}-g_{k}
  那么拟Newton条件可简记为:
H_{k+1}y_{k}=S_{k}
  带入迭代关系式H_{k+1}=H_{k}+E_{k}有:
E_{k}y_{k} = S_{k} - H_{k}y_{k}
  算法中的校正矩阵E_{k}可由确定的公式来计算,不同的公式对应不同的拟Newton算法。满足条件的E_{k}有无穷多个,因此上述的拟Newton算法是一簇算法。

DFP算法

  DFP法是首先由Davidon(1959年)提出,后由Fletcher和Powell(1963年)改进的算法。它是无约束优化方法中最有效的方法之一。DFP法虽说比共轭梯度法有效,但它对直线搜索有很高的精度要求。

  考虑如下校正公式
H_{k+1}=H_{k}+\alpha_{k}u_{k}u_{k}^{T}+\beta_{k}v_{k}v_{k}^{T}
  其中u_{k}v_{k}是待定列向量,\alpha_{k}\beta_{k}是待定常数。校正矩阵
E_{k}=\alpha_{k}u_{k}u_{k}^{T}+\beta_{k}v_{k}v_{k}^{T}
  根据拟Newton条件,有
\alpha_{k}u_{k}u_{k}^{T}y_{k}+\beta_{k}v_{k}v_{k}^{T}y_{k} = s_{k}-H_{k}y_{k}
  上式u_{k}v_{k}有很多种取法

\alpha_{k}u_{k}u_{k}^{T}y_{k} = s_{k} \\ \beta_{k}v_{k}v_{k}^{T}y_{k} = -H_{k}y_{k}

  如果取u_{k}=s_{k}v_{k}=H_{k}y_{k}那么有
\alpha_{k}=\frac{1}{s_{k}^{T}y_{k}}, \ \beta_{k}=-\frac{1}{y_{k}^{T}H_{k}y_{k}}

H_{k+1}=H_{k}+\frac{s_{k}s_{k}^{T}}{s_{k}^{T}y_{k}}-\frac{H_{k}y_{k}y_{k}^{T}H_{k}}{y_{k}^{T}H_{k}y_{k}}

DFP算法的性质

定理1:在DFP算法中,若初始矩阵H_{0}对称正定,则H_{k}中每一个都对称正定。

定理2:设将DFP算法施用于具有对称正定矩阵Q的二次函数f(x)=\frac{1}{2} x^{T} Q x+b^{T} x+c,如果:

(i) 初始矩阵H_{0}对称正定;

(ii) 迭代点互异,产生的搜索方向向量依次为p_{0},p_{1},···,P_{k} \ (k \leq n-1),则有
p_{i}^{T}Q p_{j} = 0, \ i,j = 0,1,···,k(i \neq j) \\ H_{k+1}Qp_{j} = p_{j}, \ j=0,1,···,k.
定理3:若定理2的条件都满足,并且经过n次迭代才求到极小点,则H_{n}=Q^{-1}

我的微信公众号名称:深度学习与先进智能决策
微信公众号ID:MultiAgent1024
公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,590评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,808评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,151评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,779评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,773评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,656评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,022评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,678评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,038评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,756评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,411评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,005评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,973评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,053评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,495评论 2 343

推荐阅读更多精彩内容