共轭梯度法是一类重要的方法,特别是当维数很大时。本文将提出一种新的共轭条件,考虑其非精确线搜索。依据新的共轭条件,两种非线性共轭梯度法将会被提出,同时给出其收敛性分析。
1、介绍
我们的问题是处理一个维变量问题
其中是光滑的且
是可以得到的。共轭梯度法是非常有用的处理问题
当
非常大时,其有如下形式:
其中是步长,
是常数,且
表示
。当
是凸二次函数时
其中是一维线搜索,即
共轭梯度法即共轭条件成立,即
定义为
对于一般的非线性函数,我们知道利用中值定理一定存在常数使得
可以看出用如下条件替代式作为共轭条件是合理的,即
利用和
,我们给出
的新公式
以上称为 HS 共轭梯度法,是由 Hestenes 和 Stiefel 于 1952 年提出来的。在实际计算中,HS 共轭梯度法类似于 PRP ,有良好的数值实验效果。
然而,共轭条件和
是依赖于精确线搜索,在实际的计算中,我们会采取非精确线搜索。因此
,共轭条件
和
可能有一些缺点。所有我们要给出新的共轭条件。
2、一种新的共轭条件和新的
参数
在 BFGS 算法中
其中是
对称正定矩阵,在拟牛顿法中
其中,利用
和
,我们有
由可知,如果线搜索是精确的,则
。然而在实际中会经常用到非精确线搜索,所以将共轭条件
代替
是合理的。为了更一般的情况,我们把
替换成
其中为常数。
为了确保满足共轭条件
,根据
式,我们有
显然有
其中。特别地,若
,则
3、DL 共轭梯度法对一致凸函数的全局收敛性
本节我们都是假定
否则稳定点已经得到。同时给出下降条件,即存在,使得
假定 1:
(i) 水平集有界,即存在
使得
(ii) 在水平集的某个邻域
上,
的梯度函数
是Lipschitz连续, 即存在~
,使
在和
的假定下,我们有存在
满足
步长由强 Wolfe 线搜索决定,即
其中.
我们首先给出如下引理,在前面的章节就证明过。
引理 2:若假定 1 成立,考虑任何形式的共轭梯度法(2)-(3),其中是下降方向且
由强 Wolfe 线搜索决定,如果
我们有
定理 3:若假定 1 成立,考虑共轭梯度法(2)、(3) 和 (15),其中是下降方向且
由强 Wolfe 线搜索决定,如果存在常数
,使得
我们有
证明:由可知,
为一致凸函数。即有
由 (3)、(15)、(21)、(22) 和 (29),我们有
上式表明成立,利用 引理 2,我们知道
式成立,对于一致凸函数,
等价于
。
3、DL 共轭梯度法对一般函数的全局收敛性
对于一般的函数,因为在精确线搜索下等价于 PRP 共轭梯度法。由于在证明 PRP算法中我们取
。所以在这里,我们也令
引理 4:若假定1成立,考虑共轭梯度法 (2),(3) 和 (31),其中是下降方向,
是由强 Wolfe 线搜索决定。如果存在一个常数
对于
有和
其中
证明:由于是下降方向,故
,从而
的定义是有意义的。通过
和 引理 2 可知
现将中的
分为两个部分
我们定义
其中
由可知,当
时
利用和
,有
注意到和
,有
另一方面,利用线搜索有
利用和
,以及假定
,有
利用,
,
,
,有
因此通过,我们知道
成立。故证明完毕。
现在我们给出的性质,这种相似但是又不同于
,如果
式对于某个
成立,假定
以及
成立,存在
和
对于所有的
有
实际上,利用,我们有
利用,我们有
注意到可以定义满足
,所以我们可以定义
从的第一个不等式,如果
,则
因此我们找到这样的和
使其满足
和
。
我们定义为正整数集,对于任意的
和正整数
,定义
让表示
的数目,则公式
具有这样的性质。
引理 5:若假定1成立,考虑共轭梯度法 (2),(3) 和 (31),其中是充分下降方向,
满足强
线搜索,若
成立,则存在
,使得对任意的
和任意的指标
,均存在
,满足
证明:反证法,假定对任意的,存在
和
有
因为满足
和
,即存在
和
。对此
选取
和
,根据
,有
如果,则
中的方向自动变为
,如果此时不收敛的话,我们就把
看出新的起点。所以为了不失一般性,我们总是假定
由和
知
由式,则
利用式,以及前面的在标准
线搜索下的一般理论,我们可知
,这与
式相矛盾,故假设不成立。在 戴彧虹 的原文中,不是这样写的,但是中心思想都差不多,如有兴趣可以参考原文的文献。
定理 6:若假定1成立,考虑共轭梯度法 (2),(3) 和 (31),其中是充分下降方向,
满足强
线搜索,则有
证明:证明的过程省略,和当时 PRP 共轭梯度法一样,没有一点区别。
4、结束语
由于 DL 共轭梯度法是对 HS 共轭梯度法的改进,而 HS 共轭梯度法的收敛性证明又和 PRP 共轭梯度法几乎相同,所以此处的相同证明省去不写。参考文献如下
[1] Dai Y H, Liao L Z. New conjugacy conditions and related Nonlinear conjugate gradient methods[J]. Applied Mathmatics Optimization, 2001, 43: 87-101.
[2] 戴彧虹. 非线性共轭梯度法[M]. 2000, 科学出版社。