本章涉及知识点:
1、无条件极值
2、Hessian矩阵
3、有条件极值
4、数学分析角度
5、几何角度
6、知识点1:牛顿迭代法求多元函数驻点
7、知识点2:数值微分求解多元函数高阶偏导数
8、案例演示
一、无条件极值
我们从二元函数开始研究其极值问题
除自身定义域D外,没有别的条件约束,这类问题我们称为多元函数的无条件极值问题
设的驻点为
,且
各个自变量的一阶偏导数均存在,则

特别注意的是:此时不一定是
的极值点
例如:
其一阶偏导数为:,
可以看到是
其中一个驻点,而我们画出函数图像和其等值线图像


从函数等值线上可以看出:不是函数极值点,而只是一个鞍点
结论:驻点是
取极值的必要条件,即
取极值的点一定是驻点,但是驻点不一定是
的极值点
所以我们不能只凭一阶偏导数求驻点来判定多元函数的极值点,还需要分析二阶偏导数的情况
我们将在极值点
处进行二阶Taylor展开,得

由极值点的必要条件,因为是
的驻点,即

则上式二阶Taylor可写为

我们将上式写为矩阵方程形式,即

显然这是一个关于的二次型方程,则记
,
则上式矩阵方程可写为

分类讨论:
(1)如果是正定矩阵,则

说明:对于在驻点的某邻域内,任何
的函数值均大于驻点的函数值。
即:驻点是
的极小值点
(2)如果是负定矩阵,则

说明:对于在驻点的某邻域内,任何
的函数值均大于驻点的函数值。
即:驻点是
的极大值点
(3)如果是不定矩阵,则

说明:对于在驻点的某邻域内,存在某个具体的点
,该点的函数值大于驻点的函数值;还存在某个具体的点
,该点的函数值小于驻点的函数值。
即:驻点不是
的极值点,而是其一个鞍点
综上讨论:驻点
是否是
的极值点,正比于
的正负定
二、Hessian矩阵
对于二元函数,其在驻点
的Hessian矩阵为

我们记:,
,
则的Hessian矩阵为:
则通过上述分析,在驻点
的极值情况为:
(1)如果
,且
,则
在
处取极小值
(2)如果
,且
,则
在
处取极大值
(3)如果
,则
在
处无极值
更一般的,我们从二元函数的极值判定,可以推广到多元函数的极值判定
对于多元函数,其在驻点
的Hessian矩阵为

同理,极值的判定条件取决与
的正负定
三、有条件极值
在实际问题中,我们会遇到需要满足某个或者某几个约束条件
下的极值问题,称之为有条件的极值问题,即

通常,我们称函数为目标函数,方程
为约束条件,自变量x、y称为决策变量
分析这类问题,需要将有条件极值问题转化为无条件极值问题,下面我们从数学分析角度和几何角度来处理有条件极值
四、数学分析角度
设满足约束条件
,且是
的极值点
则由隐函数存在定理,在的某邻域内可以确定一个具有连续可导的隐函数:

则二元函数的有条件极值问题,就转化为一元函数的条件极值问题,即

由一元函数取极值的必要条件:一阶导数为0,得

我们对条件约束方程:,两边同时对
求导,得

将带入上式,得

将上式代入一元函数取极值的方程,得

我们令:,则可以推导出:

不要忘却约束条件:,加上约束条件,则我们推导出二元函数
的有条件极值的解法:

观察上式关系,我们可以用一个统一的函数:拉格朗日函数来描述

而求的无条件极值,就等价于求
的有条件极值,即

结论:二元函数
在
约束下求有条件极值问题,可以等价转化为拉格朗日函数
求无条件极值问题(
)
我们称上述算法为:拉格朗日乘子法(SVM算法中引用)
五、几何角度
我们画出的等值线

图中黑圈指投影在平面上的等值线,蓝色的曲线是
的约束函数图像,则容易知:等值线与约束函数图像相交的点,就是
满足约束条件的点
下面分析极值点可能出现的位置?极值点只能出现在和
相交或者相切的位置
证明:如果极值点出现在交点,那么沿着的图像继续向前或向后走,一定还有其它的
等值线与
相交,也就是
的值还能变大和变小,所以交点一定不是极值点,极值点只能出现在切点位置
且与
在切点(极值点)处的梯度平行且反向,用数学语言描述即

至此,我们得到了和数学分析方法一样的结果
六、知识点1:牛顿迭代法求多元函数驻点
为了后面代码演示,我们使用牛顿迭代法求二元函数的驻点
牛顿迭代法算法为

对于二元函数求驻点,即所求解的方程组是

则将牛顿迭代法改为

为此,我们需要计算、
、
和
四个一阶和二阶的偏导数值,注意不是偏导数表达式,牛顿迭代法里我们只需要偏导数值,为此我们采用数值微分近似算法
七、知识点2:数值微分求解多元函数的高阶偏导数
在数值微分中,一元函数微分的中点差分公式为:

而我们要计算的一二阶偏导数,则由偏导数的数学定义:

我们可以由一元函数微分的中点差分推导出二元函数
的一阶偏微分
和
的中点差分公式为:

而的二阶偏微分
和
的中点差分公式可以由一阶偏微分递归计算得到:

八、案例演示
案例函数为:求的极值






案例代码见:多元函数的极值分析