优化控制问题
考虑下述优化问题:
其中可以被看作一种约束,因此我们定义拉格朗日乘子,同时对原有的代价函数进行增广,得到如下增广代价函数:
对取变分(Variation),得到如下表达式:
其中:
下面我们定义哈密顿量(Hamiltonian):
将定义的哈密顿量代入到公式(3)的变分中可以得到:
我们需要将变分表达式中的变分项进行合并,(6.1)中的可以通过分部积分法(Integragint by Parts)将导数从变分项中移出,具体操作如下:
上式中关于分部积分法使用到了公式,还有一个需要注意的点是公式(7)中的(7.1)部分,这个地方看起来那么直观,不过我们只要搞清楚和的定义,那么这个等式关系就很容易得到了。其中表示的函数在时间点处的变分(我这个说法可能在数学上并不研究,只是为了方便理解),注意!在这个定义中是固定的,该变分只由函数本身的变化决定;而的定义则是最终状态的变分,根据定义,该变分由函数变化和终止时间的变化共同决定。因此可以认为终末状态的变化在小量范围内,约等于函数的变化在时间点引起的变化,叠加上由于时间本身的变化累积上处导数(时间乘以变化率等于时间引起的变化量)引起的变化,故而有如下关系:
下面,我们可以将公式(7)的结果代入到公式(6),可以得到:
综上所述,使得在成立的必要条件是上述(9.1-9.5)都等于0(其中在是固定的(fixed)的时候(9.2)不需要满足),如下:
以下是边界条件和约束:
- 当是自由的,需满足:
- 需满足边界条:
- 当固定时,需满足:
- 当自由时,需满足:
我们把公式(10)中的第二项进一步展开,会有一些额外的发现:
有上述方程我们可以发现如果把也当作一种状态,那上述方程就可以当作它的状态状态转移方程,由状态构成的系统是一个线性系统。
除此之外我们还很容易发现如下关系:
由此,我们可以发现和具有某种对称性,他们的维度是一样的,又都可以当作状态变量,同时又拥有各自的状态转移矩阵,因此,一般我们把称作协态(Costate),公式(15)又被称作协态方程(Costate Equation),或者被称作辅助方程(Auxiliary Equation)、伴随方程(Adjoin Equation)、影响方程(Influence Equation)或乘数方程(Multiplier Equation)。
LQR的变分法推导
我们考虑确定性的线性二次型调节器(Deterministic Quadratic Regulator),被控对象如下:
代价函数如下:
上述表达式满足如下条件:
- ,和
- 我们定义
- 是时间连续函数
- ,,,是时间上的分段连续函数,并且有界。
根据上述定义,我们可以将问题描述为:寻找使得代价函数最小。
为了优化代价函数,我们使用拉格朗日乘子法对代价函数进行增广,我们定义增广之后的代价函数为:
根据公式(5)的定义,我们可以得到哈密顿量:
根据公式(10)中的必要条件,可以得到:
根据公式(23)可以得到最优控制率的必要条件是:
为了使其成为充分必要条件,还需要满足。
显然有:
因此可以得知公式(24)是充分且必要的。
现在我们可以联系在《连续系统的LQR推导》这篇文章中的讨论,会发现扮演着和同样的角色,其中最主要的区别在于我们不需要去大胆假设的解是一个二次型了!接下来我们可以证明这一点。
显然有:
综上我们可以得到如下关系:
我们将上述矩阵称为哈密顿矩阵(Hamiltonian Matrix)。我们发现,和的状态转移矩阵存在耦合,同时,对于我们只知道它的初始状态,而对于我们只知道它的终末状态。这是一个难以解决并且比较典型的两点边值问题(Two-Point Boundary Problem)。
根据公式(27),可以发现它是一个线性常微分方程组。根据相关理论,如果已知一个在时间的状态,其任意时间点状态满足如下关系:
上式证明比较复杂,在此不打算着墨太多(主要是我不会),不过大概可以确定的是在给定初始状态时,只与时间有关,这一点可以将公式(28)代入到公式(27)中,可以得到:
根据相关理论可以得到的解的形式如下:
其中时间排序算符用来保证矩阵按照时间顺序正确地作用。
根据公式(28),考虑任意时间和终末时间,有:
于是很容易得到如下关系:
于是有:
现在我们得了了,下面我们看一看是如何变化的,根据公式(32)我们有:
根据公式(33)、(22)、(21)、(24)、(32)有:
于是我们得到了连续时间代数黎卡提方程(continuous time algebraic Riccati equation-CARE):
我们可以从终末时间点的反向求解最优的,同时可以据此得到最优控制输入:
推导完毕。
未经授权,禁止转载