离散的LQR优化问题一般具有如下形式:
优化的目标是已知的情况下,通过选择控制输入使得代价最小。我们将代价函数分开来看,定义从状态到的部分代价函数为,除此之外部分的代价函数为J_i^{'},于是有:
显然有:
我们逐步对控制输入进行最小化的操作。考虑控制输入的最后一项是,有:
根据定义可知,与无关,因为它表示的是作用于系统之前的代价,于是有:
接下来在看:
根据上述规律,我们定义:
现在我们考察的具体形式:
代入:
对对求偏导数,并令其为0,有:
因此可以使取最小的满足如下必要条件:
若要使其充分,还需满足:
显然确实能使取全局最小值。
将公式(12)式代入到公式(10),可以得到是一个关于的二次型:
如果我们定义初始的,则上述关系变为:
将上述关系推广到更一般的情况,则有:
上述关系即是一般线性离散系统的LQR控制率。
现在考虑离散线性时不变系统,系统参数不再随角标变化,又考虑到最终趋于稳态,则有如下关系:
上式中的第一项是离散时间代数黎卡提方程 (Discrete time Algebraic Riccati Equation - DARE),第二项是状态反馈增益,第三项是最优控制率。
推导完毕。
未经授权,禁止转载