1、第四章 离散系统最优控制 4.1 离散变分法与Euler方程 4.2 离散系统最优控制 4.3 连续变分法与离散变分法求解结 果的对比 4.4 离散LQR问题 1 离散系统包括两种:(1) 全数字系统;(2)具有采样与 保持的数字系统。对于全数字系统,泛函求极值问题为: 对于具有采样与保持的数字系统,将连续系统的泛函求极值 问题离散化后,可表达为: (4-1a) 2 可简化为: 当采样周期T 取为一个单位,则得: (41b) 式中, 3 可见,这两种形式的离散系统、泛函求极值问题的提 法是相似的,在以下的讨论中不严加区分. 4.1 离散变分法与Euler方程 为了简单起见,先不考虑系统方程的约
2、束。设泛函求极 值问题为: 令 ,式中, 为最优轨线, 为 的一次变分,这是在离散时刻k时的一次变分。 4 事实上,连续系统中的变分概念,同样可以在各个离散时 刻上使用。同样可以得出泛函极值存在的必要条件是 而且,泛函的一次变分也是取线性主部。 由以及 5 但 6 此式相当于“分部积分”,代入得泛函极值存在的必要条件为: 7 应由下列两式分别为零,即 在过渡过程中若 任意,得离散Euler方程 并得横截条件: 当 (4-2) 8 4.2离散系统最优控制 泛函求极值 化为无约束优化问题, 式中,Lagrange乘子向量设为(k1),若设为(k), 虽然也可以求解,但算式繁琐。 9 令Hamilt
3、on函数H为 泛函极值存在的必要条件为 10 式中, 这相当于“分部积分”。从这里可看出 与 所以,泛函极值存在的必要条件为 (横截条件) (Euler方程) 相对应 11 由于已知 实m维空间中任取,即x和u是任意的,因此,可以取 换言之,x和u 可以分别在实n维空间和 于是,泛函极值存在的必要条件可化为 (横截条件) (伴随方程或协态方程) (耦合方程) (状态方程) (4-4) 12 例: 解:化为无约束优化问题, 令Hamilton函数H为 由协态方程得 13 故 由耦合方程 得 故 由状态方程 得 14 将 代入 中,得 故最优控制为: 最优轨线为 4.3 连续变分法与离散变分法求解
4、结果的对比 泛函求极值 (1) 用连续变分法求解 令 15 由 得 由 得 状态方程为 这个两点边值问题用数字计算机求解,则化为, 16 即 (4-5) (2)用离散变分法求解 首先将目标函数及系统方程离散化,得 即 17 由 得 由 得 两点边值问题为: (4-6) 令 18 得 (4-7) 可见,式(4-5)和式(4-7)完全相同。换言之,当 采样周期很小时,用离散变分法求解的结果接近于用 连续变分法的求解的结果。 当T很小, 二项式展开后, 19 4.4 离散LQR问题 对于线性离散系统提出二次型目标函数, (4-8) 固定 20 令Hamilton函数H为 由协态方程 得 由耦合方程
5、得 即 21 由横截条件 得 类似于连续LQR问题,可得两点边值问题, (4-9) 仿照连续LQR问题的做法,令 并将: 代入式(4-9),得 (4-10) 22 即 (4-11) 由式(4-10),得 由于已给定 在过渡过程中 故有 (4-12) 23 边界条件 (因为 故 边界条件 由式(4-10),得 代入 (4-12)称为矩阵Riccati差分方程,也可写为 (4-13) 24 此式中 求逆并取转置,即 由于连续系统的状态方程, 离散化后, 式中 实际上就是原连续系统的状态转移矩阵, 再利用式(4-13),得 故其逆阵是存在的。 25 式中,Kalman增益 同样可得最优反馈控制结构,如图4-1所示。 图4-1 最优反馈控制的结构 + + 26 矩阵Riccati差分方程另有一种形式: (4-14) 令 (4-15) 则 即 即 27 两边右乘 (4-16) 由式(4-15),得 即 (4-17) 式(4-16)代入式(4-17), 28 故 式(4-18)代入式(4-12),得 此式即为式(4-14)。 (4-18) 29 习题 试列出两点边值问题。 2 . 及 固定。 N为终端函数。 1. 30 3. 求最优控制表达式。 31