最优控制全部.pptx_咨信网zixin.com.cn

资源描述

1、最优控制理论第一章第一章绪绪论论第二章第二章数数学学准准备备第三章第三章用变分法求解最优控制问题用变分法求解最优控制问题第四章第四章极小值原理及其应用极小值原理及其应用第五章第五章线性二次型问题的最优控制线性二次型问题的最优控制第六章第六章动态规划法动态规划法第一章第一章绪绪论论 1-1最优控制发展简史最优控制是系统设计的一种方法。它所研究的中心问题是如何选择控制信号才能保证控制系统的性能在某种意义下最优。一：最优控制的发展第二次世界大战以后发展起来的自动调节原理，对设计与分析单输入单输出的线性定常系统是有效的；然而近代航空及空间技术的发展对控制精度提出了很高的耍求，

2、并且被控制的对象是多输入多输出的，参数是时变的。面临这些新的情况建立在传递函数基础上的自动调节原理就日益显出它的局限性来。这种局限性首先表现在对于时变系统，传递函数根本无法定义，对多输入多输出系统从传递函数概念得出的工程结论往往难于应用。由于工程技术的需要，以状态空间概念为基础的最优控制理论渐渐发展起来。最优控制理论是现代控制理论的核心，20世纪50年代发展起来的，已形成系统的理论。最优控制理论所要解决的问题是：按照控制对象的动态特性，选择一个容许控制，使得被控对象按照技术要求运转，同时使性能指标达到最优值。二：研究最优控制的方法从数学方面看，最优控制问题就是求解一类带有约束条件的泛函极值问题

3、，因此这是一个变分学的问题：然而变分理论只是解决容许控制属于开集的一类最优控制问题，而在工程实践中还常遇到容许控制属于闭集的一类最优控制问题，这就要求人们研究新方法。在研究最优控制的方法中，有两种方法最富成效：一种是苏联学者庞特里雅金提出的“极大值原理”；另一种是美国学者贝尔曼提出的“动态规划”。极大值原理是庞特里雅金等人在1956至1958年间逐步创立的，先是推测出极大值原理的结论，随后又提供了一种证明方法。动态规划是贝尔曼在1953年至1958年间逐步创立的，他依据最优性原理发展了变分学中的哈密顿-雅可比理论，构成了动态规划。由于电子计算机技术的发展，使得设计计算和实时控制有了实际可用的计

4、算工具，为实际应用些更完善的数学方法提供了工程实现的物质条件，高速度、大容量计算机的应用，一方面使控制理论的工程实现有了可能，另一方面又提出了许多需要解决的理论课题，因此这门学科目前是正在发展的，极其活跃的科学领域之一。最优控制理论在一些大型的或复杂的控制系统设计中，已经取得了富有成效的实际应用。目前很多大学在自动控制理论课程中已经开始适当增加这方面的内容，而对于自动控制方面的研究生则普遍作为必修课程。求解最优控制问题，可以采用解析法或数值计算法1-2 最优控制问题的实例例11月球上的软着陆问题飞船靠其发动机产生一与月球重力方向相反的推力u(t)，以使飞船在月球表面实现软着陆，要寻求发动机

5、推力的最优控制规律，以便使燃料的消耗为最少。设飞船质量为m(t)，高度为h(t)，垂直速度为v(t)，发动机推力为u(t)，月球表面的重力加速度为常数g。设不带燃料的飞船质量为M，初始燃料的总质量为F初始高度为h0，初始的垂直速度为v0，那么飞船的运动方程式可以表示为：初始条件终端条件性能指标是使燃料消耗为最小，即约束条件达到最大值我们的任务是寻求发动机推力的最优控制规律u(t),它应满足约束条件，使飞船由初始状态转移到终端状态，并且使性能指标为极值(极大值)。例12拦截问题在某一惯性坐标系内，设拦截器质心的位置矢量和速度矢量为：目标质心的位置矢量和速度矢量为：F(t)为拦截器的推力则

6、拦截器与目标的相对运动方程为：其中a(t)是除控制加速度外的固有相对加速度，是已知的。初始条件为：终端条件为：从工程实际考虑，约束条件为如果我们既要求拦截过程的时间尽量短，又要求燃料消耗尽量少，则可取性能指标：为最小综上所述，所谓最优防天拦截问题，即选择满足约束条件的控制F(t),驱使系统从初始状态出发的解，在某个时刻满足终端条件，且使性能指标为极值（极小值）。1-3最优控制问题的提法在叙述最优控制问题的提法之前，先讨论一些基本概念。1：受控系统的数学模型一个集中参数的受控系统总可以用一组一阶微分方程来描述，即状态方程，其一般形式为：是n维状态向量为p维控制向量为n维函数向量 2：目

7、标集如果把状态视为n维欧氏空间中的一个点，在最优控制问题中，起始状态（初态）通常是已知的，即而所达到的状态（末态）可以是状态空间中的一个点，或事先规定的范围内，对末态的要求可以用末态约束条件来表示：满足末态约束的状态集合称为目标集，记为M，即：至于末态时刻，可以事先规定，也可以是未知的。有时初态也没有完全给定，这时，初态集合可以类似地用初态约束来表示。3：容许控制在实际控制问题中，大多数控制量受客观条件的限制，只能在一定范围内取值，这种限制通常可以用如下不等式约束来表示：上述由控制约束所规定的点集称为控制域U，凡在t0-tf上有定义，且在控制域U内取值的每一个控制函数u(t)均称为容许控制。4

8、：性能指标通常情况下，最优控制问题的性能指标形如：其中第一项是接近目标集程度，即末态控制精度的度量，称为末值型性能指标。第二项称为积分型性能指标，它能反映控制过程偏差在某种意义下的平均或控制过程的快速性，同时能反映燃料或能量的消耗。5：最优控制的提法已知受控系统的状态方程及给定的初态规定的目标集为M，求一容许控制u(t)U,t t0,tf,使系统从给定的初态出发，在tf t0时刻转移到目标集M，并使性能指标为最小。这就是最优控制问题。如果问题有解，记为u*(t),t t0,tf,则u*(t)叫做最优控制（极值控制），相应的轨线X*(t)称为最优轨线（极值轨线），而性能指标J*=J（u*()）

9、则称为最优性能指标。1-4最优控制的应用类型设计最优控制系统时，很重要的一个问题是选择性能指标，性能指标按其数学形式可分为如下三类：1）积分型性能指标这样的最优控制问题为拉格朗日问题。2）终值型性能指标这种性能指标只是对于系统在动态过程结束时的终端状态提出了要求，而对于整个动态过程中系统的状态和控制的演变未作要求。这样的最优控制问题为迈耶尔问题。3）复合型性能指标这样的最优控制问题为波尔扎问题。通过适当变换，拉格朗日问题和迈耶尔问题可以相互转换。按控制系统的用途不同，所选择的性能指标不同，常见的有：1：最小时间控制2：最小燃料消耗控制粗略地说，控制量u(t)与燃料消耗量成正比，最小燃料消耗

10、问题的性能指标为：3：最小能量控制设标量控制函数u2(t)与所消耗的功率成正比，则最小能量控制问题的性能指标为：4：线性调节器给定一个线性系统，其平衡状态X(0)=0，设计的目的是保持系统处于平衡状态，即这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。线性调节器的性能指标为：加权后的性能指标为：对u(t)有约束的性能指标为：式中Q和R都是正定加权矩阵。一般形式，有限时间线性调节器性能指标：无限时间线性调节器性能指标：P0，Q0，R0，均为对称加权矩阵。5：线性跟踪器若要求状态X(t)跟踪或尽可能接近目标轨迹Xd(t),则这种系统称为状态跟踪器，其相应的性能指标为：Q0，R0，均

11、为对称加权矩阵。若要求系统输出y(t)跟踪或尽可能接近目标轨迹yd(t),则这种系统称为输出跟踪器，其相应的性能指标为：Q0，R0，均为对称加权矩阵。除了上述几种应用类型外，根据具体工程实际的需要，还可以选取其他不同形式的性能指标，在选取性能指标时需注意：1）应能反映对系统的主要技术条件要求2）便于对最优控制进行求解3）所导出的最优控制易于工程实现第二章第二章数数学学准准备备 2-1函数极值问题一：多变量函数极值问题设二元函数f（x1,x2），在点（x1*,x2*）处有极值f（x1*,x2*）的必要条件为：f（x1*,x2*）取极小值的充分条件为：或正定其中上述结论可以推广到自变量

12、多于两个的情形设n 个变量的多元函数f（x1，x2，xn），若f（x）在x*处有极小值，其必要条件为：充分条件为：为正定矩阵。二：有约束条件的函数极值问题设二元函数f（x1,x2），x1和x2必须满足下列方程：g（x1,x2）0 为求函数f（x1,x2）的极值，并找出其极值点（x1*,x2*），作一辅助函数拉格朗日函数：式中为辅助变量，称为拉格朗日乘子。函数f（x1,x2）求极值问题，转变为无约束条件函数求极值问题（拉格朗日乘子法），其存在极值的必要条件为或同样，用拉格朗日乘子法可以求有约束条件的n元函数的极值。设n元函数为f（x1，x2，xn），有m个约束方程 i1，2，m（nm）作拉

13、格朗日函数：函数L有极值的必要条件为：2-2泛函极值问题一.无条件约束的泛函极值问题设函数x（t）在 t0,tf 区间上连续可导定义下列形式的积分J的值取决于函数x（t），称为泛函 1：始端时刻t0和终端时刻tf都给定时的泛函极值设函数x*(t)使J为极小令：式中是一个很小的参数，（t）是一个连续可导的任意函数其取极小值的必要条件为：上式为J(x)取极小值的必要条件J(x)为极大、极小，通常可根据系统的物理性质来判断。J(x)取极小值的充分条件J(x)取极值的必要条件为：欧拉方程横截条件由必要条件不同函数F的欧拉方程为：当t0和tf给定时，根据x(t0),x(tf)是固定的或自由的各

14、种组合，可导出边界条件（1）固定始端和固定终端x(t0)=x0,x(tf)=xf 故边界条件为：x(t0)=x0,x(tf)=xf X(t)X1(t)X2(t)X3(t)t0tft由横截条件(2)自由始端和自由终端 X(t)t0tft（3）自由始端和固定终端x(tf)=xf X(t)t0tft（4）固定始端和自由终端x(t0)=x0 X(t)t0tft极小值的充分条件：故J(x)取极小值的充分条件：为正定例1 设性能指标为：边界条件为：x(1)=1,x(2)=2,求J为极值时的x*(t)解由欧拉方程根据边界条件，x(1)=1,x(2)=2 正半定，J(x)为极小值 2：未给定终端时刻的泛

15、函极值问题若始端时刻t0给定，始端状态x(t0)固定或沿规定的边界曲线移动；而终端时刻tf自由，终端状态x(tf)自由或沿规定的曲线移动，这类最优控制问题称之为未给定终端时刻的泛函极值问题。设系统性能指标:式中t0是已知的，tf未给定，x(t0)给定或未给定 J取极值的必要条件为：上式第二项分部积分于是有：得J(x)取极值得必要条件为欧拉方程横截条件由横截条件可推出各种情况下的边界条件：1）给定始端和自由终端 X(t0)t0tftX*(t)X(tf)tf*此时，x(t0)=x0,(t0)=0,(tf)和(tf)自由可得边界条件与横截条件为：x(t0)=x0 由于最优轨线x*(t)的t

16、f即是最优时刻tf*,上式可写为：2）给定始端x(t0)=x0和终端有约束x(tf)=C(tf)X(t0)t0tftX*(t)X(t)tf*C(t)代入上式对求偏导，并令0可得边界条件与横截条件为：（3）终端x(tf)固定，始端有约束x(t0)=(t0)X(tf)t0tftX*(t)X(t)tf*(t)边界条件与横截条件为：从以上讨论可以看出，不论边界情况如何，泛函极值都必须满足欧拉方程，只是在求解欧拉方程时，对于不同边界情况，应采用不同的边界条件与横截条件。tf固定x(t0)固定x(tf)固定x(t0)自由x(tf)固定tf固定x(t0)固定x(tf)自由x(t0)自由x(tf)自由tf自

17、由x(t0)固定x(tf)自由x(t0)固定x(tf)约束x(t0)约束x(tf)固定无条件约束的泛函极值问题中的边界条件和横截条件列表例2 求使性能指标为极小时的最优轨线x*(t)。设x(0)=1，x(tf)=C(tf)，C(tf)=2-t,tf未给定。解显然，所给出的性能指标就是x(t)的弧长，也就是说，要求从x(0)到直线C(t)的弧长未最短。tx(t)c(t)2x(0)x*(t)x(t)0欧拉方程为：这是一个x(t0)固定，x(tf)约束情况下的极值问题。由边界条件 x(t0)=x（0）b=1,x(t)=at+1 横截条件解得 tx(t)c(t)2x(0)x*(t)x(t)0由边界

18、条件 tx(t)c(t)2x(0)x*(t)x(t)03：向量函数泛函极值问题在上面所讨论的公式中，都假定x是1维变量，但是，所有公式都可推广到n维变量的情况设性能指标式中则欧拉方程为式中对于始端时刻t0和终端时刻tf都给定时，横截条件式中对于未给定终端时刻tf时的横截条件为：（1）给定始端和终端有约束：（2）给定终端和始端有约束二有约束条件的泛函极值问题在实际问题中，对应泛函极值的最优轨线x*(t)通常不能任意选取，而受着各种约束。求泛函在等式约束下的极值，称为条件泛函极值问题。1.代数方程约束设约束方程构造增广泛函令纯量函数分部积分由于x,相互独立，为使上式成立，应同

19、时满足下述欧拉方程，约束方程和横截条件：欧拉方程：约束方程：横截条件：利用横截条件，根据始端状态x(t0)和终端状态x(tf)的不同情况，可以导出具体的边界条件和横截条件，其讨论过程和结论与无约束条件的泛函极值问题相同。2：微分方程约束设约束条件：设纯量函数欧拉方程约束条件横截条件 3：积分方程约束设约束方程 c为一常数设则令欧拉方程约束方程横截条件可见，对于有约束条件的泛函极值问题，可采用拉格朗日乘子法将其转化为无约束条件的泛函极值问题进行求解。在不同边界条件情况下，欧拉方程不变，只是边界条件及横截条件不同。第三章第三章用变分法求解最优控制问题用变分法求解最优控制问

20、题设系统状态方程:性能指标:式中和F为纯量函数最优控制问题就是寻求最优控制及最优状态轨迹使性能指标J取极值.一.初始时刻及始端状态给定,给定,终端自由构造增广泛函令哈密尔顿函数:则注意到:为使上式成立,应同时满足下列方程:欧拉方程(伴随方程)状态方程控制方程横截条件对于两端固定的情况下横截条件例 1设系统状态方程为的边界条件为求最优控制使下列性能指标为最小解:作哈密尔顿函数欧拉方程控制方程状态方程消除u由边界条件得最优控制二.初始时刻及始端状态给定,给定,终端约束.设终端约束方程为构造增广泛函:式中 J取极值的必要条件是正则方程控制方程边界

21、条件和横截条件三.初始时刻及始端状态给定,自由,终端约束设终端约束为构造增广泛函得J取极值的必要条件为:正则方程控制方程边界条件和横截条件用变分法求解最优解的必要条件性能指标系统方程约束条件正则方程控制方程条件边界条件和横截条件tf给定终端固定终端自由终端约束tf自由终端固定终端自由终端约束例2 已知系统状态方程为求最优控制使性能指标为最小解本题为给定，终端自由的情况正则方程:控制方程得消除u边界条件与横截条件求得最后得最优控制例3设系统的状态方程为性能指标终端约束条件试求使的最优控制解本题为终端受约束的最优解问题正则方

22、程控制方程边界条件和横截条件代入解得例 4设系统状态方程为边界条件试确定最优控制使为极小解这是自由,终端固定的最优解问题正则方程控制方程应用边界条件例 5设控制对象方程为终端时刻自由,终端固定求和使得为极小.解本题自由,终端固定由边界条件和横截条件故或于是最优轨线和最优控制为:当当由可求出终端时刻tf*例6 磁场控制的直流电动机如图所示 MRfLfUf数学模型边界条件性能指标给定试求在t1时间内由x(0)转移到x(t1),并使控制能量具有极小值时的控制输入(励磁电压)uf*,最优性能指标J*和最优轨线x(t)*,解:这是tf 给

23、定,x(tf)固定的最优控制问题正则方程控制方程代入状态方程得代入给定边界条件则最优控制为最优性能指标最优轨线第四章极小值原理及其应用用古典变分法解最优控制问题时,假定u(t)不受限制,从而得到最优控制应满足实际上在工程问题中,控制变量总有一定的限制.设控制变量被限制在某一闭集内即u(t)满足满足限制条件的u(t)称为容许控制，由于u不能是任意的,的条件已不存在 4-1.连续时间系统的极小值原理设系统状态方程为:初始条件为有界闭集,不等式约束为 G为m维连续可微的向量函数,系统从x0转移到终端状态x(tf)，tf未给定,终端状态x(tf)满足等式约束 M为q 维连续可微

24、向量函数,性能指标:最优控制问题就是要寻找最优容许控制u(t)使J为极小令于是,系统方程为:终端时刻tf 未给定,终端约束要求确定最优控制使性能指标为极小引入拉格朗日乘子向量及,写出增广性能指标泛函令哈密而顿函数为拉格朗日纯量函数则对J取一阶变分得令可得增广性能指标泛函取极值的必要条件为欧拉方程横截条件:把的表达式代入欧拉方程:横截条件:由欧拉方程和横截条件知,最优轨线以上为使性能指标J取极值的必要条件,为使性能指标为极小,还必须满足维尔斯特拉斯函数沿最优轨线非负的条件,即:或:上式表明,沿最优轨线函数H相对最优控制u*(t)取绝对极小值,这是极小值原理的一个重要结论

25、.00-*上式表明,在有不等式约束的情况下,沿最优轨线不再成立定理:(极小值原理)设系统的状态方程为控制u(t)是有第一类间断点的分段连续函数,属于p维空间中的有界闭集,满足不等式约束:在终端时刻tf 未知的情况下,为使状态自初态转移到满足边界条件的终态,并使性能指标达极小值.设哈密而顿函数为则最优控制u*(t),最优轨线x*(t)和最优伴随向量*(t)必须满足下列条件:(1).沿最优轨线满足正则方程:式中是与时间t无关的拉格朗日乘子向量,其维数与G相同,若G中不包含x,则:(2)横截条件及边界条件:(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H函数取绝对极小值,即并且

26、沿最优轨线,下式成立上述条件与不等式约束下的最优控制的必要条件相比较,横截条件及端点边界条件没有改变,仅这一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则方程略有改变,仅当G中不包含x时,方程才不改变.当 t0和x(t0)给定,根据tf给定或自由,x(tf)给定,自由或受约束等不同情况下所导出的最优解必要条件列表如下:tf给定性能指标终端状态正则方程极值条件边界条件与横截条件固定自由约束 tf给定性能指标终端状态正则方程极值条件边界条件与横截条件固定自由约束 tf给定性能指标终端状态正则方程极值条件边界条件与横截条件固定自由

27、约束 tf自由性能指标终端状态正则方程极值条件边界条件与横截条件固定自由约束 tf自由性能指标终端状态正则方程极值条件边界条件与横截条件固定自由约束 tf自由性能指标终端状态正则方程极值条件边界条件与横截条件固定自由约束例1 设宇宙飞船质量为m,高度为h,垂直速度为v,发动机推力为u,月球表面的重力加速度设为常数g,不带燃料的飞船质量为M,初始燃料的总质量为F,飞船的状态方程为:要求飞船在月球上实现软着陆,即终端约束为发动机推力u受到约束,试确定u*(t),使飞船由已知初态转移到要求的终端状态并使飞船燃料消耗最少,即使得本题是控制受约束,tf 自

28、由,末值型性能指标,终端受约束的最优控制问题.解:构造哈密而顿函数伴随方程:横截条件为待定的拉格朗日乘子,将哈密而顿函数整理有极小值原理知,H相对u*(t)取极小值,因此最优控制律为:上述结果表明,只有当发动机推力在最大值和零值之间进行开关控制,才有可能在实现软着陆的同时保证燃料消耗最少.4-2离散系统极小值原理设离散系统的状态方程为:其中f是连续可导的n维向量函数,x(k)为n维的状态向量序列,u(k)为p维控制向量序列,k表示时刻tk,终端时刻tf=tN.设初始状态x(0)=0,终端时刻tN给定,终端状态x(N)自由,控制向量序列u(k)无不等式约束.系统性能指标为:要求寻找最优控

29、制u*(k),使性能指标J为极小.建立增广指标泛函式中(k+1)为n维拉格朗日乘子向量序列离散哈密而顿函数序列H为由于x(0)给定,x(0)=0令可得J取极值的必要条件为:正则方程边界条件与横截条件:控制方程:*特别的当终端状态有等式约束时横截条件改为:*当u(k)有不等式约束时不成立,此时最优控制序列对应的H函数序列为绝对极小值,即:连续极小值原理离散极小值原理系统性能指标极值问题哈密而顿函数正则方程极值条件控制无约束控制有约束横截条件(终端时间给定,终端自由)例 2设离散状态方程及边界条件为试用离散极小值原理求最优控制序列使性能指标取极小值,并求出最优状态序列.解伴随方程控

30、制方程状态方程:列写结果如下 4-3极小值原理的应用1：最小时间控制(时间最优控制)设线性定常系统的状态方程其中控制向量u(t)受不等式约束寻求最优控制u*(t),使系统从已知的初始状态转移到终端状态，tf 自由,并使性能指标为极小构造哈密尔顿函数:根据极小值原理,最优控制的必要条件为:正则方程边界条件极值条件设则设各控制分量相互独立,则有在约束条件下的最优控制为:由此可知,当*T(t)bj0 时,可以找出确定的u*j(t)来,并且它们都为容许控制的边界值.当*T(t)bj 穿过零点时,u*j(t)由一个边界值切换到另一个边界值.如果*T(t)bj 在某一时间区间内保持为

31、零,则u*j(t)为不确定值,这种情况称为奇异问题或非平凡问题,相应的时间区段称为奇异区段.当整个时间区间内不出现奇异区段时,则称为非奇异问题或平凡问题,对于平凡问题,有以下几个定义及定理 Bang-Bang原理若线性定常系统属于平凡情况,则其最短时间控制为 u*(t)的各个分量都是时间的分段恒值函数,并均取边界值,称此为Bang-Bang原理.Bang-Bang原理也适用于下列一类非线性系统最短时间控制存在定理若线性定常系统完全能控,矩阵A的特征值均具有非正实部,控制变量满足不等式约束|u(t)|M,则最短时间控制存在.最短时间控制的唯一性定理若线性定常系统属于平凡情况,若时间最

32、优控制存在,则必定是唯一的.开关次数定理若线性定常系统控制变量满足不等式约束|u(t)|M矩阵A的特征值全部为实数,若最短时间控制存在.则必为Bang-Bang控制,并且每个控制分量在两个边界值之间的切换次数最多不超过n-1次.例 3设系统的状态方程为边界条件:控制变量u(t)的不等式约束|u(t)|1性能指标求最优控制u*(t),使 J 为最小.解:由于A具有两个零特征值,满足非正实部的要求,且系统能控,因而最优时间控制存在,如果系统属于平凡情况,则最优控制是唯一的,开关换向次数最多只有一次.伴随方程解得极值条件最优控制规律为当u(t)=+1时,状态方程的解为:最优轨迹方程:

33、当u(t)=-1时,状态方程的解为:最优轨迹方程两族抛物线中,各有半支抛物线引向原点,由这两条半支抛物线所组成的曲线AOB称为开关曲线:讨论不同初始状态的最优控制方案,有四种情况综上所述,最优控制规律为上述控制规律的工程实现方法 2:最小燃料消耗控制最小燃料控制问题,性能指标对于双积分模型的最小燃料消耗控制问题,描述如下:设系统状态方程为控制约束为性能指标求最优控制,使J为极小,其中tf 给定根据最优控制规律伴随方程为:状态方程的解为上述方程和边界条件联立,可求出由此可见,最小燃料消耗控制是一种开关型控制,可采用理想的三位式继电器作为控制器.例 4已知系统状态方程及初始条

34、件为:试求最优控制,使性能指标取极小值,并分段求出最优轨线解本题属于终端状态自由,有末值性能指标要求的最小燃料消耗问题由伴随方程为横截条件为从而得解此方程,3:最小能量控制最小能量控制问题指在控制过程中,控制系统的能量消耗为最小,与最小燃料消耗问题类似,也只有在有限时间内有意义.设系统状态方程为控制约束终端状态给定,要求确定最优控制使性能指标为极小伴随方程:引入开关函数的列向量,即由极小值原理知为极小,即应使为极小令最小能量控制的控制规律为例 5设系统状态方程及边界条件为试确定最优控制,使性能指标取极小值.解:由极值条件知:由伴随方程由于终端状态固定,

35、不能有横截条件确定c1和c2需要试探确定.通常最小能量控制问题的控制量较小,首先选择线性段函数代入状态方程并考虑到初始条件解得于是最优控制为约束条件最优轨线最优性能指标第5章线性二次型问题的最优控制 5-1 线性连续系统状态调节器1:有限时间状态调节器设线性系统状态方程为二次型性能指标为不受约束 x(tf)自由，tf 有限对于均连续、有界要求寻找最优控制u*(t)，使J为最小。令正则方程由于u(t)不受约束代入正则方程这是一组一阶微分方程，边界条件和横截条件为显然，可以假定与x(t)之间存在线性关系。上式称为矩阵黎卡提方程，其边界条件为由黎卡提方程求出K(

36、t)后，则最优控制为边界条件和横截条件为引理引理5-1 若K(t)是黎卡提方程的解，则K(t)对所有的是对称的引理引理 5-2 控制至少产生了一个局部最小。引理引理 5-3 若上述状态调节器问题的最优解存在，则最优控制是唯一的。定理定理 5-4 已知线性时变系统的状态方程和性能指标：其中u(t)不受约束，tf 有限，P(t)和Q(t)为半正定对称矩阵，R(t)为正定对称阵，则最优控制存在且是唯一的，并且由下式确定：其中对称矩阵K(t)是下列黎卡提方程的唯一解而最优状态x*(t)则是下列线性微分方程的解：几点说明：1)最优控制规律是一个状态线性反馈规律，它能方便地实现闭环最优控制；2

37、)由于K(t)是非线性微分方程的解，通常情况下难以求得解析解，需要由计算机求出其数值解，又因为其边界条件在终端处，所以需要逆时间方向求解，因此应在过程开始之前就将K(t)解出，存入计算机以供过程使用；3)只要控制时间t0,tf是有限的，K(t)就是时变的（即使状态方程和性能指标J是定常的），因而最优反馈系统将成为线性时变系统；4)将最优控制u*(t)及最优状态轨线x*(t)代入性能指标函数，得性能指标得最小值为：5)当控制时间t0,tf为有限时间时，状态调节器最优解的存在不要求系统能控，这是因为所采用的性能指标是为了保持系统的状态x(t)接近零状态。当控制时间t0,tf为有限时间时，即使系统不

38、能控，不能控状态对性能指标的影响也是有限的，在t0,tf区间中性能指标不至于变为无穷，故最优控制存在。如果，则只有当系统能控时，状态调节器才存在最优解。例5-1 已知一阶系统的状态方程为：二次型性能指标为：求使系统性能指标J为最小值使的最优控制u*(t)。解最优控制其中K(t)为黎卡提方程的解最优线性反馈系统结构图+_+_例5-2 二阶系统状态方程为二次型性能指标为试求使系统性能指标J为最小的最优控制u*(t)解最优控制为因为k(t)为对称矩阵，设 K(t)满足黎卡提方程整理得解此微分方程得K(t)，代入u*(t)表达式，可得最优控制。显然，由于微分方程组的非线性性，不能求

39、得其解析解，而只能利用计算机求得其数值解。例5-3 设系统状态方程和初始条件为：终端时刻tf 为某一给定值。求最优控制u*(t)使下列性能指标为最小，解设代入黎卡提方程由终端边界条件利用计算机逆时间方向解上述微分方程，解出从t=0到t=tf 的K(t)，可得最优控制：2:无限时间状态调节器设线性定常系统状态方程为 A,B能控，u(t)不受约束，二次型性能指标为其中Q，R为常数矩阵要求确定最优控制u*(t)，使J为最小。与有限时间状态调节器相比，有如下几点不同：1)系统是时不变的，性能指标中的权矩阵为常值矩阵。2）终端时刻当t0，tf 为有限时间时，最优控制系统是时变的；希望最优

40、控制系统是定常的。3）终值权矩阵P=0 4）要求受控系统完全能控，以保证最优控制系统的稳定性终值性能指标将失去工程意义如果系统不可控性能指标就有可能趋于无穷大，无法比较控制的优劣，也就无法确定最优控制。结果如下当矩阵对（A，B）完全能控时，存在唯一的最优控制：其中为nn常值正定对称阵，它满足黎卡提代数方程：一般情况下，需要用数值方法求解。闭环最优控制的状态方程为：解此方程可得最优轨线x*(t)，性能指标的最小值为：上述最优控制系统并不一定是稳定的，只有矩阵的所有特征值都具有负实部时，系统才是稳定的，可能反复计算多次选Q求可以证明，若DDT=Q，（A，D）能观测，则对于对称非负

41、定加权矩阵Q，当（A，B）能控时，可以保证最优控制u*(t)的存在性和唯一性，且闭环最优控制系统是稳定的。若为正定对称阵，则闭环最优系统是稳定的。例5-4 考虑下列可控系统性能指标求最优控制u(t)使性能指标J为最小。解由于则Q为正定阵。设可由黎卡提代数方程求得考虑到应为正定对称矩阵，则可以求出是不满足要求的，证明如下若由于由于上式两边为正，平方后有与矛盾最优控制为最优控制系统结构图为例5-5 控制系统状态方程为性能指标求最优控制u*(t)，使J取最小值。解设可由黎卡提代数方程得解之得最优控制为式中状态调节器的稳定性由线性定常最优调节器

42、组成的闭环反馈控制系统状态方程为：设李雅普诺夫函数为由于Q、R均为正定阵，故负定，即系统是渐近稳定的。5-2 线性离散系统状态调节器设离散系统状态方程为 u(k)不受约束。性能指标为：求最优控制序列u*(k)，使性能指标J为最小。式中建立哈密尔顿函数正则方程边界条件与横截条件为可以假设控制方程上述两式中消除要使上式对任意x(k)成立，则有上式称为黎卡提差分方程。逆时间方向解这一差分方程，便可确定最优增益矩阵K(k)。由得最优控制u*(k)为状态的线性函数。因此，同连续系统一样，可以方便地实现闭环控制。最优控制性能指标的最小值为：单位延时例5-6 设一阶离散系统的状态

43、方程为初始条件性能指标求最优控制序列u*(k)，使性能指标J为最小。解为简单起见，设N=2，即只求解一个二步控制问题。性能指标黎卡提方程式逆时间方向计算最优控制最优性能指标 5-3线性连续系统输出调节器 1：有限时间时变输出调节器设线性时变系统为式中控制u(t)不受约束，时变矩阵A（t）,B(t),C(t)是时间的连续、有界函数，具有适当的维数。取二次型性能指标：终端时刻tf 给定，P为半正定，Q(t)、R(t)分别为半正定和正定对称时变矩阵，其各元素对时间连续有界。要求寻找最优控制u*(t)，使J为最小。将代入性能指标与状态调节器问题相比，唯一的差别是性能指标函数中

44、的权函数发生了变化。定理定理5-5 如果矩阵P和Q(t)是半正定的，当且仅当系统A(t),B(t),C(t)能观测时，矩阵C(tf)TPC(tf)和C(tf)TQ(t)C(tf)是半正定的。定理定理5-6 当且仅当系统A(t),B(t),C(t)能观测时，存在唯一的最优控制：其中增益矩阵K(t)是下列黎卡提方程的对称正定解有限时间状态调节器而最优轨线x*(t)是下列微分方程的解最优性能指标2：无限时间定常输出调节器设线性定常系统状态方程为其中u(k)不受约束，终端时刻tf无限，A、B、C为适当维数的常值矩阵。二次型性能指标：其中Q，R为对称正定常值矩阵，要求确定最优控制u*(k)，使性

45、能指标J为最小。定理定理5-7 对于系统(5-1)和性能指标(5-2),若(A,B,C)能控能观测，则存在唯一的最优控制：（5-1）（5-2）其中为对称正定常值矩阵，它满足黎卡提代数方程最优轨线x*(t)满足微分方程性能指标的最小值为：例5-7 设系统状态方程为求最优控制u*(t)，使性能指标取最小值。解本例为无限时间定常输出调节器问题。设代入黎卡提矩阵代数方程阵的正定性，要求故最优控制规律例5-8 设受控系统系统性能指标试求使系统性能指标J为最小值时的最优控制u*(t)。解取状态变量则代入黎卡提矩阵代数方程为保证K的正定性最优控制 5-4 线性连续系统输出跟踪

46、器 1：线性时变系统的跟踪问题设线性时变系统为其中控制u(t)不受约束，时变矩阵A(t)、B(t)、C(t)具有适当的维数，且在t0，tf上连续、有界,，矩阵对(A，C)完全能观。所谓跟踪问题就是寻找最优控制，使系统的实际输出y(t)在给定的时间区间t0，tf上尽可能地逼近理想输出z(t),而又不过多地消耗能量。定义误差向量为性能指标为其中P、Q(t)为半正定对称矩阵，R(t)为正定对称矩阵。哈密尔顿函数：正则方程控制方程边界条件和横截条件假设把u*(t)代入代入上式把(t)代入正则方程上两式对任意时刻的任何x(t)及任何z(t)均成立上述两方程的边界条件利用计算机

47、逆时间求数值解，得到K(t)、g(t)后，得出最优控制最优轨线由下式解出最优性能指标满足下列微分方程及边界条件例5-9 已知一阶系统方程为：其中a为常数，u(t)不受约束，用z(t)表示期望的输出误差为试求最优控制u*(t)，使性能指标取极小值，其中解黎卡提方程及边界条件为：其解为式中最优控制规律为：例5-10 设系统状态方程为初始条件为t0=0，x1(0)=x10，x2(0)=x20，输出方程为求最优控制u(t),使性能指标为最小，z=a 解代入黎卡提方程，得终端条件如果设代入终端条件如果设最后，最优控制为 2：线性定常系统的跟踪问题对于线性定常系统，

48、如果要求输出为常数向量，且终端时刻tf 很大时，则可按上述的线性时变系统的方法推导出一个近似的最优控制规律，虽然这个结构并不适应tf 趋向无穷大的情况，但对一般工程系统是足够精确的，有重要的实用价值。设线性定常系统状态表达式为系统能控且能观测，设要求的输出z为常数向量，误差性能指标式中Q和R为正定的最优控制为 K和g满足最优轨线应满足当终端时间tf 足够大且有限时，得出如下近似结果：例5-11 设系统动态方程为性能指标即z=1 求最优控制使J为最小解设代入黎卡提方程，得：最优控制律为第6章动态规划法6-1最短路线问题动态规划是解决多级决策过程最优化的一种数学方法。所谓多级

49、决策过程，是指把一个过程分为若干个阶段，而每一个阶段都需作出决策，以便使整个过程取得最优的效果。最短路线问题，要求从A地到F地，选择一条最短的线路。为了便于分析，引入几个符号：12345678965411354524244957N：从某点到终点之间的级数；x：表示在任一级所处的位置，称为状态变量；SN(x)：决策变量，表示当处于状态x，还有N级时，所选取的下一个点；WN(x)：表示从状态x到终点F的N级过程的最短距离；d(x,SN)：表示从状态x到点SN的距离。从最后一级开始计算：12345678965411354524244957同理所以，最短路线为最短距离为14 一个N级最优过程，不管

50、第一级决策如何，其余N-1级，决策过程至少必须依据第一级决策所形成的状态组成一个N-1级最优过程，在此基础上，在选择第一级决策，使总的N级过程为最优。12345678965411354524244957这种递推关系可以用下列递推方程式来表达：最优性原理一个多级决策过程的最优策略具有这样的性质：不管其初始状态和初始决策如何，其余的决策必须根据第一个决策所形成的状态组成一个最优策略。6-2 离散最优控制问题设控制系统的状态方程为式中x(k)是k时刻的几维状态向量，u(k)是k时刻的p维容许控制向量，设系统在每一步转移中的性能指标为Fx(k),u(k)如在u(0)的作用下在u(1)的作用下对N级决

展开阅读全文