1、第第4章章 最优控制原理与应用最优控制原理与应用 1最优控制的基本概念最优控制的基本概念n最优控制研究的主要问题:根据已建立的被控对象的数学模型,选择一个容许的控制率,使得被控对象按照预定的要求运行,并使给定的某一性能指标达到极小值(或极大值)。n从数学观点来看,最优控制研究的问题是:求解一类带有约束条件的泛函极值问题。2最优控制问题最优控制问题n最优控制问题的一般提法:在满足系统方程的约束条件下,在容许控制域中确定一个最优控制律,使得系统状态从已知初态转移到要求的目标集,并使性能指标达到极值。3最优控制的应用类型最优控制的应用类型I.积分型性能指标1.最小时间控制;2.最少能量控制;3.最少
2、燃料控制;II.末值型性能指标III.复合型性能指标44.1 用变分法解最优控制用变分法解最优控制4.1.1 泛函与变分4.1.2 欧拉方程4.1.3 横截条件4.1.4 变分法解最优控制问题返回主目录5 在动态系统最优控制问题中,性能指标是一个泛函,性能指标最优即泛函达到极值。解决泛函极值问题的有力工具是变分法。所以下面就来列出变分法中的一些主要结果,大部分不加证明,但读者可对照微分学中的结果来理解。64.1.1 泛函与变分泛函与变分 如果对某一类函数 中的每一个函数 ,有一个实数值 与之相对应,则称 为依赖于函数 的泛函,记为粗略来说,泛函是以函数为自变量的函数。(函数的函数)1、泛函:先
3、来给出下面的一些定义。72、泛函的连续性:则则线性泛函 是连续的,称Jx为线性连续泛函。若对于收敛于点x0点列xn,其中x0,xn ,均有则称泛函J在x0处连续。对于线性泛函Jx,若8 满足下面条件的泛函称为线性泛函 这里 是实数,和 是函数空间中的函数。3、线性泛函:94、自变量函数的变分:自变量函数 的变分 是指同属于函数类 中两个函数 、之差 这里,t 看作为参数。当 为一维函数时,可用图4-1来表示。10图4-1 自变量函数的变分11 这里,是 的线性泛函,是关于 的 高阶无穷小,则称为泛函Jx的变分。可知泛函变分就是泛函增量的线性主部。当自变量函数 有变分 时,泛函的增量为 5、泛函
4、的变分:12当一个泛函具有变分时,也称该泛函可微。和函数的微分一样,泛函的变分可以利用求导的方法来确定。定理定理 设Jx是线性赋范空间Rn上的连续泛函,若在x=x0处Jx可微,则Jx的变分为13证明:由于 是 的线性连续泛函,又因为 是 的高阶无穷小,14泛函变分的规则15举例:可见,计算泛函的变分如同计算函数的微分一样。166、泛函的极值:若存在 ,对满足的 一切X,具有同一符号,则 称 在 处有极值(极大值或极小值)。17定理定理(变分预备定理变分预备定理):设 是时间区间t0,t1上连续的n维向量函数,是任意的连续n维向量函数,且有 ,若则必有184.1.2 欧拉方程欧拉方程 假定t0与
5、tf 给定,且初态与末态两端固定。(1)无约束泛函极值的必要条件定理定理 设有如下泛函极值问题:(1)已知x(t0)=x0 x(tf)=xf,则极值曲线 应满足如下欧拉方程19(2)(3)及横截条件20于是泛函J 的增量 可计算如下(以下将*号省去)上式中 是高阶项。证明:与 之间有如下关系21 根据定义,泛函的变分 是 的线性主部,即对上式第二项作分部积分,按公式可得(4)22 J取极值的必要条件是 等于零。因 是任意的,要使(3-2)中第一项(积分项)为零,必有(5)(4)式中第二项即为结论中的式(3).23n举例:利用上面的结论求得24 (2)有等式约束泛函极值的必要条件有等式约束泛函极
6、值的必要条件定理定理 设有如下泛函极值问题:(6)已知x(t0)=x0,x(tf)=xf,则极值曲线 应满足如下欧拉方程和横截条件 25其中,为拉格朗日函数,是待定拉格朗日乘子。264.1.3 横截条件横截条件(1)末端时刻固定时的横截条件末端时刻固定时的横截条件当tf 固定时,在x(t0)=x0 固定时,横截条件为如果末端状态也固定x(tf)=xf 时,边界条件退化为x(t0)=x0,x(tf)=xf;当末端状态自由时,横截条件为x(t0)=x0 x(t0)=x0 27(2)末端时刻自由时的横截条件末端时刻自由时的横截条件28末端受约束时,存在如下近似关系:如果末端自由,则曲线c(t)不存在
7、。设性能指标为容许轨线x(t)与极值曲线x*(t)之间有如下关系(7)29当末端由(xf,tf)移动到 时,产生如下的泛函增量(8)30将(8)右端的第二项在极值曲线泰勒展开对上式右端的第二项分部积分31将以上结果代入(8),取增量的线性主部,得泛函的变分令 ,得欧拉方程和横截条件:(9)(10)32(3)末端时刻自由、末端状态变动时的横截条件末端时刻自由、末端状态变动时的横截条件 1)末端状态自由时的横截条件末端状态自由时的横截条件当x(tf)自由时,由(7)可知代入(10)可得到因为 任意,所以tf自由、x(tf)自由的横截条件和边界条件为:(11)33 2)末端状态受约束时的横截条件末端
8、状态受约束时的横截条件设受约束方程为 x(tf)=c(tf),由(7)可知代入(11),并考虑 任意,得到tf自由、x(tf)受约束的横截条件和边界条件为(11.1)34n如果t0也自由、x(t0)受约束,即沿着曲线g(t)则应满足以下横截条件(11.2)35n例子例子:(1)求平面上给定两点A(0,1),B(1,3)间的最短弧长。(2)若B点可沿曲线 c(t)=2-t 移动,求一连接A、B两点且弧长最短的曲线。对于最短弧长最短弧长问题,它是泛函在两端固定条件下的变分问题,欧拉方程的解为 x=at+b带入边界条件可得解 x=2t+1。36(2)属于末端受约束的变分问题,其最短弧长满足与(1)相
9、同的欧拉方程,因此 x=at+b,因为初始点没有变化,所以由x(0)=1可得b=1.为了确定参数a,运用横截条件(11.1)可得解得 a=1,因此 可知极值曲线为 .由末端约束条件 ,可知 tf=0.5,带入弧长公式得到最短弧长 x=t+137 不同边界情况下的横截条件不同边界情况下的横截条件384.1.4 变分法解最优控制问题变分法解最优控制问题系统方程为性能指标为末端状态 x(tf)受约束,要求的目标集为最最优优控控制制问问题题是是:确定最优控制u*(t)和最优曲线x*(t),使得系统(12)由已知初态 x0 转移到要求的目标集(14),并使性能指标(13)达到极值。(14)(13)(12
10、)39 可以利用拉格朗日乘子法将上述有约束条件的泛函极值问题化为无约束条件的泛函极值问题。(15)再引入一个标量函数它称为哈密顿(Hamilton)函数,在最优控制中起着重要的作用。40(1)末端时刻固定时的最优解末端时刻固定时的最优解对于如下最优控制问题:无约束且在t0,tf上连续,.在t0,tf上,f(.),和L(.)连续可微,tf固定。最优解的必要条件为:1)x(t)和 满足正则方程412)边界条件和横截条件3)极值条件证明:构造广义泛函42分部积分则对上式取一次变分,考虑到根据泛函极值的必要条件,可得到结论。43当末端时间tf固定,末端状态x(tf)自由时,不存在目标集因此,该下的泛函
11、极值只需将上述结论中的 去掉即可。当末端时间tf固定,末端状态x(tf)固定时,正则方程不变,边界条件退化为x(t0)=x0,x(tf)=xf,系统在可控的条件下,极值条件也不变。4445本例属于末端时刻固定,末端状态受约束的泛函极值问题。Hamilton函数协态方程极值条件46状态方程根据初始条件和目标条件可求出 c3=c4=0,4c1-9c2=6再根据横截条件可求出c1=(1/2)c2,可求出c1与c2的值。进而获得最优解47(2)末端时刻自由时的最优解末端时刻自由时的最优解 对于如下最优控制问题:最优解的必要条件为:1)x(t)和 满足正则方程482)边界条件和横截条件3)极值条件4)在
12、最优曲线末端的Hamilton函数满足49证明:构造广义泛函当末端由(xf,tf)移动到 时,产生如下的泛函增量将上式在最优轨线展成泰勒级数并取主部,应用中值定理并考虑 ,可得到50将 代入上式可得到令 得到定理的结论。51Page562,表10-2 用变分法求最优解的必要条件52例子:解:本例属于tf自由,末端状态固定、控制无约束的泛函极值问题。53 =常数,再由极值条件得由状态方程和初始条件得到利用末态条件得到最后根据末端时刻H的变化率可以求得 这样,求得的最优解为544.2 极小值原理及其应用极小值原理及其应用4.2.1 连续系统的极小值原理4.2.2 离散系统的极小值原理4.2.3 最
13、小时间控制4.2.4 最小能量控制返回主目录 为解决控制有约束的变分问题,庞特里亚金提出并证明了极小值原理,其结论与经典的变分理论有许多相似之处,而且不要求哈密尔顿函数对控制量连续可微。554.2.1 连续系统的极小值原理连续系统的极小值原理(1)末端自由时的极小值原理末端自由时的极小值原理定理定理 对于如下定常系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中 为任意分段连续函数;末端状态自由;末端时刻固定或自由。假设 f(x,u)和 都是自变量 的连续可微函数,且在有界集上f(x,u)对变量x满足56则对于最优解u*,x*,tf*,必存在非零的 ,使如下必要条件成立:1)正正则则
14、方程方程其中2)边边界条件与横截条件界条件与横截条件3)极小极小值值条件条件4)沿最沿最优轨线优轨线哈密哈密尔尔顿顿函数函数变变化率化率(tf自由时用自由时用)57极小值原理与经典变分法的区别:极小值原理与经典变分法的区别:n容许控制条件放宽。极小值条件对通常的控制约束均适用。n最优控制使哈密顿函数取全局极小值。当满足经典变分法的应用条件时,其极值条件是极小值原理中极值条件的特例。n极小值原理不要求哈密顿函数对控制向量的可微性。58例子:解:已知由协态方程可得到59由横截条件解出由极小值条件由于可得到60定理定理 对于如下时变系统、末值型性能指标、末端自由、控制受约束的最优控制问题式中末端时刻
15、固定或自由,假设同前,则对于最优解u*,x*,tf*,必存在非零的 ,使如下必要条件成立:1)正正则则方程方程其中612)边边界条件与横截条件界条件与横截条件3)极小极小值值条件条件4)沿最沿最优轨线优轨线哈密哈密尔尔顿顿函数函数变变化率化率(tf自由时用自由时用)62于是该问题就变成了如下定常问题:63利用定常系统的结论,可知协态方程为即(17)(16)64横截条件为即极小值条件为将式(16)代入可得即得结论3)。沿最优轨线哈密尔顿函数变化率将(18)代入可得到本定理的结论4)。(18)65定理定理 对于如下定常系统、积分型性能指标、末端自由、控制受约束的最优控制问题式中末端时刻固定或自由,
16、假设同前,则对于最优解u*,x*,tf*,必存在非零的 ,使如下必要条件成立:1)正正则则方程方程其中662)边边界条件与界条件与横截条件横截条件3)极小极小值值条件条件4)沿最沿最优轨线优轨线哈密哈密尔尔顿顿函数函数变变化率化率(tf自由时用自由时用)67于是该积分型问题就变成了如下末值型问题:68把上面两个式子代入协态方程 ,可得69因此由横截条件可知因为 ,上式可表示为由(19)可得(19)70则哈密尔顿函数为将它代入(19)可得从而也得到了极值条件3)和最优轨线末端应满足条件4)。71解:该题属于定常系统、积分型性能指标、tf固定、末端自由、控制受约束的最优控制问题。令72由协态方程解
17、得再由横截条件 可以求出c=e。显然,当 时u*(t)产生切换,由 可以解出 =0.307,因此将u*代入状态方程并利用初值条件可得到最优轨线为73(2)末端受约束时的极小值原理末端受约束时的极小值原理定定理理 对于如下定常系统、末值型性能指标、末端受约束、控制受约束的最优控制问题式中末端时刻固定或自由,假设同前,则必存在非零的 ,使如下必要条件成立:741)正正则则方程方程其中2)边边界条件与横截条件界条件与横截条件3)极小极小值值条件条件4)沿最沿最优轨线优轨线哈密哈密尔尔顿顿函数函数变变化率化率(tf自由时用自由时用)75定定理理 对于如下时变系统、末值型性能指标、末端受约束、控制受约束
18、的最优控制问题式中末端时刻固定或自由,假设同前,则必存在非零的 ,使如下必要条件成立:761)正正则则方程方程其中2)边边界条件与横截条件界条件与横截条件3)极小极小值值条件条件4)沿最沿最优轨线优轨线哈密哈密尔尔顿顿函数函数变变化率化率(tf自由时用自由时用)774.2.2 离散系统的极小值原理离散系统的极小值原理(1)末端约束时的离散极小值原理末端约束时的离散极小值原理定理定理 设离散系统状态差分方程为性能指标为式中 N 固定。假设 f(.),和 L(.)都是自变量 的连续可微函数,末端状态受如下目标集约束78则对于最优序列u*,x*,必存在非零的 ,使如下必要条件成立:1)差分方程差分方
19、程其中2)边边界条件与横截条件界条件与横截条件3)极小极小值值条件条件79若u(k)无约束,则极值条件为(2)末端自由时的离散极小值原理末端自由时的离散极小值原理定理定理 设离散系统状态差分方程为性能指标为式中 N 固定。假设同前,末端状态自由,则对于最优序列u*,x*,必存在非零的 ,使如下必要条件成立:801)差分方程差分方程其中2)边边界条件与横截条件界条件与横截条件3)极小极小值值条件条件若u(k)无约束,则极值条件为8182该题属于控制无约束问题,构造由协态方程可得到由极值条件83得到将u*(k)代入状态方程并利用边界条件可得到844.2.3 最小时间控制最小时间控制(1)最小时间的
20、控制问题最小时间的控制问题设线性定常系统完全可控,求满足下列不等式约束的容许控制:使系统从初始状态x(0)=x0转移到x(tf)=0,并使性能指标极小,其中 tf 自由。85(2)正常情况与奇异情况正常情况与奇异情况构造根据极小值条件,可得则设可知,(20)可表示为下式(20)86(3)奇异性的充要条件奇异性的充要条件定理定理 设矩阵 式中bj中为矩阵B的列向量,当且仅当m个Gj矩阵 中至少有一个是奇异矩阵,上述最优问题是奇异的。定理定理 上述问题是正常的,当且仅当872024/5/22 周三88(3)Bang-Bang控制控制定定理理 对上述问题,若系统是正常的,则最优解的必要条件是1)正正
21、则则方程方程其中2)边边界条件界条件3)极小极小值值条件条件894)沿最沿最优轨线优轨线哈密哈密尔尔顿顿函数函数变变化率化率(tf自由时用自由时用)904)经验证系统可控,因此系统正常。可用上述定理求解。由协态方程得取u*=1,可以求得系统的解,并消去变量t可得到最优轨线方程91则满足末态要求的最优轨线方程可表示为取u*=-1,也可得到满足末态要求的最优轨线方程曲线 组成曲线 ,称为开关曲线,表示为开关曲线将相平面分成两部分R+和R-9293则时间最优控制为944.2.4 最小能量控制最小能量控制设线性定常系统求满足下列不等式约束的容许控制:使系统从初始状态x0转移到x(tf)=xf,并使性能
22、指标极小,其中 tf 固定。95构造定义开关向量函数由协态方程可得则开关向量可表示为96其分量为则将上式代入哈密尔顿函数,可得若uj(t)无约束,则97解出由控制约束条件可得出下面的最优控制律98解:构造99则最优控制律应满足由协态方程可解出100因为末端固定,不能由横截条件确定c1,c2,这里采用试探法。通常情况下,如果使最小能量控制问题的控制量较小,首先选取线性最优控制函数,即将上式代入状态方程解得根据初始条件可得c3=c4=0。根据末态条件,可得101根据哈密尔顿函数沿最优轨线的变化率得将u(tf),x1(tf)和x2(tf)代入上式可得 c1-(c2-c1tf)2=0。综合以上方程,可
23、以得出102因此,最优控制为经检验在0,tf区间上,满足u(tf)t0)和相应状态x(t1),u*(t)、x*(t)仍是该系统的最优控制和最优轨线。143(2)动态规划的基本递推方程动态规划的基本递推方程问题问题:设N级决策过程的动态方程为式中,控制决策约束u(k),k=0,1,2,N-1;代价函数(性能指标)为假 设 f(.)和 L(.)连 续,L(.)正 有 界。求 最 优 控 制 序 列u(0),u(1),u(N-1),使代价函数极小。(35)144说说明明:上述问题中,k表示N级决策过程中的阶段变量,x(k)表示第k+1级的初始状态,u(k)表示第k+1级采用的控制向量。问题中的假设是
24、为了保证最优控制序列的存在。设有N-k级决策过程145式中,j=k,N-1,u=u(k),u(N-1).则始自第k级任一容许状态x(k)的最小代价为上式中右端第一项是第k级所付出的代价;第二项是从第k+1级到第N级的代价和。因此式中求极小的运算分146为两部分:在本级决策u(k)作用下求极小,以及在剩余决策序列u(k+1),u(N-1)作用下求极小,则上式变为(36)147根据最优性原理,如下关系成立将上式代入(36)得到动态规划基本递推方程利用上式求解最优控制序列时,从过程的最后一项开始,逐级逆向递推:首先令k=N-1则由式(37)可得到(37)148式中J*xN,N表示代价函数中的末项值。
25、对于(35)问题,代价函数中无末值项,J*xN,N=0,故式(38)为单级最优决策问题。令k=N-2,则由式(37)可得到式中J*x(N-1),N-1已由式(38)确定,因此上式也是一个单级最优决策问题。(38)149根据(37)逆向逐级递推,最后可以得到J*x(0),0.最后一步的递推解及最优策略正是我们要求的最优解。式中的状态及控制均不受约束。求最优控制序列u*(0),u*(1),u*(2),使代价函数极小。150解:本题属于N=3级最优决策问题。根据递推方程(37)令k=2根据代价函数的末值项及系统方程,有所以因为u(k)无约束,令可得151令k=1可得令k=0可得152代入已知的x(0
26、),按正向顺序求出因此最优控制、最优轨线及最优代价为153采用离散动态规划方法,可以方便地求出控制与状态变量均有约束时离散系统的最优控制问题。(1)离散最优控制问题的动态规划解离散最优控制问题的动态规划解设非线性离散系统的状态差分方程为其中,k=0,1,N-1.代价函数为求最优控制序列u*(k),使代价函数最小。4.4.2 离散动态规划离散动态规划(39)154根据动态规划的基本递推方程,分以下步骤进行求解:求第求第N级最优控制级最优控制u*(N-1)求出 求第求第N-1级最优控制级最优控制u*(N-2)求出 155求第求第k+1级最优控制级最优控制u*(k)求出 求第求第1级最优控制级最优控
27、制u*(0)求出 156再由已知初值x(0),顺序求出u*(0),x*(1),u*(N-1),x*(N-1).157解:本题为N=4级最优控制问题。令k=3158令k=2159令k=1160令k=0161最优解为:4.4.3 连续动态规划连续动态规划(1)连续系统的最优控制问题连续系统的最优控制问题 设连续系统的状态方程为性能指标为162控制u(t)有界;在t0,tf上,f(.),L(.)连续且可微;并假设以t为初始时刻,tt0,tf,x(t)为初始状态时,函数J(x,t)连续,且对x(t)和t有连续的一阶和二阶偏导数。求在容许控制域中,确定最优控制u*(t),使性能指标最小。为了求上述问题的
28、最优解,除了可以采用极小值原理外,还可以用连续动态规划法,该方法的数学基础为哈密尔顿-雅可比方程。(2)哈密尔顿哈密尔顿-雅可比方程雅可比方程设在区间t,tf上,控制函数ut,tf存在,则最优性能指标为163由于 与ut,t+t无关,由最优性原理所以164右端第一项由中值定理得第二项展成泰勒级数其中O(t2)是关于t的高阶小量,将这两项代入原式可得165令t0得到哈密尔顿-雅可比方程的第一种形式当u(t)不受约束时,构造令 ,可得到最优控制的隐含形式(40)166将上式代入(40)可得该偏微分方程的边界条件为上两式构成了哈密尔顿-雅可比方程的第二种形式。(41)(42)167(3)连续动态规划
29、的基本方程连续动态规划的基本方程当控制u(t)受约束时,由哈密尔顿-雅可比方程的第一种形式可得连续动态规划的基本方程则最优解的充分条件可表示为利用上式求解连续动态规划问题的步骤可以总结如下:(43)1681)求解最优控制的隐式解。求解最优控制的隐式解。当控制u(t)受约束时,在约束范围内取遍u(t)使得求出当u(t)无约束时,则由 求出上述隐式解。2)求最优性能指标。求最优性能指标。将 代入哈密尔顿函数可得到169则最优指标为微分方程及边界条件的解。3)求最优控制的显式解。求最优控制的显式解。由求出的J*(x,t)计算 并代入 ,得到最优控制的显式解。1704)求求最最优优轨轨线线。将求出的最优控制并代入状态方程,解出最优轨线x*(t)。171解解:本题为无限时间定常状态调节器问题,采用连续动态规划求解时,可以按照下面的步骤进行计算:1)求最优控制的隐式解。可知2)求最优性能指标J*x(t)。将上面的控制代入哈密尔顿函数172由于本题属于线性二次型问题,可以假设则因此哈密尔顿-雅可比方程为上式对所有非零x(t)都成立,则可以解出173则最优性能指标为令t=0,代入初始状态条件可得 J*x(0)=1。3)求u*(t)的显式解。4)求x*(t)。将u*(t)代入状态方程,得到闭环系统方程,然后解出方程的解即得到最优轨线x*(t)。通过计算,得到1742024/5/22 周三175