资源描述
MRAC讲义(new2010)模型参考自适应
———————————————————————————————— 作者:
———————————————————————————————— 日期:
2
个人收集整理 勿做商业用途
第4部分 模型参考自适应控制系统
1 概述
1。1模型参考自适应控制(MRAC)
图1。1模型参考自适应控制系统
由四部分组成:
u 带有未知参数的被控对象
假设被控对象的结构已知.对于线性系统,这意味着系统的极点数和零点数是已知的,但它们的位置是未知的.
u 参考模型(它描述控制系统的期望的输出)
Ø 应当能反映控制任务中的指定的性能;
Ø 规定的理想性态应当是自适应控制系统可以达到的,即当给定对象模型结构后,对参考模型的结构有一些特有的限制(如阶数和相对阶)。
u 带有可校正参数的反馈控制律
Ø 可以得到一族控制器;
Ø 应当具有“完全的跟踪能力”,达到跟踪收敛,即当被控对象的参数精确已知时,相应的控制律应当使系统的输出与参考模型的输出相等;
Ø 现有的自适应控制设计通常要求控制器参数线性化。如果控制规律中可调整的参数是线性的,则称控制器是参数线性化的。
u 校正参数的自适应机制
Ø 能保证当参数变化时系统稳定并使得跟踪误差收敛到零;
Ø 设计方法有李雅普诺夫定理,超稳定性理论,耗散理论等。
例1.1.1 质量未知的模型参考自适应控制
图1.2 一个非线性质量一阻尼—弹簧系统
图1.2中的质量一阻尼—弹簧系统,其动力学方程为
其中,表示非线性耗散式阻尼,而代表非线性弹簧。
考查用电动机力控制一个质量为的质点在没有摩擦的表面上运动,其性态可以描述为
(1。1)
假设给控制系统发出定位指令。用下面的参考模型给出受控物体对外部指令的理想响应
(1。2)
其中,正常数和反映指定的性能,在理想情况下,物体应当像质量—弹簧—阻尼系统一样运动到指定的位置。
若质量精确已知,可以用下面的控制律实现完全跟踪
其中,表示跟踪误差, 是一个严格大于零的数。由这个控制器可以得到按指数收敛的误差系统
现在假设质量 不是精确已知的。可以用下面的控制律
(1。3)
其中,表示可以校正的参数。将这个控制律带入对象动态中,得到闭环误差动态
(1.4)
其中,是组合跟踪误差,定义为
(1。5)
信号量 定义为
参数估计误差 定义为
方程(1。4)表明组合跟踪误差与参数误差通过一个稳定滤波器相关联。
的参数更新规律
(1。6)
其中正常数 称为自适应增益.
注:参数 的校正是基于系统的信号,自适应控制系统具有非线性本质,从而控制器(1。3)也是非线性的。
仿真分析:设物体的真实质量是 ,选择零作为 的初值,这表明预先不知道真实质量。自适应增益为 ,分别选择其他设计参数为 , , 。
图1。3 跟踪性能和未知质量参数的估计,
图1.4 跟踪性能和未知质量参数的估计,
图1.3表示位置指令为,初始条件为 ,的仿真结果。
图1。4表示期望位置是正弦函数的仿真结果。
两种情形下位置跟踪误差均收敛到零,而只有后一种情形参数误差趋于零。
1。2 模型参考自适应控制方法(MRAC)和自校正控制方法(STC)的关系
STC
MRAC
更新参数是为了使得输入—输出数据
3。0之间的拟合误差最小
更新参数是为了使得被控对象和参考模型之间的跟踪误差最小
具有更高的灵活性,可以将不同的估计器和控制器耦合起来(即估计和控制分离)
控制律和自适应律的选择相对复杂
一般很难保证自校正控制器的稳定性和收敛性。通常要求系统的信号足够丰富,才能使得参数估计值收敛到真实值,才能保证系统的稳定性和收敛性。
不管信号充足与否,系统的稳定性和跟踪误差的收敛性通常是可以保证的
从随机调节问题的研究中演化而来
从确定自动伺服系统的最优控制中发展起来的
通常用于离散时间系统
一般用于连续时间系统
2 李雅普诺夫理论基础
2。1 非线性系统与平衡点
1.非线性系统
一个非线性动力系统可以用以下的非线性微分方程描述
(2.1)
其中,f是一个n×1的非线性向量函数,而x是一个n×1的状态向量。状态数n称为系统的阶。
状态向量的一个特定值对应于状态空间的一个点。
方程(2.1)的一个解对应于状态空间的一条曲线,通常称为状态轨线或系统轨线。
(2.1)可以表示一个无控制信号的动态系统(自由系统),也可以代表一个反馈控制系统的闭环动态。
如果系统的动态方程为
而设计的控制律为
闭环系统的动态方程可以被改写成(2。1)的形式。
一类特殊的非线性系统是线性系统.线性系统的动态方程为
其中,A(t)为一个n×n矩阵。
2 自治系统与非自治系统
定义2。1 非线性系统(2.1)称为自治的,如果f不显含t,即如果系统方程可写作
(2.2)
否则,该系统称为非自治的.
控制系统的非自治性可能来自模型或控制器。设有一个时不变的动力学模型为
控制器是时变的,可能导致一个非自治的闭环系统,即如果u=g(x,t)。
例如,简单模型,控制器是非线性非自治的(例如)。
线性时不变装置的自适应控制器往往使闭环系统变为非线性和非自治的。
自治系统和非自治系统的基本区别在于:自治系统的状态轨线不依赖于初始时刻,而非自治系统一般不是这样。
3.平衡点
定义2.2 状态称为系统的一个平衡态(或平衡点),如果一旦,则此后状态永远停留在。
数学上,这表明定常向量满足
(2.3)
平衡点可通过解(2.3)求得。
一个线性时不变系统
(2.4)
当A非奇异时只有一个惟一的平衡点(原点0)。
当A奇异时,它有无数平衡点,即满足Ax=0的所有解。这表明平衡点不是孤立的。例如:,x轴上所有的点都是它的平衡点。
例2.1 摆
图2。1摆
摆的性态可用以下的非线性自治方程来描述
(2。5)
这里R是摆长、M是质量、b是铰链的摩擦系数、g是重力加速度(常数),记。则相应的状态方程为
(2。6a)
(2。6b)
于是,平衡点满足
因此,平衡点为及,从物理意义上讲,它们分别对应摆的垂直向上及垂直向下的位置。
平衡点的变换
设我们感兴趣的平衡点为,那么,引入新变量
并将代入方程(2.2),即可得到关于变量y的方程
(2。7)
当y=0时,对应于,是(2。7)的一个平衡点.
因此,若要研究方程(2。2)在平衡点附近的性态,只要研究方程(2。7)在原点邻域的性态即可.
2。2稳定的概念
图2.2稳定的概念
1.稳定性与不稳定性
定义2.3 一个平衡点x=0称为稳定的(也称李雅普诺夫意义下的稳定),如果任给R>0,总存在r>0,使当<r时,<R,t>0.如果x=0不是稳定的,则称为不稳定平衡点.
定义2。3可写成
或等价地记作
例2。2 范德波尔振子的不稳定性
范德波尔振子方程为
图2。3 范德波尔振子的不稳定原点
控制系统性能要求由渐近稳定这个概念来描述。
2.渐近稳定性
定义2.4 平衡点0称为渐近稳定的,如果它是稳定的,而且存在r>0使当<r时,。
图2。2显示当系统轨线从球Br内出发的轨线均收敛到原点。
球Br称为平衡点的一个吸引域,是指最大的一个区域,使从此区域出发的一切轨线均收敛于原点。
一个李雅普诺夫稳定而又不是渐近稳定的平衡点称为临界平衡点。
上述定义表征了系统的局部性态。
3。 局部稳定性与全局稳定性
定义2.5 如果对任何初值渐近稳定成立,则这样的平衡点称为大范围渐近稳定,也称全局渐近稳定.
线性时不变系统的稳定性分三种:渐近稳定、临界稳定和不稳定。
2。3李雅普诺夫直接方法
李雅普诺夫直接方法的基本原理是一个基本物理现象的数学表达。可以由一个标量函数的变化来判断一个系统的稳定性.
图2.4 一个非线性质量一阻尼—弹簧系统
图2.4中的质量一阻尼—弹簧系统,其动力学方程为
(2.8)
这里表示非线性耗散式阻尼,而代表非线性弹簧.
系统的全部机械能是它的动能与势能之和
(2.9)
机械能和前面定义的稳定性概念之间的联系
能量为0对应于平衡点.
渐近稳定意味着机械能收敛到零。
不稳定对应于机械能的增长.
机械能作为一个标量以隐含形式反映着状态向量的幅值,而且系统的稳定性可以通过系统能量的变化来描述。
系统运动中能量的变化率为
(2。10)
由于阻尼的存在,系统的能量不断减少,一直到质点停止运动,即。。
2.3.1 正定函数与李雅普诺夫函数
上述能量函数有两个性质:
第一个性质:它除了x及均为零的点外严格正;
第二个性质:当x及依动力学方程(2.8)变化时,该函数单调下降。
定义2.6 一个标量连续函数V(x)称为局部正定的,如果V(0)=0,且在一个球内
如果V(0)=0且上述性质在整个状态空间成立,则称V(x)为全局正定函数。
例如函数
它是例2。1中摆的机械能,它是局部正定的。
又如非线性质量—阻尼-弹簧系统的机械能(2。9),它是全局正定的。
注:这个系统动能不是正定的。
图2。5 正定函数的典型形式
类似地定义几个相关概念:
函数V(x)称为局部或全局负定的,如果-V(x)是局部或全局正定的;
V(x)是正半定的,如果V(0)=0且对一切x≠0,V(x)≥0;
V(x)是负半定的,如果-V(x)是正半定的。
设x为自治系统(2。2)的状态,假定V(x)是可微的,它对时间的导数可以用链式法则得到
通常将这个导数称为“V沿着系统轨线的导数”.
定义2。7 如果在一个球内,函数V(x)是正定的,且有连续偏导数,而且它沿系统(2.2)的任一状态轨线的导数为负半定的,即
那么V(x)称为系统(2。2)的李雅普诺夫函数。
图2。6 定义2.7在n=2时的描述
2.3.2 平衡点定理
包括局部与全局两类。局部定理描述平衡点邻域的稳定性质.
1.局部稳定性的李雅普诺夫定理
定理2.1(局部稳定性) 如果在一个球内,存在一个标量函数V(x),它具有一阶连续偏导数,并且
V(x)正定(在球内)
负半定(在球内)
那么平衡点0是稳定的,如果导数V(x)在球内是负定的,那么0是渐近稳定的。
例2。3 局部稳定性
带有粘性阻尼的单摆方程为
考查以下标量函数
(2。11)
这个函数是局部正定的。时间导数为
≤0
利用上述定理可知,原点是稳定平衡点。
物理学观点,是摆消耗能量的功率。
选择这个李雅普诺夫函数,还不能得到系统渐近稳定的结论,因为只是负半定的。
选择适当的李雅普诺夫函数,可以得到更精确的结果
考查以下标量函数
(2.12)
它也是系统的一个李雅普诺夫函数,因为局部地有
更为有趣的是实际上是局部负定的,证明了摆的渐近稳定性。
一个重要事实:李雅普诺夫分析中的所有定理都是充分性定理.
例2。4 局部渐近稳定性
考查下述非线性系统关于原点的稳定性
给定正定函数
它沿着系统轨线的导数为
因此,在二维球B2内(或 〈2的区域内)局部负定.从而,原点是渐近稳定的。
2.全局稳定性的李雅普诺夫定理
放大到整个状态空间。
一个附加条件:V(x)必须是径向无界的,这指的是,当时(当x沿任何方向趋于无穷时),。
定理2.2(全局稳定性) 假定存在状态x的标量函数V,它具有一阶连续偏导数,并且
V(x)正定
负定
,当
那么原点作为平衡点是全局渐近稳定的。
例2。5 考查系统
状态空间原点是它的一个平衡点。设V为正定函数
V沿任一系统轨线的导数为
它是负定的.因此,原点是全局渐近稳定平衡点。注意:这个全局稳定的结果也表明原点是系统惟一的平衡点。
2.4 线性时不变系统的李雅普诺夫分析
1.对称矩阵、正定矩阵
定义2。8 一个方阵M称为对称的,如果M=MT(即,如果对)
定义2.9 一个n×n方阵称为正定的(p。 d。),如果
换言之,一个矩阵M是正定的,如果二次函数是正定函数。每个正定矩阵对应一个正定函数。反之,显然不成立.
判定定理:设M为对称矩阵,M正定的充要条件是其主子式(即M11,M11M12-M21M22,…,detM)均为正数;或等价地,其特征值均为正数。
正半定、负定、负半定等概念可类似定义。
一个n×n方阵M被称为正半定的(p。s.d.),如果
2.线性时不变系统的李雅普诺夫函数
给定一个线性系统,考虑一个候选二次李雅普诺夫函数
其中,P是一个给定的对称正定矩阵,函数沿系统轨线的导数为另一个二次形式
(2.13)
这里
(2.14)
因此,问题变成能否找到一个对称正定矩阵Q使它满足李雅普诺夫方程(2。14)。
例2.6 考虑二阶线性系统,其A矩阵为
选P=I,则得
矩阵Q不是正定的。
给定一个正定矩阵Q,反过来找正定矩阵P,即
选择一个正定矩阵Q。
由李雅普诺夫方程(2。14)解出P。
检验P是否正定。
定理2。3 一个线性时不变系统渐近稳定的充要条件是,任给对称正定矩阵Q李雅普诺夫方程(2。14)有惟一矩阵解P,而且P是对称正定的。
说明:任何正定矩阵Q都可以用来判定线性系统的稳定性。
例2.7 考虑例2.6中的二阶系统,取Q=I且设
这里,由于P的对称性,有,于是李雅普诺夫方程为
其解为
相应的矩阵为
它是正定的,因此原线性系统是全局渐近稳定的。
3 高级稳定性理论
3.1 非自治系统的稳定性概念
1 平衡点
对一个形如
(3。1)
的非自治系统, 称为它的一个平衡点,如果下式成立:
(3。2)
注意:对 此方程都成立,这意味着系统(3.1)在所有的时间内都能够停留在点。
例如:线性时变系统
(3.3)
当 不恒为奇异矩阵时,该系统有惟一的平衡点—原点0。
2 稳定性概念的扩展
把自治系统的稳定性概念扩展到非自治系统,关键在于定义中要适当地包含初始时间 。
定义3.1 平衡点0在 是稳定的,如果对于任意的,存在一个正数,使得
(3.4)
否则,平衡点0是不稳定的。
这个定义表明:状态轨线可以停留在一个半径 任意小的球内,只要它是从一个半径 充分小的球内出发。
定义3。1不同于定义2。3,因为定义3.1中的初始球的半径依赖于初始时间。
定义3.2 平衡点0在是渐近稳定的,如果
它是稳定的;
,使得。
定义3。3 平衡点0是全局渐近稳定的,如果对有
3 稳定性概念中的一致性
定义3.4 平衡点0是局部一致稳定的,如果定义3.1中的标量可以选择为与无关,即。
引入一致稳定概念的直观原因是为了排除对大的,越来越不稳定的系统.
类似地,一致渐近稳定是为了限制初始时间 对状态收敛方式的影响。
定义3.5 平衡点0是局部一致渐近稳定的,如果
它是一致稳定的;
存在一个半径与 无关的吸引球,使得初始状态在内的轨线关于一致收敛于0。
对一致收敛是指对,使得对 有
即从球内出发的状态轨线经过与时间 无关的时间段 之后,一致收敛到一个更小的球内。
一致渐近稳定总是蕴含渐近稳定,反之则不然。
例3。1 考虑一阶系统
它有通解
这个解渐近收敛到零,但不是一致收敛。
直观上:对于更大的,此解要经过更长的时间才能接近于原点。
通过用全空间替换吸引球,就可以得到全局一致渐近稳定的概念。
3.2 非自治系统的李雅普诺夫直接方法
1 时变正定函数和具有无穷大上界的函数
定义3。6 标量时变函数 是局部正定的,如果, 且存在一个时不变正定函数,使得
(3。5)
因此一个时变函数是局部正定的,如果它控制住一个时不变局部正定函数。
全局正定函数可以类似的定义。
用同样的方法可以定义其他局部的或者全局的相关概念。
函数是负定的,如果 是正定的;
是半正定的,如果它控制住一个时不变半正定函数;
是半负定的,如果是半正定的。
定义3.7 标量函数具有无穷大上界,如果,且存在一个时不变正定函数,使得
换句话说,标量函数具有无穷大上界,如果受一个时不变正定函数的控制.
例3.2 一个简单的时变正定函数
因为它控制住函数 。
这个函数也具有无穷大上界,因为它被函数 控制住。
给定一个时变标量函数,它沿着系统轨线的导数为
(3。6)
2 非自治系统稳定的李雅普诺夫定理
定理3。1 (非自治系统稳定的李雅普诺夫定理)
如果在平衡点0的邻域球 内,存在一个具有连续偏导数的标量函数,使得
1) 是正定的,
2) 是半负定的,
那么平衡点0是李雅普诺夫意义下稳定的。
而且,如果
3) 具有无穷大上界,
那么原点是一致稳定的;如果条件2)加强为是负定的,那么平衡点是一致渐近稳定的。
如果球 用全空间代替,且满足条件1),加强的条件2),条件3)和条件
4) 是径向无界的,
那么平衡点0是全局一致渐近稳定的.
与自治系统类似,如果在平衡点的某个邻域内,是正定的,沿着系统轨线的导数是半负定的,那么称为这个非自治系统的李雅普诺夫函数.
例3。3 全局一致渐近稳定
考查系统
为了确定平衡点0的稳定性,选择下列标量函数
这个函数是正定的,因为它能控制住一个时不变正定函数 。
这个函数也具有无穷大上界,因为它能被时不变正定函数 所控制住.而且,
这表明
因此,是负定的.所以平衡点0是全局一致渐近稳定的。
例3。4 具有无穷大上界条件的重要性
图3.1 函数
令 是一个连续可微的函数,除了在峰点处为1外,其他为 。 的图形如图3。1,在取整数处为的峰点。假设在横坐标 处的峰点宽度小于 。所以 的无穷积分满足
因此标量函数
(3.7)
是正定的()。
现在考虑一阶微分方程
(3.8)
如果选择(3.7)为候选李雅普诺夫函数,发现
即 是负定的。然而,(3。8)的通解为
因此,原点不是渐近稳定的。
3.3 用Barbalat引理作类李雅普诺夫分析
问题:非自治系统的渐近稳定分析
探求:的条件
Barbalat引理是一个关于函数及其导数的渐近性质的纯粹的数学结果.
3。3.1 函数及其导数的渐近性质
给定一个关于的可微函数,有下面3个重要事实:
并不能推出当时存在极限.如。
当时,存在有限极限并不意味着.如。
如果有下界且是递减的(),那么存在极限。
未表明曲线的斜率是否趋于零。
3。3。2 Barbalat引理
引理3。1(Barbalat) 如果可微函数f(t),当时存在有限极限,且一致连续,那么当时。
函数g(t)在[0,∞)是连续的,如果
≥0,>0,>0,≥0,
<<R
函数g在[0,∞)是一致连续的,如果
>0,>0,≥0,≥0,
<<R
g是一致连续的,如果总是可以找到一个与特殊点t1无关的。
可微函数一致连续的一个简单的充分条件是它的导数是有界的。
Barbalat引理的一个推论:如果可微函数f(t),当时存在有限极限,存在且有界,那么当时,.
引理3.2(类李雅普诺夫引理) 如果标量函数满足下面的条件
V(x,t)有下界;
(x,t)是半负定的;
(x,t)对时间是一致连续的。
那么(x,t) 。
下面考虑一个简单的自适应控制系统的渐近稳定分析。
例3.5 带有一个未知参数的一阶自适应控制系统的闭环误差动力系统为
其中e和是闭环动力系统的两个状态,分别表示跟踪误差和参数误差,w(t)是有界的连续函数。
考查有下界函数
其导数为
≤0
因此,e和是有界的。
为了利用Barbalat引理,我们验证的一致连续性.的导数为
这表明是有界的。因此是一致连续的.由Barbalat引理得.
注意:虽然e收敛于零,但是系统不是渐近稳定的,因为这里只能保证是有界的。
建立在Barbalat引理上的分析称为类李雅普诺夫分析。它与李雅普诺夫分析有两个微妙的但很重要的不同之处:
1) 函数V可以仅仅是一个关于x和t有下界的函数,而不要求是正定函数;
2) 第二,的导数一定是一致连续的,且为负或零.这里典型的做法是证明是有界的.
3.4 正线性系统
3。4.1 正实和严格正实传递函数
考查以下形式的n阶单输入-单输出线性系统的有理函数
,假设分子和分母的多项式的系数是实数,且.分母的阶与分子的阶的差称为系统的相对阶。
定义3.8 如果
(3.9)
则传递函数是正实的;
如果对某个,
则传递函数是严格正实的。
例3.6 严格正实函数
考查有理函数
其中,相应于复变量有
如果,那么,是正实的;
选择,是严格正实的。
定理3.2 传递函数是严格正实的,当且仅当
1) 是严格稳定的传递函数;
2) 的实部沿着是严格正的,即
(3。10)
传递函数是严格正实的必要条件,即
是严格稳定的;
的Nyquist图完全在右半复平面内,在正弦曲线输入下,系统响应的相位移总是少于90°;
的相对阶为0或1;
具有严格最小相位(即它的所有零点都在左半开复平面内)
例3。7 严格正实和非严格正实传递函数
考查下列系统
正实与严格正实传递函数的根本不同:
正实传递函数允许在轴有极点,严格正实传递函数在轴没有极点。
例3.8 考查积分器的传递函数
当时,
例3。9 考虑传递函数
判断h5是否是严格正实的。
注意,h5可解释为是质量-弹簧—阻尼器系统
当输入为作用力,输出为速度时的传递函数。h5是严格正实系统。
3.4.2 Kalman—Yakubovich引理
引理3。3(Kalman-Yakubovich)(正实引理)
考查可控的线性时不变系统
传递函数
(3.11)
是严格正实的,当且仅当存在正定矩阵P和Q,使得
(3.12a)
(3.12b)
4 模型参考自适应控制设计方法
4。1 如何设计自适应控制器
传统(非自适应)控制设计:首先确定的是控制器结构(即极点的位置),然后,根据已知的系统参数计算出控制器参数。
自适应控制主要的不同:被控对象的参数未知,控制器参数必须由自适应律提供。
自适应控制设计附加的任务:选择自适应律并证明适应性系统的稳定性。
自适应控制设计包括以下3个步骤:
1) 选择含有变化参数的控制律;
2) 选择校正这些参数的自适应律;
3) 分析所得到的系统的收敛特性.
MRAC设计:首先猜测李雅普诺夫函数,并且选择控制律和自适应律使得 下降。
引理4。1 考虑两个信号和 ,它们之间有如下动态关系:
(4.1)
其中, 为标量输出信号, 是严正实的传递函数,是符号已知的未知常数, 是关于时间 的 维向量函数, 是可以测量的 维向量,如果向量服从如下规律:
(4.2)
其中 是正常数,那么 和全局有界。而且,如果 有界,那么
当 时,
图4.1 含有SPR传递函数的系统
证明:设(4.1)状态空间描述为
(4。3a)
(4。3b)
因为 是严正实的,由KY引理知:对给定正定矩阵,存在正定矩阵 使得
取正定函数 如下
(4.4)
其沿着(4.3)和(4.2)定义的系统轨线的导数为
因此,(4。1)和(4。2)定义的系统是全局稳定的,和 是全局有界的。
如果信号 有界,那么由(4。3a)知 也有界,故
有界,意味着 一致连续.由Barbalat引理, 渐进地收敛到零。
MRAC设计中:
被控对象的输出和参考模型的输出之间的跟踪误差与参数估计误差存在形式如(4.1)的关系;
(4.2)给出了一种校正控制器参数且同时保证系统稳定的方法。
4。2 一阶系统的自适应控制
讨论一阶系统的自适应控制。过程可以近似地表示为一阶微分方程
(4。5)
其中, 是系统输出, 是输入,和 是系统参数。
1 问题描述
在自适应控制中,假定系统参数 和 是未知的.所期望的自适应系统的性态设为一阶参考模型
(4.6)
其中, 和 是常数, 是有界的外部参考信号。参数 要求是严格正的,也选为严格正数.
参考模型可以用它的传递函数 表示为
其中
且 是拉普拉斯变量.注意到 是严正实函数。
自适应控制的目的:寻找控制规律和自适应规律,使得模型的跟踪误差 渐近地收敛到零。
需要假设参数的符号已知。
2 控制律的选择
图4。2 一阶模型参考自适应控制系统
选择如下控制律
(4.7)
其中 和 是时变反馈增益。闭环系统为
(4。8)
目标是使得系统可能实现精确模型匹配。如果被控对象参数已知,那么选择下面的控制参数
(4。9)
则相应的闭环系统为
它和参考模型动态相同,从而有零跟踪误差。
3 自适应律的选择
记跟踪误差为
参数误差定义为自适应律提供的控制器参数与理想参数的差,即
(4。10)
将(4。6)(参考模型)减去(4。8)(闭环系统)得到跟踪误差的动态
(4.11)
它可以表示为参数误差和跟踪误差之间的关系式
(4。12)
其中 表示拉普拉斯变量.
由引理4。1,得到下面的自适应律
(4.13a)
(4.13b)
其中 是表示自适应增益的正常数。 决定了搜索适当控制器参数的方向。
4 跟踪收敛性分析
用李雅普诺夫理论(或引理4。1)来分析系统的稳定性和收敛性质。候选李雅普诺夫函数如下
(4。14)
沿系统轨线的导数为
于是,自适应系统是全局稳定的,即信号 和 都有界。
由Barbalat 引理保证跟踪误差 全局渐近收敛。因为和 的有界性蕴含 的有界性,从而 是一致连续的。
例4.1 一阶系统
设计自适应控制器控制不稳定系统
假定对象参数 对于自适应控制器是未知的。
参考模型选择为
取自适应增益为 。两个控制器参数的初值均取为0,这表明没有先验知识。系统和参考模型的初始条件都取为零.
仿真中使用了两种不同的参考信号。
。从图4.3知跟踪误差收敛到零,但参数误差不收敛。
。从图4。4知跟踪误差和参数误差都收敛到零。
图4.3跟踪性能和参数估计,
图4。4跟踪性能和参数估计,
5 参数收敛性分析
推测:参考信号的性质与参数收敛性之间有某种关系,即只有当参考信号 满足一定条件时,估计参数才会收敛到理想控制器参数。
自适应机制的目标是寻找能使跟误差趋于零的参数。如果参考信号足够复杂,使得只有真实的参数向量能使跟踪误差收敛,那么参数才会收敛到真实值。
下面我们找出参数收敛的具体条件。
稳定过滤器(4.12)的输出趋于零,于是必有收敛到零.当时间 相当大时, 几乎是常数,且
即
(4。15)
其中
参数收敛的问题简化为向量应满足什么条件使得这个方程有惟一零解。
如果 是常数 ,那么对于大的时间,有
其中 是参考模型的直流增益.所以
方程(4.15)变为
这蕴涵着估计参数收敛到参数空间中的一条直线.
“持续激励”(persistent excitation)条件:
持续激励是指存在严格正常数 和使得对任何,有
(4.16)
直观上讲, 持续激励蕴涵对应于不同时间 的 不能总是线性相关。
剩下的问题: 与持续激励 之间的关系。
对于一阶系统,如果 至少包含一个正弦部分,就可以保证 是持续激励。
6 推广到非线性系统
由下面微分方程描述的一阶非线性对象
(4。17)
其中 为任意的已知非线性函数。
采用下面的控制规律
(4.18)
其中第二项用来自适应地抵消非线性项。
将控制律代入(4.17),然后减去(4.6)(参考模型),得到误差动态为
其中,参数误差 定义为
选择自适应律
(4。19a)
(4.19b)
(4。19c)
类似的,可以证明跟踪误差 趋于零,且参数误差有界。
估计参数的收敛性质。
对于常数参考输入 ,估计参数收敛到三维空间中的一条直线
为了使参数收敛到理想值,信号向量 应当是持续激励的,即,存在正常数 和 使得对任意,有
对于线性系统, 个参数的收敛估计需要在参考输入中至少有 个正弦函数。
然而,对于非线性系统, 和 之间的定性关系依赖于特殊的非线性函数。
例4.2 一阶非线性对象的仿真
假设非线性对象由下面的方程描述
(4.20)
使用和例4.1中相同的参考模型,初始参数和设计参数。
对参考信号 ,仿真结果见图4。5。表明跟踪误差收敛到零,参数误差只是有界.
对于参考信号,仿真结果见图4.6,此时跟踪误差和3个参数误差都收敛到零。
图4。5 一阶非线性系统自适应控制,
图4.6一阶非线性系统自适应控制,
注释:
中单个正弦信号使得三个参数得到估计;
系统中的信号振动剧烈。
原因:非线性特性通常产生更多的频率,所以 可能比 中包含更多的正弦信号。
,信号向量 收敛到
其中, 为稳态响应, 为相应的函数值。
其中, 和 是参考模型在 时的幅度和相差。
信号向量 包含两个正弦信号, 中包含一个两倍频率的正弦信号。直观上讲,两倍频率部分是3个参数的估计收敛和估计参数振动更剧烈的原因。
4.3 线性系统全状态反馈自适应控制
1 问题描述
考查 阶线性系统的自适应控制
(4.21)
其中,状态分量 都是可量测的。假设系数向量 是未知的,但是 符号已知.
如质量—弹簧—阻尼系统:
其位置和速度可测量。
控制的目标是使得跟踪下面稳定参考模型的响应
(4.22)
其中, 是有界参考信号。
2 控制律的选择
定义信号 为
(4.23)
其中, 是使得 成为稳定多项式的正常数。
在(4.21) (被控对象)的两边加上 并整理,将被控对象动态改写为
参数已知时,选择控制律为
这表示极点配置控制器,它使得极点位置由系数 确定,所以跟踪误差 满足闭环动态
参数未知时,控制律为
(4。24)
其中,信号向量 ,且估计参数向量 。
跟踪误差 满足闭环动态
(4。25)
其中
3 自适应律的选择
将闭环误差动态(4.25)改写为状态空间形式
(4。26a)
(4.26b)
其中
考查候选李雅普诺夫函数
其中, 和 是对称正定常数矩阵,且对于给定 ,满足
计算 为
因此,取自适应律为
(4。27)
可得
用Barbalat引理证明的收敛性。由上述控制律(4.24)和自适应律(4.27),使以及它的个导数都趋于零。
参数收敛的条件是向量 的持续激励性。
4。4 线性系统输出反馈自适应控制
本节我们考查只用输出量测而不是全状态反馈时线性系统的自适应控制。
在控制器中需要引入动态结构。
回顾一下,在传统的(无参数不确定性的)设计中,当所有的状态都可以量测时,我们将状态乘以常数增益得到的控制器可以镇定系统,然而,当只有输出量测时,必须用到观测器结构。
线性定常系统可以用下面的传递函数表示
(4.28)
其中
Rp(p)=a0+a1p+…+an-1pn-1+pn
Zp(p)=b0+b1p+…+bm—1pm—1+pm
kp称为高频增益.这是因为,由对象频率响应知:在高频段有
即高频特性本质上决定于kp.
该系统的相对阶是r=n-m.在自适应控制问题中,我们假设系数ai、bj(i=0,1,…,n—1;j=0,1,…,m—1)和高频增益都是未知的。
假定所期望的系统性能由下面传递函数表示的参考模型描述
(4。29)
其中,Zm和Rm分别为nm阶和mm阶首一胡尔维茨多项式;km是正数。
为了能够完全跟踪,参考模型的相对阶必须大于或等于被控系统的相对阶.因此,假定nm-mm≥n-m.
设计的目标是确定控制律和相应的自适应律,使得对象输出y渐近地趋于ym。
在确定控制输入时,假定输出y是可以量测的,但不允许使用输出的微分,这是为了避免数值微分带来噪声放大。
为实现这一目的,我
展开阅读全文