1、基于智能控制算法的二级倒立摆控制器设计第一章 绪论倒立摆系统是一个典型的多变量、非线性、强耦合的自然不稳定系统。最近几年一直是控制领域研究的热点。对倒立摆系统的研究不仅具有很重要的理论意义,而且在研究双足机器人直立行走,火箭发射过程的姿态调整和直升机飞行控制领域中也有指导性的现实意义。本文围绕二级直线倒立摆系统,设计模糊控制器和神经网络控制器对二级倒立摆实现稳定控制。实物控制的成功进一步证明了本文所设计的控制器具有很好的稳定性和抗干扰性。主要研究工作如下:1)建立了二级倒立摆系统的数学模型,对倒立摆系统进行定性分析。证明了倒立摆系统开环是不稳定的,但在平衡点是可控的。同时,从相对可控度方面指出
2、了二级倒立摆的相对可控度要比一级倒立摆小很多,更难以控制。2)二级倒立摆的模糊控制器设计。因为二级倒立摆的状态方程中有6个状态变量,所以模糊控制器的设计要求更高,要求它的输入维数不能太高,避免产生“规则爆炸”的问题。规则必须有效而且完整。为此,基于LQR最优二次理论,得出反馈矩阵,并以此构造出了降维矩阵,把状态变量进行有效的合并。最后,设计出了二级倒立摆的稳定模糊控制器,经过实物实验,成功的实现二级倒立摆的稳定控制。证明了本文所设计的二级倒立摆稳定模糊控制器的有效性。3)二级倒立摆的神经网络控制器基于实时控制时的样本数据,设计了BP网络,通过matlab对网络进行了训练,实验证明训练好的神经网
3、络控制器有很强的适应性和抗干扰性能。4) 二级倒立摆实物调试完成了对二级倒立摆实物的模糊控制和神经网络控制1.1倒立摆系统研究的意义倒立摆系统的研究涉及到机器人技术、控制理论、计算机控制等多个领域,其本身是一个绝对不稳定、高阶次、多变量、强耦合的非线性系统,作为一个典型的控制对象一直以来受到不少专家学者的关注与研究。人们试图通过倒立摆这样的一个典型对象,检验新的控制方法是否有较强的处理多变量、非线性和绝对不稳定系统的能力,从而从中找到最优秀的控制方法。倒立摆系统作为控制理论研究中的一个比较理想的实验手段,为自动控制理论的教学、试验和科研构建了一个良好的试验平台,以用来检验某种控制理论或方法的典
4、型方案,促进了控制系统新理论、新思想的发展。由于控制理论的广泛应用,由此系统研究产生的方法和技术将在半导体及精密仪器加工、机器人控制技术、人工智能、导弹拦截控制系统、卫星飞行中的姿态控制和一般工业应用等方面具有广阔的利用开发前景。所以说,倒立摆系统的研究不仅具有深刻的理论意义,而且具有深远的现实价值。1. 2倒立摆的控制算法多少年来,国内外不少专家学者对倒立摆进行了大量的研究,人们试图寻找不同的控制方法实现对倒立摆的控制。1.2.1经典控制理论的方法用经典控制理论的频域法设计非最小相位系统的控制器并不需要十分精确的对象数学模型,因为只要控制器使系统具有充分大的相位裕量,就能获得系统的参数很宽范
5、围内的稳定性。一级倒立摆系统的控制对象是一个单输入(外力)两输出(角度和位移)的系统。根据对系统的力学分析,应用牛顿第二定律,建立小车在水平方向运动和摆杆旋转运动的方程,并经过线性化、拉氏变换后得出传递函数,从而得到零、极点分布情况,根据使闭环系统能稳定工作的思想设计控制器。为此,需要引入适当的反馈,使闭环系统特征方程的根都位于左平面上。但是,由于经典控制理论本身的局限性,它只能用来控制一级倒立摆,对于复杂的二级、三级倒立摆却无能为力。1.2.2现代控制理论的方法用现代控制理论控制倒立摆的平衡,主要是用状态反馈来实现的。状态反馈控制是通过对倒立摆物理模型的分析,建立倒立摆的数学模型,再用状态空
6、间理论推出状态方程和输出方程,然后利用状态反馈和kalman滤波相结合的方法,实现对倒立摆的控制。目前主要有三种状态反馈的方法来设计倒立摆控制器,即极点配置调节器的方法、LQR最优调节器的方法和LQY最优调节器的方法,试验表明,用这三种方法不仅对一级倒立摆可以成功的控制,二级倒立摆的控制效果也不错。1976年,Mori等人首先将倒立摆系统在平衡态局部邻域内线性化,然后利用状态空间方法设计出比例微分控制器,控制单级倒立摆取得了很好效果。1.2.3智能控制理论的方法模糊控制理论控制倒立摆是智能控制算法中研究较多的一种。根据模糊控制理论所设计出来的控制器是一种非线性控制器,对非线性系统具有很好的控制
7、效果。模糊控制是采用模糊化、模糊推理、解模糊等运算的模糊控制方法,其主要工作是模糊控制器的设计。关键点在于模糊规则的制定。由于倒立摆是一个多变量、非线性、不稳定、强耦合的复杂系统,尽管理论上的一级、二级倒立摆数学模型已经推导出来,但其数学模型很难精确的反映实际系统,所以经典控制理论和现代控制理论的方法控制倒立摆都不是特别理想。目前,很多国内外学者对倒立摆的研究集中在智能控制领域。1996年,张乃尧等采用模糊双闭环控制方案成功的实现对一级倒立摆的稳定控制。1997年,T.H.Hung等设计了类PI模糊控制器应用于一级倒立摆控制,具有系统结构简单对硬件依赖小的特点。神经网络控制理论也是一种智能控制
8、算法。它能够任意充分的逼近复杂的非线性关系,NN学习能够学习和适应严重不确定性系统的动态特性,所有定量与定性的信息都等势分布贮于网络内的各种神经元,故有很强的鲁棒性和容错性。用神经网络方法来实现倒立摆的平衡控制,迄今已经取得了不少成果。1983年Barto等人设计了两个单层神经网络,采用AHC(Adaptive Heuristic Critic)学习算法实现了状态离散化的倒立摆控制。1989年,Anderson进一步用两个双层神经网络和AHC方法实现了状态未离散化的倒立摆平衡控制。Peng通过将状态离散化成为162个区域,用Lookup表示Q值的方法实现了基于Q学习算法的倒立摆平衡控制。将Q学
9、习算法和BP神经网络有效结合,实现了状态未离散化的倒立摆的模型学习控制。智能控制理论中还包括拟人控制算法、变结构控制算法等。不同的算法的结合使得控制力更加强大。1994年,北京航空航天大学张民廉教授将人工智能与自动控制理论相结合,提出“拟人智能控制理论”,实现了用单电机控制三级倒立摆实物。北京示范大学李洪兴教授采用变论域自适应模糊控制理论研究四级倒立摆的控制问题,成功实现了四级倒立摆实物系统控制。1.3论文主要工作本论文的主要工作是研究了二级直线倒立摆系统的模糊控制和神经网络控制问题。分别设计出了二级倒立摆的模糊稳定控制器和神经网络控制器。用Matlab和Simulink对模糊控制系统和神经网
10、络系统进行了仿真研究,然后通过调试实现了倒立摆实物系统的控制。具体内容如下: (1)初步了解目前倒立摆的研究现状以及研究热点,认识到了随着控制理论的不断发展和完善,智能控制器越来越受到专家学者的关注。 (2)具体介绍了倒立摆的种类以及它自身的一些特点,掌握了倒立摆控制系统的软硬件配置。 (3)详细论述了二级倒立摆的数学建模,推导出它的微分方程,以及线性化后的状态方程,并且分析倒立摆系统的可控性及其可控性指数。(4)认真理解了模糊控制理论的原理及其模糊控制器的设计步骤,对模糊控制算法有了很深的认识。(5)针对二级倒立摆系统,讨论了倒立摆系统的模糊控制方法。以LQR理论为基础,把状态方程中的状态变
11、量进行有机的整合,降低模糊控制器的输入维数。同时,根据得到的数据推算出模糊控制器的模糊规则,并设计出模糊稳定控制器。通过仿真以及后期调试,最后成功的把二级倒立摆实物稳定在倒立平衡位置。从而验证了所设计控制器的有效性。(6)介绍了神经网络的基础理论,分析了把神经网络用于控制二级倒立摆系统的可行性。详细介绍了二级倒立摆神经网络控制器的设计和实现,完成了实物的调试。 (7)对论文的工作进行总结。第二章 倒立摆系统2.1倒立摆分类倒立摆按结构来分,有以下类型:(1)直线倒立摆系列直线倒立摆是在直线运动模块上装有摆体组件,直线运动模块有一个自由度,小车可以沿导轨水平运动,在小车上装载不同的摆体组件,可以
12、组成很多类别的倒立摆,直线柔性倒立摆和一般直线倒立摆的不同之处在于,柔性倒立摆有两个可以沿导轨滑动的小车,并且在主动小车和从动小车之间增加了一个弹簧,作为柔性关节。(2)环形倒立摆系列环形倒立摆是在圆周运动模块上装有摆体组件,圆周运动模块有一个自由度,可以围绕齿轮中心做圆周运动,在运动手臂末端装有摆体组件,根据摆体组件的级数和串连或并联的方式,可以组成很多形式的倒立摆。(3)平面倒立摆系列平面倒立摆是在可以做平面运动的运动模块上装有摆杆组件,平面运动模块主要有两类:一类是XY运动平台,另一类是两自由度SCARA机械臂。按倒立摆的级数来分:有一级倒立摆、两级倒立摆、三级倒立摆和四级倒立摆,一级倒
13、立摆常用于控制理论的基础实验,多级倒立摆常用于控制算法的研究,倒立摆的级数越高,其控制难度更大,目前,可以实现的倒立摆控制最高为四级倒立摆。2.2倒立摆的特性虽然倒立摆的形式和结构各异,但所有的倒立摆都具有以下的特性:(1)非线性倒立摆是一个典型的非线性复杂系统,为了方便研究,可以通过线性化得到系统的近似模型,线性化处理后再进行控制。也可以利用非线性控制理论对其进行控制。倒立摆的非线性控制正成为一个研究的热点。(2)不确定性倒立摆的主要误差来自于模型误差,机械传动间隙以及各种阻力。实际控制中一般通过减少各种误差来降低不确定性,如通过施加预紧力减少皮带或齿轮的传动误差,利用滚珠轴承减少摩擦阻力等
14、不确定因素。(3)耦合性倒立摆的各级摆杆之间,以及和运动模块之间都有很强的祸合关系,在倒立摆的控制中一般都在平衡点附近进行解耦计算,忽略一些次要的耦合量。(4)开环不稳定性倒立摆的平衡状态只有两个,即在竖直向上的状态和竖垂直向下的状态。其中垂直向上为绝对不稳定的平衡点,垂直向下为稳定的平衡点。(5)约束限制由于机构的限制,如运动模块行程限制,电机力矩限制等。为了制造方便和降低成本,倒立摆的结构尺寸和电机功率都尽量要求最小,行程限制对倒立摆的摆起影响尤为突出,容易出现小车的撞边现象。2.3倒立摆控制系统本文中研究的被控对象是固高公司的型号为GLIP2001的直线倒立摆控制系统,主要包括倒立摆系统
15、(倒立摆本体)、电控箱及由运动控制卡和PC机组成的控制平台三大部分,如图2.1所示。图2.1直线倒立摆硬件组成示意图2.3.1控制系统硬件直线倒立摆控制系统硬件包括计算机、运动控制卡、伺服系统、倒立摆和光电码盘反馈测量元件等几大部分,组成一个闭环系统,如图2.2所示。图2.2 直线二级倒立摆组成框图光电码盘 1 将小车的位移、速度信号反馈给伺服驱动器和运动控制卡,下面一节摆杆(和小车相连)的角度、角速度信号由光电码盘 2 反馈回控制卡和伺服驱动器,上面一节摆杆的角度和角速度信号则由光电码盘 3 反馈。计算机从运动控制卡中读取实时数据,确定控制决策(小车向哪个方向移动、移动速度、加速度等),并由
16、运动控制卡来实现该控制决策,产生相应的控制量,使电机转动,带动小车运动,保持两节摆杆的平衡。(1)倒立摆本体(系统)图2.3 直线倒立摆本体结构图2.3所示为直线二级倒立摆的实物图。二级倒立摆装置由沿导轨运动的小车和通过转轴固定在小车上的摆体组成。在轨道一端装有用来测量小车位移的光电编码器。摆体与小车之间、摆体与摆体之间由转轴连接,并在连接处分别装有一个光电编码器,分别用来测量一级摆和二级摆的角度。两根摆杆可以绕各自的转轴在水平导轨所在的铅垂面内自由转动,而小车则由交流伺服电机驱动,通过皮带轮在同步传动带的带动下在水平导轨上左右运动,从而使倒立摆稳定在竖直向上的位置,完成对倒立摆的稳定控制。倒
17、立摆系统的主要硬件设备如下。1.编码器旋转编码器是一种角位移传感器,它分为光电式、接触式和电磁感应式三种,其中光电式脉冲编码器是闭环控制系统中最常用的位置传感器。 图2.4光电编码器原理示意图 旋转编码器有增量编码器和绝对编码器两种,图2.4为光电式增量编码器示意图,它由发光元件、光电码盘、光敏元件和信号处理电路组成。当码盘随工作轴一起转动时,光源透过光电码盘上的光栏板形成忽明忽暗的光信号,光敏元件把光信号转化成电信号,然后通过信号处理电路的整形、放大、分频、记数、译码后输出。为了测量出转向,使光栏板的两个狭缝比码盘两个狭缝距离小1/4节距,这样两个光敏元件的输出信号就相差n/2相位,将输出信
18、号送入鉴向电路,即可判断码盘的旋转方向。光电式增量编码器的测量精度取决于它所能分辨的最小角度a(分辨角、分辨率),而这与码盘圆周内所分狭缝的线数有关。其中n为编码器线数。由于光电式脉冲编码盘每转过一个分辨角就发出一个脉冲信号,因此,根据脉冲数目可得出工作轴的回转角度,由传动比换算出直线位移距离;根据脉冲频率可得工作轴的转速;根据光栏板上两条狭缝中信号的相位先后,可判断光电码盘的正、反转。由于光电编码器输出的检测信号是数字信号,因此可以直接进入计算机进行处理,不需放大和转换等过程,使用非常方便,因此应用越来越广泛。 对于线数为n的编码器,设信号采集卡倍频数为m,则有角度换算关系为:式中为编码器轴
19、转角;N为编码器读数 2.交流伺服电机交流伺服电机没有电刷和换向器,不需维护,也没有产生火花的危险。驱动电路复杂,价格高。按结构分为同步电机和异步电机,转子是由永磁体构成的为同步电机,转子是由绕组形成的电磁铁构成的为异步电机。控制方式分为电压控制和频率控制两种方式,异步电机通常采用电压控制方式。 电机型号:MSMA022A 1 G额定输出功率(RATED OUTPUT ) 0. 2KW,额定频率(RATED FREQ ) 200HZ,额定转速(RATED REV.)3000 r/min。(2) 电控箱电控箱主要完成驱动和转接的功能,内安装有如下硬件:交流伺服驱动器(如图2.5 ( a)所示)、
20、I/O接口板(运动控制器的端子板)(如图2-5(b)所示)、直流电源、开关、指示灯等电器元件。 (a) 松下交流伺服电机驱动器 ( b) I/O接口板图2.5 交流伺服驱动器交流伺服电机驱动器型号为:MSDA023A1 A表示适用于小惯量电机,额定输入电压:100-115V,额定电流:1.0A,电机额定输出为30 W,增量式旋转编码器(脉冲数2400P/r、分辨率17bits、引出线11线)。(3)运动控制器运动控制器的型号种类有很多,它以IBM-PC及其兼容机为主机,提供了标准的ISA总线(PC104)和PCI总线两个系列的产品。固高直线倒立摆采用的是GT系列的运动控制器,它采用高性能的DS
21、P和FPGA技术。基于DSP技术的运动控制器,可以同步控制四个运动轴,实现多轴协调运动。其核心由数字信号处理器ADSP2181和FPGA组成,可以实现高性能的控制计算;运动方式可为单轴点位运动、直线/圆弧插补、速度控制等;网络接口可为以太网、RS232或RS422/485,适合标准ISA,PC 104和PCI总线;控制电机可以是伺服或步进电机;控制方式可为闭环或开环控制,其控制周期用户可调,看门狗实时监控DSP工作状态;输出方式采用模拟量输出或脉冲输出,模拟量输出-10V+10V,脉冲量输出最高输出1 MHz,同时设置跟随误差极限、加速度极限及控制输出极限。2.3.2控制系统软件MATLAB是
22、当今最优秀的科技应用软件之一,它以强大的科学计算与可视化功能、简单易用、开放式可扩展环境,它在许多科学领域中称为计算机辅助设计和分析、算法研究和应用开发的基本工具和首选平台。RTW ( Real-Time Workshop)是Math Work系列软件的重要组成部分。RTW与MATLAB其它组成软件的无缝连接,既满足了设计者在系统概念与方案设计等方面的需求,也为系统的技术实现或完成不同功能的系统实时操作实验提供了方便,并且为并行工程的实现创造了一个良好的环境。RTW是MATLAB图形建模和仿真环境Simulink的一个重要的补充功能模块,提供了一个实时的开发环境从系统设计到硬件实现的直接途径。
23、使用RTW进行实时硬件的设计,用户可以缩短开发周期,降低成本。RTW可以将模型自动转换为代码,在硬件上运行动态系统的模型,同时还支持基于模型的调试。RTW十分适用于加速仿真过程、形成完善的实时仿真解决途径和生成产品级嵌入式实时应用程序。在MATLAB下实现硬件在回路实时仿真,一般可以通过两种渠道来完成。第一种方式是WINDOWS方式实时仿真。如图2.6表示,是在MATLAB环境中调用硬件系统关于接口的动态链接文件,使硬件设备能够和基于WINDOWS操作系统的MATLAB进行数据交换,然后在通过软件的编制将这些数据集成到Simulink中。第二种方式是MATLAB实时内核方式,如图2. 7所示,
24、是利用MATLAB的实时工具箱RTW进行硬件在回路仿真,通过目标链接的方式和Simulink联系在一起,通过单独的实时内核的方式驱动外部硬件设备,完成系统实时控制。图2.6 WINDOWS方式图2.7 MATLAB实时内核方式对于第一种方式,理论上能够完成硬件在回路仿真的任务,而且目前大多数外部设备制造商都向客户提供其产品基于WINDOWS平台的驱动程序,实现起来并不复杂。但是由于WINDOWS操作系统任务执行频率不够高,并不能保证应用程序在实时情况下运行,因为其不能保证程序在必要时比其它进程抢先。关于第二种方式,采用MATLAB的实时工具箱RTW ( Real-Time Workshop )
25、实现控制任务,专用的实时内核代替WINDOWS操作系统接管了实时控制任务,内核任务执行的最小周期是1 ms,大大地提高了系统的实时性。对于实时控制像倒立摆这样对实时性要求非常之高的对象而言,能否达到控制效果是个问题。在WINDOWS平台上进行实时仿真实验,如果实验效果不太理想,很难说明到底是因为算法结构或参数设计不当的原因还是因为该平台实时性达不到要求的原因。所以采用第二种方式,专用的实时内核代替Windows操作系统接管了实时控制任务。2.3.3软硬件环境要求硬件环境:IBM兼容微机(含两个PCI插槽);基本运行配置:CPU PIII, 1 G、内存128M、固高运动控制器;软件环境:实控软
26、件可工作在Windows2000和WindowsXP等操作系统环境下,系统运行时需要MATLAB 6.5, MATLAB/Simulink 5.0、MATLAB/Real-TimeWorkshop, MATLAB/Real-Time Windows Target以及Visual C/C+等软件支持。 Real-Time Windows Target是RTW的附加产品,可将Intel 80x86/Pentiurn计算机或PC兼容机转变为一个实时系统,既作为主机又作为目标机,而且支持许多类型的I/O设备板卡(包括ISA和PCI两种类型)。用户只需要安装相关的软件、一个编译器和I/O设备板卡,就可将
27、一个PC机用作实时系统并通过I/O设备与外部设备进行连接。而且内核任务执行的最小周期是alms,可以满足倒立摆的实时性控制的要求。第三章 倒立摆系统建模及其定性分析为了研究倒立摆系统的稳定控制问题,首先需要建立倒立摆的数学模型。这是对该系统进行仿真的必要前提。系统建模可以分为两种:实验建模和机理建模。实验建模就是通过在研究对象上加上一系列的研究者事先确定的输入信号,激励研究对象并通过传感器检测其输出,应用数学手段建立起系统的输入输出关系。这里面包括输入信号的设计选取,输出信号的精确检测,数学算法的研究等等内容。机理建模就是在了解研究对象的运动规律基础上,通过物理、化学的知识和数学手段建立起系统
28、内部的输入输出状态关系。3.1直线二级倒立摆的数学模型 考虑到牛顿力学建模需要对许多微分方程进行处理,在进行二级倒立摆建模时,大量微分方程的运算会使建模变得很复杂,所以本文采用分析力学中的Lagrange方程建模。二级倒立摆的模型如图3. 1所示。图3.1直线二级倒立摆模型首先,对该系统做如下假设:1)小车、一级摆杆和二级摆杆都是刚体。2)皮带轮与同步带之间无相对滑动,且同步带不会拉伸变长。3)小车与导轨之间的摩擦力与小车速度成正比。4)各级摆杆与转轴间的转动摩擦力矩与摆杆的角速度成正比。 本次控制系统采用的二级倒立摆各物理参数取值如表3.1所示:表3.1直线二级倒立摆系统参数符号含义实际系统
29、参数M小车质量1.32KGm1下摆杆质量0.04KGm2上摆杆质量0.132KGm3质量块质量0.208KG1下摆摆杆与垂直向上方向的夹角2上摆摆杆与垂直向上方向的夹角l1下摆摆杆转动中心到摆杆质心的距离0.09ml2上摆摆杆转动中心到摆杆质心的距离0.27mF作用在小车上的外力利用Lagrange方程推导运动学方程:Lagrange方程为: (3-1)其中,L为拉格朗日算子,q为系统的广义坐标,T为系统的动能,V为系统的势能。 (3-2)其中,i=1,2 ,3.n,fi为系统在第i个广义坐标上的外力,在二级倒立摆系统中,系统有三个广义坐标,分别为x, 1, 2。1)系统总动能:T=T0+T1
30、+T2+T3其中,小车的动能:一级摆动能:二级摆动能:质量块动能:2)系统总势能:V=V0+V1+V2+V3其中, 小车势能:V0=0 一级摆势能:V1=m1gl1cos1 二级摆势能:V2=m2g(2l1cos1+l2cos2) 质量块势能:V3=2m3gl1cos1根据所得到的系统总动能T和系统总势能V,代入式(3-1)可以求出拉格朗日算子L,得: 因为系统在广义坐标1,2上均无外力作用,所以以下方程组成立: (3-3)对拉格朗日算子L进行处理,得:对于方程组(3-4),关于,求解,得:=P/Q (3-5)其中, (3-6)其中,式(3-5)和式(3-6)可表示成以下形式: (3-7) (
31、3-8)在平衡位置附近进行泰勒级数展开,并线性化,可以得到: (3-9)其中, (3-10)其中,对于二级倒立摆系统,取以下六个变量为系统的状态变量:并且取小车加速度为输入变量,即:那么,由式(3-9)和式(3-10)可以得到系统的状态空间表达式: (3-11)3.2倒立摆系统的定性分析3.2.1相关定理简介 在得到系统的数学模型后,为了进一步的了解系统性质,需要对系统的特性进行分析,最主要的是系统的稳定性、可控性和可观性。 直观上,摆杆竖直向上系统是不稳定的。其稳定性分析可以用李亚普诺夫稳定性理论。对于系统在平衡点附近的稳定性可以根据前面得到的系统线性模型来分析。因为需要设计控制器来镇定系统
32、,那么首先要考虑系统是否可控。在进行分析前,先介绍线性控制理论中几个关于可控性、可观性的判定定理。 定理1(可控性判据):n阶线性定常连续系统状态完全可控,当且仅当系统的可控性矩阵:满秩,即rank(S=n。特别的,当输入控制量u(t)为标量时,可控性矩阵s为方阵;rank(s)=n等价于S的行列式值det(S)0。定理2(可观性判据):n阶线性定常连续系统状态完全可观,当且仅当系统的可观性矩阵:满秩,即rank( V)=n。特别的,当输出量y(t)为标量时,可观性矩阵V为方阵:rank( V)=n等价于V的行列式值det(V)0。为了衡量系统控制器设计的难度,或者说衡量系统本身可控性的相对程
33、度,一般称之为相对可控性,可通过计算可控性矩阵的奇异值b来判断。 对于一个实矩阵A (mn阶),如果可以分解为A =USV,其中U和V为分别为mn与nm阶正交阵,S为nn阶对角阵,记为S=diag(a1,a2,.,ar,0,., 0)。其中,a1,a2,.,ar大于或等于零。那么a l ,a2,.,ar称为矩阵A的奇异值。U和V称为左右奇异阵列。 定理3(相对可控性判据):线性定常连续系统,矩阵A的最小奇异值与最大奇异值的比值为系统的相对可控度,记作。如果的值越大,说明系统的相对可控度越高,对该系统就越容易控制。相反,越小,系统越不容易被控制。3.2.3 二级倒立摆系统定性分析对二级倒立摆进行
34、分析,使用MATLAB中的dg()命令得系统开环特征为 (10.0438 5.0262 -10.0438 -5.0262 0 0)因为系统有两个根在S平面的右半平面上,所以系统是不稳定的。 根据3.2.1中的定理1和定理2,通过MATLAB中的rank()命令可以分别求得rank(S)=6和rank(V)=6。所以,系统完全可控并且完全可观测。可以对系统进行控制器的设计,使系统稳定。根据二级倒立摆状态方程(3-11),利用MATLAB中的命令U,S,V=svd(A),对A矩阵进行奇异值分解,得到A矩阵的奇异值阵S。二级倒立摆的相对可控度: =1/102.7083 = 0.0097。第四章 模糊
35、控制理论 模糊控制理论是美国加利福尼亚U.C.Berkkley学校的自动控制理论专家L.A.Zadeh教授最先提出来的。1965年他在Information&control杂志上发表了模糊集“Fuzzy set”一文,首次提出了模糊集合的概念。用模糊集合来描述模糊事物的概念,很快被科技工作者所接受。40多年来,模糊数学及其应用发展十分迅速。1974年,英国的Mamdani首先把模糊理论应用于工业控制,取得了良好的控制效果。从此,模糊控制理论及其模糊控制系统的应用发展很快,在控制领域展现出广阔的前景。 模糊控制具有如下主要特点: (1)在设计系统时不需要建立被控对象的数学模型,只要求掌握现场操作
36、人员或者有关专家的经验、知识或者操作数据。 (2)模糊控制的计算方法虽然是运用模糊集理论进行的模糊算法,但最后得到的控制规律是确定性的、定量的条件语句。(3)与传统控制方法相比,模糊控制更接近于人的思维方法和推理习惯。因此,更便于现场操作人员的理解和使用,从而得到更为有效的控制规律。(4)模糊控制系统的鲁棒性强,尤其适用于非线性、时变、滞后系统的控制。在生产实践中,存在着大量的模糊现象,对于那些无法获得数学模型或模型复杂的、非线性的、时变的或者祸合严重的系统,无论用经典控制,还是用现代控制理论的算法都很难实现控制。但是,一个熟练的操作工人或技术人员,凭借自己的经验,靠眼、耳等“传感器”的观察,
37、经过大脑的思维判断给出控制量,可以用手动操作,达到了较好的控制效果。例如,对于一个炉温控制系统,人的控制规则是,若温度高于某一设定值,操作者就减小控制量,使之降温,并且温度越高,控制量就减得越多:反之,若温度低于该设定值,则加大控制量,使之升温,并且温度越低,控制量就增加得越多。该例中包含了大量得模糊概念,如“高于”、“低于”、“越高”、“越低”、“越多”等等。因此,操作者得观察和思维判断过程,实际上就是一个模糊化或模糊计算的过程。把人的操作经验归纳成一系列的规则,存放于计算机中,利用模糊集理论将它量化,使控制器模仿人的操作策略,这就是模糊控制器,而用模糊控制器组成的系统就是模糊控制系统。4.
38、1模糊控制器的基本原理模糊控制器的结构如图4.1所示。控制器由4个基本部分组成,即模糊化接口、知识库、推理机、解模糊接口。图4.1 模糊控制器结构图1)模糊化将输入变量的实际论域变换到相应的模糊论域,将输入数据转换成合适的语言值,f PB,PM,PS,ZO,NS,NM,NB表示“正大”,“正中”,“正小”,“零”,“负小”,“负中”,“负大”。2)知识库知识库包含应用领域的知识和控制目标,它由数据和模糊语言控制规则组成如: IF E is A, AND EC is B, THEN U is C,其中,E, EC是控制对象状态变量的误差量,U是对控制对象的控制变量。3)推理机推理是从一些模糊前提
39、条件推导出某一结论。目前模糊推理方法有很多种,其中最常用的是Mamdani的max-min的合成法,具体如下。当把知识库中的Ai、Bi、Ci的空间分作X、Y 、Z论域时,可以得到每条控制规则的关系: (4-1)Ri的隶属度函数为 (4-2)全部控制规则所对应的模糊关系,用取并的方法得到,即 (4-3) R的隶属函数为 (4-4)当输入变量E, EC分别取模糊集A, B时,控制器的输出(控制量)U可根据模糊推理合成得到: (4-5)U的隶属函数为 (4-6) 4)解模糊解模糊的方法有重心法、最大隶属度法、中位数方法等,其中较常用的是重心法,也即控制量可由输出Ui的隶属度函数加权平均得到,计算公式
40、为 (4-7)4.2模糊控制器设计步骤模糊控制器一般是靠软件编程实现的,实现模糊控制一般设计步骤如下: (1)确定模糊控制器的输入变量和输出变量(即控制量); (2)设计模糊控制器的控制规则; (3)进行模糊化和解模糊化; (4)选择模糊控制器的输入变量及输出变量的论域,并确定模糊控制器的参数(如量化因子、比例因子);(5)编制模糊控制算法的应用程序;第五章 神经网络基础理论5.1 神经网络BP控制算法人工神经网络(ANN)是由大量简单单元以及这些单元的分层组织大规模并行联结而成的一种网络,它力图像一般生物神经系统一样处理事物,实现人脑的某些功能。人工神经网络可以忽略过程或系统的具体物理参数,
41、根据系统的运行或实验数据,建立输入和输出状态之间的非线性映射关系。半个多世纪以来,它在非线性系统、优化组合、模式识别等领域得到了广泛应用。自从80年代以来,神经网络的研究出现了突破性的进展。神经网络作为揭开人脑生理机制的一个重要的手段越来越引起各行各业科学家的浓厚兴趣。神经网络的发展简史如下:时 间 贡献者 ANN 模 型1943 McCuiioch M-P 模型1957 Rosenblatt 感知器(Percentron)1962 Widrow 自适应线性元件(Adaline)1969 Minsky Perceptrons1972 Fukushima 认知机模型1974-1985 Rumel
42、hart 等反传模型,B-P 算法1978 Grossberg 自适应共振理论(ART)1980 Kohonen 自组织映射1982 Hopfield 反馈网络1985 Hinton 等 玻尔兹曼机1986 Hecht-Nielsen 对传模型1988 Chua-Yang 细胞网络模型5.1.1 神经网络特点(1)具有自适应能力它主要是根据所提供的数据,通过学习和训练,找出输入和输出间的内在联系,从而求得问题的解答,而不是依靠对问题的先验知识和规则,因而它具有很好的适应性。(2)具有泛化能力泛化即用较少的样本进行训练,使网络能在给定的区域内达到要求的精度;或者说是用较少的样本进行训练,使网络对
43、未经训练的数据也能给出合适的输出。同样它能够处理那些有噪声或不完全的数据,从而显示了很好的容错能力。对于许多实际问题来说,泛化能力是非常有用的,因为现实世界所获得的数据常常受到噪声的污染或残缺不全。(3)非线性映射能力现实的问题是非常复杂的,各个因数之间互相影响,呈现出复杂的非线性关系。神经元网络为处理这些问题提供了有用的工具。(4)高度并行处理神经网络处理是高度并行的,因此用硬件实现的神经网络的处理速度可远远高于通常计算机的处理速度。与常规的计算机程序相比较,神经网络主要基于所测量的数据对系统进行建模、估计和逼近,它可以应用于如分类、预测及模式识别等众多方面。如函数映射是功能建模的一个典型例
44、子。和传统的计算机网络相比,神经网络主要用于那些几乎没有规则,数据不完全或多约束优化问题。例如用神经网络来控制一个工业过程便是这样一个例子。对于这种情况很难定义规则,历史数据很多且充满噪声,准确地计算是毫无必要的。某些情况下神经网络会存在严重的缺点。当所给数据不充分或存在不可学习的映射关系时,神经网络可能找不到满意的解。其次有时很难估计神经网络给出的结果。数据网络中的连接权系数是千万次训练后的结果,对它们的意义很难给出明确的解释。它们对于输出结果的影响也是非常复杂的。神经网络的训练很慢,而且有时需要付出严重的代价。这一方面是由于需要收集、分析和处理大量的训练数据,同时还需要相当的经验来选择合适的参数。 神经网络在实际应用时执行时间也是需要加以检验的。执行时间取决于连接权的个数,它大体和节点数的平方成正比。因此网络节点的少许增加可能引起执行时间的很大增长。人工神经网络BP算法网络模型由几层组成,各个层次之间的神经元相互连接,同一层内的各个神经元互不连接。5.1.2 BP算法BP 算法特征可以描述如下:(1)工作信号正向传播:输入信号从输入层经隐含层,传向输出层,