1、基于最小二乘法的数据处理问题研究综述摘要:对基于最小二乘法的数据处理方法进行了介绍。首先对传统最小二乘法基本原理进行了介绍,然后根据例子来说明怎样运用传统最小二乘法来解决实际辨识问题。而且本文针对传统最小二乘存在的缺陷进一步阐述了一些改进型最小二乘法,综述了最小二乘法的研究现状,最后对最小二乘的发展趋势做了预测。关键字:最小二乘法 数据处理 改进型最小二乘法 发展趋势1引言在科学实验中经常要把离散的测量数据转化为直观的便于研究的曲线方程,即曲线拟合1.由于在实验室或实际应用中,误差是不可避免的,所以为了不把原有离散数据中的误差引入,人们经常用拟合来确定模拟函数。拟合方法不要求模拟函数通过已知离
2、散的点,而追求的是所有点到模拟函数达到某种误差指标的最小化,是一种整体上的逼近性质.最小二乘法是解决这类曲线拟合中一种较为常用的方法,根据最小二乘法的定义2:“最小二乘法是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配.”最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识,因此最小二乘在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用。本文在阐述最小二乘法理论的基础上对于其在实际问题中的辨识应用做了简单介绍,并指出实际应用中存在的不足,列举了几种改进型的最小二乘算法来进行优化比较,最后给出了最小二乘法的发展趋势。2 最小二乘法的理论基础及应用2。1最小二
3、乘法的理论基础最小二乘法作为一种传统的参数估计方法,早已经被大家所了解. 然而大多同学对最小二乘法的认识都比较模糊,仅仅把最小二乘法理解为简单的线性参数估计。 事实上,最小二乘法在参数估计、系统辨识以及预测、预报等众多领域都有着广泛的应用3。特别是针对动态系统辨识的方法有很多4,但其中应用最广泛,辨识效果良好的就是最小二乘辨识方法,研究最小二乘法的应用在就要对其基本原理有较为深刻的理解.下面是一般的最小二乘法问题:求实系数线性方程组(1)方程组可能无解。即很可能不存在一组实数x1,x2,,xn使(2)恒成立.因此我们转而求其次,设法找到实数组 x1,x2,,xn使误差的平方和最小,这样的 x1
4、,x2,,xn称为方程组的最小二乘解,这样问题就叫最小二乘法问题5.2。2 最小二乘法的应用举例理论只有被利用才能体现其价值意义,下面我就以系统辨识中的最小二乘法的例子为大家讲讲怎样在实际中应用最小二乘法解决辨识问题.考虑如下图1中的线性系统:(3)其中,u(k)为系统激励信号,y(k)为系统输出,e(k)为模型噪声.其系统模型如图1所示:图1 SISO的系统模型结构图其中G(z-1)是系统函数模型,N(z1)为有色噪声系统模型,e(k)为白噪声v(k)经过系统函数为N(z1)的系统后的输出6.通常(4)式中:(5)(6)则系统可表示为:(7)设样本和参数集为:(8)h(k)为可观测的量,差分
5、方程可写为最小二乘形式(9)那么如何在系统噪声e(k)存在的情况下从该方程中正确的解出,即是系统辨识的任务。为了求出,我们面临三大问题:一是输入信号的选择,二是判决准则的选取,三是辨识算法的选择,下面一一探讨.一选择输入为了准确辨识系统参数,我们对输入信号有两大要求,一是信号要能持续的激励系统所有状态,二是信号频带能覆盖系统的频带宽度。除此之外还要求信号有可重复性,不能是不可重复的随机噪声,因此我们通常选择M序列或逆M序列作为输入。二准则函数因为本文主要探讨最小二乘方法,在此选取准则函数(10)使准则函数的估计值记做,称作参数的最小二乘估计值。在式(7)中,令k=1,2,3,L,可构成线性方程
6、组: (11)式中准则函数相应变为: (12)极小化,求得参数的估计值,将使模型更好的预报系统的输出.三最小二乘算法实现辨识设使得,则有 (13)展开上式,并根据以下两个向量微分公式: (14)得正则方程:(15)当为正则阵时,有(16)且有,所以满足式(16)的唯一使得,这种通过极小化式(12)计算的方法称作最小二乘法。而且可以证明,当噪声e(k)是均值为0的高斯白噪声时,可实现无偏估计。3最小二乘法改进型3。1传统最小二乘存在的问题最小二乘法存在一些缺陷制约着最小二乘法的应用,在处理日益复杂的参数估计、系统辨识等问题中,最小二乘法在系统辨识中存在的缺陷逐渐显现出来。如传统的最小二乘法不适合
7、在动态辨识系统中使用,而且其参数估计存在偏差,耗时较长等问题,因此,随着科学技术的发展,涌现出了很多改进型的最小二乘法。3。2递推最小二乘算法为了减少计算量,减少数据在计算机中占用的内存,并实时辨识出系统动态特性,我们常利用最小二乘法的递推形式7.下面我们来推导递推最小二乘算法的原理。首先,将式(12)的最小二乘一次完成算法写为 (17)定义 (18)式中 (19)式中,h(i)是一个列向量,也就是HL的第i行的倒置,P(k)是一个方阵,它的维数取决于未知参数的个数,假设未知参数的个数是n,则P(k)的维数是nn.由式18可得P(k)的递推关系为: (20)设 (21)则 (22)由此可得:
8、(23)由式20和21可得 (24)引进增益矩阵K(k),定义 (25)式24可以进一步写为 (26)接下来可以进一步把式21写为 (27)利用矩阵反演公式将式(27)演变成 (28)将上式代入式25,整理后可得 (29)综合式26、28和29可得最小二乘递推参数估计算法RLS3。3广义最小二乘法广义最小二乘法的处理过程如下8,设SISO系统采用如下模型: (30)其中A(z1),B(z-1)和C(z-1)的定义见式5和6。假定模型阶次na,nb和nc已知,用广义最小二乘法可以得到无偏一致估计。令 (31)及 (32)将模型化为最小二乘格式:(33)由于v(k)是白噪声,所以用最小二乘可以获得
9、参数的无偏估计,由于噪声模型C(z1)未知,还需要用迭代的方法来求得C(z1)。令 (34)置 (35)这样就把噪声模型也转变为最小二乘格式: (36)由于上式中的噪声已为白噪声,所以用最小二乘也可获得参数e的无偏估计,但是数据向量中依然含有不可测的噪声量,可用相应的估计值来代替,置,其中k 0时,e(k)=0;k 0时,按照 (37)计算,式中 (38)综上所述,广义最小二乘法可归纳为4最小二乘法的发展及对策最小二乘法(LS)是一种最经典、最基本的,也是应用最广泛的方法。但是最小二乘估计是非一致的,是有偏差的,所以为了克服他的缺陷,而形成了一些以最小二乘法为基础的改进最小二乘法:广义最小二乘
10、法、增量最小二乘法、渐消记忆的最小二乘法以及将一般的最小二乘法与其他方法相结合的方法,有最小二乘两步法(COR- LS)和随机逼近算法等。广义最小二乘法的基本思想是引入一个白化滤波器,把相关噪声转换为白噪声,基于对观测数据先进行一次滤波处理,然后利用普通最小二乘法对滤波后的数据进行辨识.递推算法的基本思想是用新估计值对老的估计值进行修正,应用的数据是实时采集的系统输入输出数据,应用递推算法对参数估计值进行不断修正,以取得更为准确的参数估计值,而且此方法占据计算机存储量小,因此在辨识系统中得到了广泛的应用。渐消记忆的最小二乘法在对系统模型参数进行辨识时强调新数据的作用,贬低老数据的作用,将遗忘因
11、子引入系统中,在实际应用中遗传因子的大小对参数估计的精度以及参数估计值跟踪真值的变化的能力都有很大的影响,所以选取合适的遗传因子会显著提高系统的辨识能力。5结论针对经典的最小二乘法存在的一些不足,广义最小二乘法、递推式最小二乘法以及渐消记忆的最小二乘法等的出现解决了其中的一些缺陷,这些改进方法不仅在今天,而且在未来都会有非常广泛的应用前景,此外新的改进型最小二乘法也会在其他学科的发展下涌现,使基于最小二乘法的能适应更多的应用场合,得到更加广泛的应用。参考文献1 宁纪献,覃发岗. 最小二乘法的论述与证明J。 教育论坛, 2015,42邹乐强。 最小二乘的基本原理J。 职校论坛, 2010,2:233 宗殿瑞。 最小二乘法应用探讨J。 青岛化工学报, 1998,9.4 丁峰。 系统辨识(1):辨识导引J. 南京信息工程大学学报, 2011,3(1)1-22。5丁克良,沈云中,欧吉坤.整体最小二乘法直线拟合J.辽宁工程技术大学学报,2010,26胡双红.最小二乘类辨识方法的比较J。 长沙理工大学学报,2012,97胡沙。最小二乘参数估计的递推算法及其C语言实现J.焦作大学学报,2009,48仇振安,何汉辉.基于广义最小二乘法的系统模型辨识及应用J。计算机仿真学报,2007,10