1、第五章 最小二乘问题的解法1。最小二乘问题 1)回归方程问题,是个实验点。现要根据这些点确定与个物理量之间的关系式。设这种关系式为,其中是方程中需要待定的个参数(系数)。因此问题是如何通过个实验点,确定方程中的系数。由于实验点的个数大于待定系数的个数,因此方程中系数的确定是一个超静定问题,无法按一般的方法进行求解.此时将实验点到曲面距离最短的那个曲面作为所求曲面,从而求取该曲面方程。即求解,这就是最小二乘问题。2)非线性方程组问题求解非线性方程组可转化为求解如下形式的最小二乘问题。显而易见,最小二乘法的一般形式可写为最小二乘法问题实际上是具有个变量的无约束极小化问题,前面解无约束优化问题的方法
2、均可应用。但是最小二乘问题具有一定的特殊性,即目标函数的表达式是由多个表达式的平方和组成,理应有更、更有效的方法。这正是最小二乘解法要解决的问题。2.线性最小二乘问题的解法最小二乘法的一般形式可写为特别地,当,即为线性函数时,则最小二乘问题可表示为: 1) 线性最小二乘问题解的条件定理1:是线性最小二乘问题极小点的充要条件是满足。证明:(1)必要性令,于是有:由于是一个数,而一个数的转置是它的本身,因此有:故上式可化为:若是的极小点,则必有,则必有:(2)充分性若满足,即考虑任一点,计算由于上式第二项大于等于零,第三项为零,故是极小点.我们称为最小二乘问题的法方程组。由上述定理可知,求解最小二
3、乘问题等价于求解它的法方程组。2)法方程组的解法由于,所以至少是半正定的,因此法方程组有解的条件是正定。定理2:设是矩阵,则正定的充要条件是的秩为.推论1:当的秩为时,则是最小二乘的唯一解。推论2:设是矩阵,则正定的充要条件是的秩为.推论3: 设是矩阵,则正定的充要条件是为非奇异.上述解法方程组的解法需要正定,实际问题并不能保证正定,因此上述方法仅具有理论意义。3)用分解求线性最小二乘解若是正交矩阵,则上式说明以为目标函数的最小二乘解与目标函数为的最小二乘解具有相同的解。因此求解可转化为求解,其中,。由线性代数可知,适当地选择正交矩阵,总可使呈现为如下形式的矩阵:,其中是的秩为的上梯形矩阵;是
4、的零矩阵。定理: 线性最小二乘问题与线性方程组具有相同解.其中是由的前个分量组成的维向量。证明:由于的解与的解相同.现只需证明与具有相同的解。的法方程组为,即的解就是的解。将代入上式有:,上式展开后得:而在的两侧同时左乘即得.若。最小二乘问题的解为。否则最小二乘问题的解不是唯一的,在这种情况下,通常取具有最小范数的解作为最小二乘问题的解.这个解称为最小二乘问题的极小最小二乘解。这个解为,且解是唯一的。显然是的一个解。设是的另一个解。则因为,所以。因此极小最小二乘解是唯一的。3.GaussNewton法GaussNewton法适用于非线性最小二乘问题。Gauss-Newton法是一种迭代算法。假
5、定选定初始点后经过迭代已求得.现考虑的求法。首先把线性化,用线性最小二乘问题的解去逼近非线性最小二乘问题的解.把的第个分量在点处用Taylor展开式展开.,则,其中:记,则如设线性最小二乘问题的解为,那么就是极小点的新的近似解。由前述可知,则.当满足一定的条件,并且充分靠近极小点时,算法是收敛的。假如在某次迭代中变成奇异的,那么上述方法失效,另外,当离极小点较远时,算法可能发散。例:设有非线性方程组(1)列出求解这个方程组的非线性最小二乘问题的数学模型。(2)写出Gauss-Newton法迭代公式的具体形式.数学模型为:迭代公式为:例:已知某物理量与另两个物理量和的依赖关系为,其中,和是待定参
6、数。为确定这三个参数测得和的5组数据:(1)用最小二乘法建立关于确定,和的数学模型。(2) 写出Gauss-Newton法迭代公式的具体形式。数学模型为:迭代公式为:4.修正GaussNewton法先确定一个搜索方向,从出发作直线搜索来求下一个迭代点.当非奇异时,将GaussNewton法解出来的作为搜索方向,否则将负梯度方向作为搜索方向.下面证明GaussNewton法解出来的是目标函数的一个下降方向。因此Gauss-Newton法解出来的是目标函数的一个下降方向。5。阻尼最小二乘法 GaussNewton法收敛速度一般是较快的。它遇到的主要问题是可能为奇异,以至 无法求出。遇到这种情况,修
7、正Gauss-Newton法是用负梯度方向代替,这时Gauss-Newton法变为梯度法,收敛速度减慢。阻尼最小二乘法将从另一个角度来克服上述困难.1)基本想法Gauss-Newton法是用方程来确定的。现在矩阵对角线上的元素都加上同一个数,则上述方程变为:这样做的目的是:即使奇异,只要将取得充分大,总能使正定,从而肯定有解。这个解依赖于,记为。当时,就是GaussNewton方向。当已经增大到与的每个分量相比这些分量都趋于消失,则变为,这就是说,当很大时,将接近负梯度方向。可以想象,当从零增大到无穷大时,将从Gauss-Newton方向连续地转向负梯度方向。由以上的分析,可构成如下的迭代格式:这就是阻尼最小二乘法的迭代公式,称为阻尼因子.最后说明一下阻尼最小二乘法的由来。当时,.当充分大时,即,特别当时,.因此起着使步长缩短或阻尼作用,这就是阻尼最小二乘法的由来.作业:1. 用最速下降法求解,初始点取为。2. 用Newton法求解,初始点任取。3. 用单纯形替换法求解,初始点取为,初始单纯形取为正三角形,边长为1.0。