资源描述
第七章 函数逼近
用简单的函数p(x)近似地代替函数f (x),是计算数学中最基本的概念和方法之一。近似代替又称为逼近,函数f (x)称为被逼近的函数,p (x)称为逼近函数,两者之差
称为逼近的误差或余项
在计算数学里,所谓简单的函数主要是指可以用加、减、乘、除四则运算进行计算的函数,如有理分式函数、多项式等。由于多项式最简单,计算其值只需用到加、减与乘三种运算,且求其微分和积分都很方便,所以常用它来作为逼近函数,而被逼近的函数f (x)一般是一个比较复杂的不易计算的函数或以表格形式给出的函数。
第六章介绍的插值法实际上也是函数逼近的一种方法。不过,它要求函数p (x)与f (x)在节点处具有相同的函数值 (甚至要求有相同的导数值),但在非节点处,p (x) 虽然有可能很好地逼f (x),但也可能使逼近f (x) 的误差很大,如果实际问题要求p (x)在区间[a, b] 上每一点都“很好”地逼近的话,用插值多项式p (x) 去逼近f (x)有时就要失败,所谓龙格现象,就是典型一例。
大家知道,用f (x)的泰勒(Taylor)展开式
的部分和去逼近函数f (x),也是常用的方法。这种方法的特点是:x越接近于x0,误差就越小,x越偏离x0,误差就越大。若要使这种逼近在整个所讨论的区间上都达到精度要求,则需取很多项,这样,计算工作量就大大增加。因此,如何在给定精度下,求出计算量最小的近似式,这就是函数逼近要解决的问题,这个问题的一般提法是:
对于函数类A中给定的函数f (x),要求在另一类较简单的且便于计算的函数类B(Ì A)中寻找一个函数p (x),使p (x)与f (x)之差在某种度量意义下最小。
一般,最常见的函数类A是区间[a, b]上的连续函数,记作C[a, b]。
最常用的函数类B有代数多项式、三角多项式以及有理分式函数等。
最常用的度量标准有两种:
(一) 一致逼近
以函数f (x)和p (x)的最大误差
作为度量误差f (x) - p (x)的“大小”的标准,在这种意义下的函数逼近称为一致逼近或均匀逼近,讲得更具体一点,也即对于任意给定的一个小正数e >0,如果存在函数p (x),使不等式
成立,则称该函数p (x)在区间[a, b]上一致逼近或均匀逼近于函数f (x)。
(二)平方逼近:
如果我们采用
作为度量误差的“大小”的标准,在这种意义下的函数逼近称为平方逼近或均方逼近。这种方法要比一致逼近的相应问题简单得多。
本章主要介绍在这两种度量标准下用代数多项式p (x)去逼近区间[a, b]上的连续函数,也就是介绍函数的最佳一致逼近多项式和最佳平方逼近多项式。
由于正交多项式是函数逼近的重要工具,因此,下面先介绍几种常见的正交多项式。
7.1 正交多项式
一、正交函数系的概念
高等数学中介绍傅立叶(Fourier)级数时,证明过函数系;
1, cosx,sinx,cos2x,sin2x,…,connx,sinnx,… (7.1)
中任何两个函数的乘积在区间[-p ,p ]上的积分都等于0。我们称这个函数中任何两个函数在[-p ,p ]上是正交的,并且称这个函数为一个正交函数系。若对(7.1)中的每一个函数再分别乘以适当的数,使之成为:
(7.2)
那么这个函数系在[-p ,p ]上不仅保持正交的性质,而且还地标准化的(规范的),亦即每一个函数自乘之积,在[-p ,p ]上的积分是1。
为了使讨论更具有一般性,先要介绍一些基本概念。
1.权函数的概念
定义7.1 设r (x)定义在有限或无限区间[a, b]上,如果具有下列性质:
(1) r (x) ≥0,对任意x Î[a, b],
(2) 积分存在,(n = 0, 1, 2, …),
(3) 对非负的连续函数g (x) 若。
则在(a, b)上g (x) º 0,我们就称r (x)为[a, b]上的权函数。
在正交多项式的讨论中,会遇到各种有意义的权函数,常用的权函数有:
;
等等。
2.内积的概念
定义7.2 设f (x),g (x) Î C [a, b],r (x)是[a, b]上的权函数,则称
为f (x)与g (x)在[a, b]上以r (x)为权函数的内积。
内积有如下性质:
(1) (f, f )≥0,且(f, f )=0 Û f = 0;
(2) (f, g) = (g, f );
(3) (f1 + f2, g ) = (f1, g) + (f2, g);
(4) 对任意实数k,(kf, g) = k (f, g )。
这些性质,由内积的定义不难得到证明。
3.正交性的概念
定义7.3 设f (x),g(x) ÎC [a, b]若
则称f (x)与g (x)在[a, b]上带权r (x)正交。
定义7.4 设在[a, b]上给定函数系,若满足条件
则称函数系{jk (x)}是[a, b]上带权r (x)的正交函数系,特别地,当Ak º 1时,则称该函数系为标准正交函数系。若定义7.4中的函数系为多项式函数系,则称为以r (x)为权的在[a, b]上的正交多项式系。并称pn(x)是[a, b]上带权r (x)的n次正交多项式。
例1 验证多项式: 在上带权r (x) = 1两两正交。
解 容易验证
而
由定义7.4,结论成立。
有了以上的基本概念,下面我们介绍几个常用的正交多项式。
二、常用的正交多项式
1.切比雪夫(чебыщев)多项式
切比雪夫多项式具有很多重要性质,是函数逼近的重要工具,并且有广泛的应用。
定义7.5 称多项式
(7.3)
为n次的切比雪夫多项式(第一类)。
切比雪夫多项式Tn (x)具有以下性质:
(1) 正交性:
由{ Tn (x)}所组成的序列{ Tn (x)}是在区间[-1, 1]上带权
的正交多项式序列。
且
(7.4)
证 因为,
令 , 则,
于是
(2) 递推关系
相邻的三个切比雪夫多项式具有三项递推关系式:
(7.5)
证 显然,n = 0时,时,
当n≥1时,令x = cosq ,则
由三角恒等式
即得
移项就得上述递推关系(7.5)。
由三项递推关系式可依次写出如下常用的前面几个切比雪夫多项式的表达式:
可见Tn (x)也是普通的n次多项式。
(3) 奇偶性:
切比雪夫多项式Tn (x),当n为奇数时为奇函数;n为偶数时为偶函数。这是因为
(4) Tn (x)在区间[-1, 1]上有n个不同的零点
。
证 由于
令
有
所以在区间0≤q ≤p 上有n个值
使
即在[0,p]中有n个不同的零点,且由于Tn (x)是n次多项式,所以至多有n个零点,现已找到n个不同的零点,则每一个xk都是Tn (x)的单重零点。
显然,Tn (x)在[-1, 1]中的零点都是实的、互异的,且全部在[-1, 1]内。
(5) Tn (x) 在[-1, 1]上有n + 1个不同的极值点
使Tn (x)轮流取得最大值1和最小值-1。
证 因为在区间0≤q ≤p 上有n + 1个点
使cosnq 顺次取+1及-1,因此,n + 1个点
使Tn (x)顺次为+1及-1,即
由于cosnq 之最大值是+1,最小值是-1,因此,我们把这n + 1个点叫做Tn (x)在[-1, +1]上的极值点,也称它为Tn (x)的交错点组。这是切比雪夫多项式的一个重要性质。
如果将Tn (x)的零点xk和极值点按大小排列,则有
(6)切比雪夫多项式的极值性质
显然,由三项递推关系式容易验证Tn (x)的最高次项系数为2n-1 (n = 1, 2, …)。
譬如 T1(x) = x, 最高次项系数为21-1,
T2(x) = 2x2 –1,最高次项系数为22-1。
由三项递推关系可看到,每升高一次幂要乘2,则
是一个首项系数为1的n次多项式,又由性质(5)知在点
顺次达到它在[-1, 1]上的极值
即
若用Hn (x)表示首项系数为1的n次多项式的全体,则有
定理7.1 在-1≤x ≤1上,在首项系数为1的一切n次多项式Hn (x)中
与零的偏差最小,且其偏差为
即,对于任何,有
证明 (用反证法)
假若存在首项系数为1的另一n次多项式
它对零的偏差比与零的偏差还小,即
令
由于,p (x)均属于Hn (x),则q (x)是一个次数不超过n – 1的多项式。
在Tn (x)的交错点组
处,由于
即
在处轮流取到
因而
则有
………………
即,q (x)在n + 1个交错点处轮流取正负值,由连续函数的性质知,q (x)应当具有n个零点,但已知q (x)至多是n – 1次多项式,因而q (x) º 0,所以,。这个结果与假设矛盾,从而定理得证。
从这个定理知,所有首项系数为1的n次多项式在区间[-1, 1]上的最大值满足
定理7.1 称为切比雪夫多项式的极性,这种极性也是切比雪夫多项式的一种重要性质。
作为应用,介绍一下多项式插值余项的极小化。
设在[-1, 1]上给定n + 1个互异的节点x0, x1, …, xn,函数f (x)在[-1, 1]上具有n + 1阶连续导数f (n+1) (x),对f (x)作多项式插值时,由拉格朗日插值的余项表示式
其中,若得到
,
则有
显然,余项的大小,取决于因子的大小。
现在我们提出一个问题:怎样选取节点xj ( j = 0, 1, 2, …, n)
能使 尽可能小?
由于是一个最高次项系数为1的n + 1次多项式,由Tn(x)的极性讨论知,当xj满足
时,
取得极小,亦即只要插值节点xk取成n + 1次比雪夫多项式的零点
则插值公式的余项在全区间[-1, 1]上的最大绝对值为极小,此时,有余项公式:
注意:如果插值区间是[a, b],而不是[-1, 1],总可以作变换
把函数变换成
其中 -1≤t ≤1,即可将定义在区间[a,b]上的函数f (x)化为新变量t的定义在区间[-1, 1]上的函数g (t)。
以上讨论在数值积分中将要用到。
2.勒让德(Legendre)多项式
定义7.6 多项式
(7.6)
称为n次勒让德多项式。
显然 p0 (x) = 1
pn (x)的最高次幂xn项的系数是
勒让德多项式具有以下一些重要性质:
(1) 正交性
勒让德多项式序列{pn(x)}是在[-1, 1]上带权r (x) = 1的正交多项式序列。
即 (7.7)
(2) 递推关系
相邻的三个勒让德多项式具有三项递推关系式:
(7.8)
由此可得
,
(3) 奇偶性:
当n为偶数时,pn (x)为偶函数;当n为奇数时,pn (x)为奇函数。即
这是由于pn (x)的表达式中的(x2 - 1)n是偶次多项式,经过偶次求导仍为偶次多项式,经过奇次求导则为奇次多项式,故n为偶数时,pn (x)为偶函数;n为奇数时,pn (x)为奇函数。
(4) pn (x)的n个零点都是实的、相异的,且全部在区间[-1, 1]内部。
3.其它常用的正交多项式
一般而言,如果给定的区间[a, b]不同且权函数不同,正交多项式也就不同,我们再介绍几个常用的正交多项式。
(1) 第二类切比雪夫多项式
定义7.7 称
(7.9)
为第二类切比雪夫多项式。
可以证明
①{un(x)}是在区间[-1, 1]上带权函数的正交多项式序列。即
(7.10)
② 相邻的三项具有递推关系式:
(7.11)
(2)拉盖尔(Laguerre)多项式
定义7.8 称多项式
(7.12)
为拉盖尔多项式。
可证
① {Ln(x)}是在区间[0, +∞]上带权r (x) = e-x的正交多项式序列。即
(7.13)
② 相邻的三项具有递推关系式:
(7.14)
(3)埃尔米特(Hermite)多项式
定义7.9 称多项式
(7.15)
为埃尔米特多项式。
可以证明
① {Hn(x)}是在区间(-¥, +¥)上带权函数的正交多项式序列。即
(7.16)
② 相邻的三项具有递推关系式:
(7.17)
7.2 最佳一致逼近
一、最佳一致逼近的概念
定义7.10 设函数f (x)是区间[a, b]上的连续函数,对于任意给定的e >0,如果存在多项式p (x),使不等式
成立,则称多项式p (x)在区间[a, b]上一致逼近(或均匀逼近)于函数f (x)。
那么,对于在区间[a, b]上的连续函数f (x),是否存在多项式p(x)一致逼近于f (x)呢?这个问题有许多人研究过。德国数学家维尔斯特拉斯(Weierstrass)在1885年曾给出下述著名定理。
维尔斯特拉斯定理 若f (x)是区间[a, b]上的连续函数,则对于任意e >0,总存在多项式p (x),使对一切a ≤x ≤b有
证明从略。
维尔斯特拉斯定理表明,连续函数f (x)可以用多项式p (x)逼近到任意精确程度,但维尔斯特拉斯定理只在理论上肯定了闭区间上的连续函数可以用多项式以任意精确度来逼近,并没有给出确定逼近得最快的多项式的方法。事实上,如果精确度要求较高,则用来逼近的多项式的次数一般也很高,这就增加了计算工作量。因而,在实际计算时,我们总量希望在一定的精确度要求下,逼近多项式的次数越低越好。
切比雪夫从这样的观点去研究一致逼近问题,他不让逼近多项式的次数n趋于无穷大,而是先把n加以固定。对于给定的[a, b]上的连续函数f (x),他提出在次数不超过n的多项式的集合pn中去寻找一个多项式,使它在[a, b]上“最佳地逼近”f (x)。这里最佳逼近的意思是指对f (x)的偏差。
和其它任一p(x) Î pn 对f (x)的偏差
比较时是最小的,也就是说
(7.18)
这就是通常所谓的最佳一致逼近问题,也称为切比雪夫逼近问题。若这样的存在,则称是函数f (x)在区间[a, b]上的n次最佳一致逼近多项式,简称为最佳逼近多项式。
现在要问:最佳逼近多项式是否存在?是否唯一?如何构造?
我们不妨设n次多项式
显然
应与p (x)的系数a0, a1, …,an有关。
若记
则j 应是n + 1个系数a0, a1, …,an的正值连续函数。
我们称多元函数j (a0, a1, …,an)的最小值
(7.19)
为f (x)与p (x)在[a, b]上最小偏差。
对照公式(7.18)可知,寻求f (x)在[a, b]上的n次最佳一致逼近多项式的问题就归结为求多元函数j (a0, a1, …,an)的最小值问题。
可以证明,存在唯一的能使
j 成立,
也即存在唯一的
满足关系式
这就说明,对于[a, b]上的任意连续函数f (x),其n次最佳逼近多项式是存在且唯一的,(因证明较繁,这里我们不予讨论)。下面我们主要介绍的构造。
二、最佳一致逼近多项式的求法
定理7.2 是[a, b]上连续函数f (x)的n次最佳一致逼近多项式的充分必要条件是在区间[a, b]上至少有n + 2个点
使得
其中m 是f (x)与在[a, b]上的偏差,即
(7.20)
s 为“1”或“-1”。
因证明较复杂,这里从略。
点集{x1, x2, …,xn+2}称为切比雪夫交错点组。其中每一个xk (k = 1, 2, …,n+2)称为交错点。
定理7.2表明,若用最佳一致逼近多项式 来近似代替f(x),则误差在[a, b]上的分布是十分均匀的。
定理7.2 常称为切比雪夫定理,由此定理还可推得下面两个有用的推论。
推论1 设则f (x)在pn中的最佳一致逼近多项式,就是f (x)在[a, b]上的某个n次拉格朗日插值多项式。
证明 设是f (x)在[a, b]上的n次最佳一致逼近多项式,根据切比雪夫定理可知,连续函数在区间[a, b]上至少有n + 2个点使其交替变号,这就是说,方程=0在[a, b]上至少有n + 1个根,即存在n + 1个点 (k = 0, 1, 2, …, n ),使
,(k = 0, 1, 2, …, n )
所以,实际上就是以为插值节点的f (x)的n次拉格朗日插多项式。
推论1表明:如果能适当选择插值节点,求出使偏差为最小的n次拉格朗日插值多项式,那么就能求得f (x)的n次最佳一致逼近多项式。
推论2 如果函数f (x)在区间[a, b]上有n + 1阶导数,且f (n+1)(x)在[a, b]上恒为正(或负),那么区间[a, b]的端点a和b都属于的交错点组。
证明(反证法)
设a (或b)不属于的交错点组,那么函数
R (x) =
在开区间(a, b)内至少有n +1个点,使其取得最大值和最小值,则由取得极值的必要条件,必有
,(k = 1, 2, …, n+1 )
反复用罗尔定理可知,在(a, b)由至少存在一点x ,使
但是 ,
从而有
这与在[a, b]上恒为正(或负)的已知条件矛盾。
切比雪夫定理不仅给出了最佳一致逼近多项式的特性,并从理论上给出了寻找最佳一致逼近多项式的方法。
但通常,在讨论连续函数的多项式逼近中,要为某一连续函数求取最佳一致逼近多项式往往是十分困难的。
下面我们仅介绍比较简单的线性最佳一致逼近多项式的求法以及切比雪夫多项在求最佳一致逼近时的应用。
1.线性最佳一致逼近多项式的求法
设函数f (x)在[a, b]上有二阶导数,且在[a, b]上不变号(即恒为正或负),则可按下面方法求f (x)在[a, b]上的线性最佳一致逼近多项式。
设,则根据切比雪夫定理,在[a, b]上至少存在三个点:,使
(7.21)
其中s = ±1,k = 1, 2, 3。
由于在[a, b]上不变号,根据推论2可知,区间[a, b]的两个端点a, b都属于的交错点组,即有
则另一交错点x2必位于[a, b]的内部,且它是的极值点,所以
,而
从而(即等于在点x2处的斜率)。又因为在[a, b]上不变号,所以一阶导数在[a, b]上严格单调,因此它只能取一次,这就证明了在[a, b]内除了点x2外不能再有其它极值点,也即在(a, b)内有,且只有一个极值点,它就是交错点x2。于是由(7.21)式得:
解此方程组得
把代入的表示式,即求得f (x)在[a, b]上线性最佳一致逼近多项式为
(7.24)
线性最佳一致逼近的几何意义是:直线与弦AB平行且过线段AC的中点D,其方程为
见图7-1,其中
图7-1
例7.2 求函数在上的线性最佳一致逼近多项式。
解 显然在上不变号,故,x3 = 1,由(7.22)式得
由 及(7.22)式得
,
所以
再由(7.23)式得
故函数
这就是函数在区间[1/4, 1]上的线性最佳一致逼近多项式。
2.切比雪夫多项式在函数逼近中的应用
在§1中我们已经讨论了切比雪夫多项式的极值性质,也即在区间[-1, 1]上,所有最高次项系数为1的一切n次多项式中,n次切比雪夫多项项Tn (x)与1/2n-1的乘积与零的偏差最小,且其偏差为1/2(n-1)。
利用这个极值性质,切比雪夫多面式就成为[-1, 1]上逼近其它函数f (x)的重要工具。
下面分两种情况讨论
(1) 若f (x)是n次多项式,则它的n – 1次最佳一致逼近多项式能精确求出。
例7.3 已知,求其在[-1, 1]上的二次最佳一致逼近多项式。
解 令
它是首项系数为1的3次多项式,要它在[-1, 1]上的最大值最小,由切比雪夫多项式的极值性质知,在[-1, 1]上,p3中与零偏差最小的首项系数为1的三次多项式是,所以
令
其中
则
就是f (x)在[-1, 1]上的二次最佳一致逼近多项式。
(2) 若f (x)不是多项式,也可利用切比雪夫多项式的极值性质,求出f (x)的近似最佳一致逼近多项式。常用的有“切比雪夫插值法”和“缩减幂级数法”两种近似方法。我们将简单地介绍用切比雪夫多项式来降低逼近多项式的次数。
我们常要在一定区间上求一个函数在一定误差范围内的逼近多项式,自然,我们希望此逼近多项式的次数越低越好。
由于{xk}也可用切比雪夫多项式{Tn(x)}表示,即
若把普通n次多项式中的所有用上述切比雪夫多项式去代替,则pn(x)可改写为
在满足误差要求的情况下,可利用切比雪夫多项式的极值性质,把pn(x)的高次幂的项缩减下来,使它成为m (m≤n - 1)次多项式,这个m次多项式可以作为在已给精度下的f (x)在[-1, 1]上的近似的最佳一致逼近多项式。
下面通过简单的例子来说明这种方法。
例7.4 设在区间[-1, 1]上,要计算f (x) = ex,欲找一个近似多项式p (x)近似代替ex,使误差e < 0.01。
解 先对f (x) = ex在x = 0处作泰勒展开,有
若取前六项之和
作为ex的近似,这时截断误差R5(x)满足
即误差确实满足所提要求,但注意p5(x)是一个5次多项式。若利用{xk}和{Tk (x)}的关系式,p5(x)也可表示为
这里,我们看到Tk的足标k越小,Tk的系数就越小,由于在上,(k = 0, 1, 2, …),故可以略去次数Tk (x)项,而这就意味着逼近多项式的次数降低,这正是我们希望达到的。此题中,若略去其最后的两项,则所增添的误差为
从而在上,若用
近似代替ex的总误差不超过
0.0038 + 0.0058 = 0.0096 < 0.01
亦即用y(x)代替ex 也满足所提要求。
再利用{Tk (x)}和{xk}之间的关系,把y (x)重写为通常的x的乘幂形式,则
这个y (x)是一个3次多项式,比原来的p5 (x)降低2次,从而用y (x)求值的计算工作量比用 p5(x)少。这个方法为缩减幂级数法。
上述方法既使逼近多项式的次数降低了,而且还可以使误差的分布更为均匀,因此可以作为f (x)的近似最佳一致逼近多项式。
对于任一有限区间[a, b]上的逼近问题,可以通过变量替换
把[a, b]区间转化为[-1, 1]上的逼近问题类似讨论。
7.3 最佳平方逼近
一般而言,在[a, b]上对给定的函数求它的一致逼近函数比较困难,下面我们介绍在[a, b]上较易计算的另一种逼近方法――最佳平方逼近。
一、预备知识
1.函数系的线性关系
定义7.11 若函数,在区间[a, b]上连续,如果关系式
当且仅当时才成立,则称函数在[a, b]上是线性无关的,否则称线性相关。
如果函数系{jk (x)}(k = 0, 1, 2, …)中的任何有限个函数线性无关,则称函数系{jk (x)}为线性无关函数系,例如{1, x, …, xn, …}就是在区间[a, b]上的线性无关函数系。
设是[a, b]上线性无关的连续函数a0, a1, …, an是任意实数,则
的全体是C[a, b]的一个子集,记为
并称是生成集合的一个基底。
例如 Pn = Span {1, x, x2, …, xn}表示由基底1, x, …, xn, 生成的多项式集合。
下面给出判断函数系{jk (x)}(k = 0, 1, 2, …n)线性无关的一个充要条件。
定理7.3 连续函数在[a, b]上线性无关的充分必要条件是它们的克莱姆(Gram)行列式Gn ¹ 0,其中
(7.25)
证明 设a0, a1, …, an是一组实数,使
现分别用乘上式,然后在[a, b]上积分,于是得方程组
显然,上述齐次线性代数方程组只有零解的充要条件是它的系数行列式
。证毕。
根据本定理即可断定:在区间[a, b]上带权r (x)的正交函数系是线性无关的函数系。
2.广义多项式
我们已知,n次代数多项式是函数1, x, x2, …, xn的线性组合。现在我们推广多项式的概念。
设函数系{,…}线性无关,则其有限项的线性组合
(7.26)
称为广义多项式。例如三角多项式
就是一个广义多项式。
二、函数的最佳平方逼近
我们已知,用平方误差取得最小,作为度量标准研究函数的逼近函数p (x),就是最佳平方逼近问题。
若设
表示任意一个不高于n次的多项式函数,Pn = Span {1, x, …, xn},则最佳平方逼近多项式的定义可叙述为:
定义7.12 对于给定的函数,若n次多项式
满足关系式
(7.27)
则称S*(x)为f (x)在区间[a, b]上的n次最佳平方逼近多项式。
实用上,为用使问题的讨论更有一般性,我们可以把定义进行更一般的推广,若把xj推广为一般的连续函数jj(x),且要求j0, j1, …, jn线性无关,并且积分可带权函数,则定义7.12可改为
定义7.13 对于给定的函数
如果存在
使
(7.28)
则称S*(x)是f (x)在集合F中的最佳平方逼近函数。
显然定义7.12是定义(7.13)中取r (x) = 1, ji (x) = xj 的特殊情况,作这样的推广,使我们可以考虑更一般的,象
之类在实际问题中有用的带权函数的平方逼近问题。
在时,满足条件(7.28)的S* (x),就是函数f (x)的n次最佳平方逼近多项式。
显然,求最佳平方逼近函数的问题可归结为求它的系数,使多元函数
取得极小值,也即点()是I (a0, …,an)的极点。由于I (a0, a1, …,an)是关于a0, a1, …,an的二次函数,利用多元函数取得极值的必要条件,
(k = 0, 1, 2, …, n)
即
(7.29)
得方程组
(7.30)
如采用函数内积记号
那么,方程组可以简写为
这是一个包含n + 1个未知元a0, a1, …, an的n + 1阶线性代数方程组,写成矩阵形式为
(7.31)
此方程组叫做求aj (j = 0, 1, 2, …, n)的法方程组。
显然,其系数行列式就是克莱姆行列式Gn = Gn (j0, j1, …, jn)。由于j0, j1, …, jn线性无关,故Gn ¹ 0,于是上述方程组存在唯一解。从而肯定了函数f (x)在F中如果存在最佳平方逼近函数,则必是
例7.5 。求(不超过二次的多项式全体),使
最小。
解:设,即取
方程组(7.31)成为
其中
,
,
,
,
,
,
于是得
解得
所以
偏差
由于在实际问题中方程组(7.31)的系数矩阵常是病态的或高度病态的,为了得到有效的结果,我们将选为带权的正交系,则由(7.30)得
所以
(7.32)
注意到由(7.12)算出的ak就是f (x)的广义傅里叶级数的系数,而得到的逼近函数就是广义傅里叶级数的部分和。这样,不仅计算ak容易,而且不受n的影响。因为要确定方程组必须先确定n。n变了,方程组也随之改变。现在,只需把a0, a1, …, an算好,那么,对任意的n,
就是我们要找的多项式(级数的部分和)。
我们仍以f (x) = x4为例。利用傅里叶一切比雪夫级数的部分和来求x4在H2中的最佳平方逼近多项式。已知
于是
所以
于是所求多项式为
即
7.4曲线拟合的最小二乘法
在科学实验和工程设计中,往往需要利用一些离散点上的信息(或称为实验数据)
(xi,yi)去寻找、确定x与y之间函数关系的某种近似表达式。从几何角度来看,就是利用给定的m个数据点(xi, yi)= (1, 2, …, m),求曲线y = f (x)的一条近似曲线y = j (x)。因此,这是一个线曲拟合问题。
插值法在一定程度上可以解决曲线拟合问题,即对给定的函数表
x
x1
x2
…
xm
y = f (x)
y1
y2
…
ym
求得一个m – 1次代数多项式P(x),使之满足插值条件
P(xi) = yi (i = 1, 2, …, m )
但由插值得到的P(x),虽然在局部点xi(插值节点)上与已知函数值yi = f (xi)(甚至导数值)上完全相同,但在其它点(非插值节点)上误差可能很大,所谓龙格现象就是例子。此外,实验提供的数据通常含有测试误差,个别数据还不一定准确,这样插值得到的多项式就会使所求到的近似曲线保留了这些误差,从而不能很好地反映原始问题的变化规律。再者,在数据非常多,甚至已形成一个数据流(即m很大)的情况下,用插值法必然会产生次数较高的多项式,这不但计算繁琐而且近似效果也不好,缺乏实用价值。
7.4.1 最小二乘拟合问题
如果将用插值法得到的多项式视为是在局部(插值节点)上逼近被插函数的话,这里我们将研究如何确定一个简单函数j(x),使之在整体上逼近已知函数,即对已知数表
x
x1
x2
…
xm
y = f (x)
y1
y2
…
ym
求一简单拟合曲线y = j(x),使之在整体上尽可能与原始数据曲线近似。
记 d i = j(xi) - yi (i = 1, 2, …, m)
称d i为拟合曲线j(x)在节点xi处的偏差或残量。如果j(x)为插值多项式,则所有偏差均为零。但事实上,我们不可能要求近似曲线y = j(x)严格通过这么多数据点。但为了使j(x)尽可能反映所给数据的变化趋势,我们可以要求偏差的绝对值| di |尽可能小,甚至是尽可能小。
实现这一目的的方法很多,常见的有
(1)选取的j(x)在节点xi处的偏差绝对值最大者达到最小,即
(7.33)
(2)选取的j(x)在节点xi处偏差的绝对值达到最小,即
(7.34)
(3)选取的j(x)在节点xi 处的偏差的平方和达到最小,即
(7.35)
在这三种选取j(x)的标准中,由于前二种均含有偏差di 的绝对值运算,这给进一步的分析讨论与上机计算都带来不便。为此,在实际计算中,常用第(3)种标准,即用偏差的平方和达到最小的原则来保证每个偏差的绝对值| di |都很小。这一原则称为最小二乘原则,按最小原则选择的拟合曲线y = j(x),就称为最小二乘拟合曲线,此方法称为最小二乘法。
因此,最小二乘曲线拟合的一般提法为:对于给定的数据(xi, yi)(i = 1, 2, …, m),在某一个函数类(简单函数类)F中寻求一个函数j*(x),使
(7.36)
其中j(x)为函数F中任意一个函数。
运用最小二乘方法解决实际问题,其关键是如何首先确定函数类F。一方面F中的函数应具有形式简单、易于计算函数值的特点,另一方面F中的函数j(x)的几何形状还应与已给数据表中的数据分布相近,因此这不是个简单问题。在数学上,经常是先将函数表中的数据(xi , yi)在坐标纸上描绘出来,然后分析其分布情况,从而来确定所要选择的j(x)的函数类形式。
7.4.2 最小二乘解的求法
先看一个简单的例子。
例7.6 已知一组实验数据如下:
xi
2
4
6
8
yi
2
11
28
40
试用最小二乘法求它的拟合曲线。
解 把(xi,yi)( i = 1, 2, 3, 4)描绘在坐标纸上(如图7-1),这些点的分布接近于在一条直线上,因此选一条直线(一条曲线)来拟合这组数据,即令
j(x) = a0 + a1x
为确定j(x)只须确定多项式系数a0,a1即可。根据最小二乘原则,求使
图7-1
则所求问题便为求二元函数S (a0, a1)的极小点()问题。
由多元函数取极值的必要条件知必为
的解,即满足
及
或
将已知表中的数据(xi , yi)代入上式,即得所满足的线性方程组
解出得
所求拟合曲线为
例7.7 假定某日每隔一小时测量一次气温的数据如表7-1,试用最小二乘法找出描述这天温度变化规律的简单函数。
表7-1
时间t
0
1
2
3
4
5
6
7
8
9
10
11
12
温度c(t)
15°
14°
14°
14°
14°
15°
16°
18°
20°
22°
23°
25°
28°
时间t
13
14
15
16
17
18
19
20
21
22
23
24
温度c(t)
31°
32°
31°
29°
27°
25°
2
展开阅读全文