化实矩阵为准三角形的方法.doc

资源描述

Ⅴ.2 化实矩阵为准三角形的方法矩阵特征值的QR算法，通常在准三角阵的基础上进行。任何矩阵都可经有限次相似变换化成准三角形，但这里只介绍对实矩阵应用豪斯雷尔德(Householder)变换的方法。 Ⅴ.2.1 准三角阵下述形式的矩阵称为上准三角形矩阵，简称准三角阵：例如，下列矩阵A和B都是准三角阵：或把元素所在的对角线称为对角线，所在的对角线称为次对角线，则准三角阵就是次对角线以下的元素(j<i—1)全等于零的矩阵。定义如果准三角阵的次对角线元素都不等于零，则称之为是不可约的；反之，如果次对角线有零元素，则称之为是可约的。例如，上述矩阵A是不可约的，而B是可约的。对于矩阵的列可给出相应的定义，例如矩阵H的第i列称为准三角列。≠0时，称不可约，当=0时，称可约。因此，不可约准三角阵的前n－1列都是不可约的，可约准三角阵在前n－1列中至少有一列是可约的。 Ⅴ.2.2 化准三角形的豪斯霍尔德方法对于任意给定的实矩阵可通过n－2次豪斯霍尔德相似变换，自左至右逐列化成准三角形。先看矩阵的第一列。如果该列已是准三角列，则无需变换，否则可应用定理４的推论，构造一个初等对称正交矩阵，进行豪斯霍尔德变换=化的第一列为准三角列。事实上，如果取第一个分量等于零的列向量则按式(Ⅴ-5)构成的初等对称正交矩阵有对角分块形式：其中，，而。将矩阵作相应的分块，并令其中，，于是用对进行豪斯霍尔德变换得 == 由此可见，在矩阵的第一列中，对角线以下的部分为按定理4的推论，若取则必有，即的第一列为准三角列。依此类推，设经i－1次豪斯霍尔德变换后得出前i－1列为准三角列的矩阵（Ⅴ-10) 如果的第i列不是准三角列，则可构成矩阵，进行豪斯霍尔德变换=，化第i列为准三角列。这时，取构成的列向量因为的前i个元素等于零，故有对角分块形式其中，，而。将矩阵按式(V-10)作相应的分块，并令于是豪斯霍尔德变换 == 从而矩阵的相应块。注意到仅最后一列非零，即知的前i－1列仍是准三角列，并且第i列对角线以下的部分按定理4的推论，若取（Ⅴ-11）则有，即的第i列也是准三角列。式(Ⅴ-11)中的正负号可任取，但为了减小计算误差，应使向量的第一个分量有较大的模，故通常取与异号。综上所述，用豪斯霍尔德方法化实矩阵A=为准三角形的全过程是 =，=，…，（Ⅴ-12) 即……。其中，若令，并用sign（a）表示a的符号，则初等对称正交矩阵的计算公式是（Ⅴ-13) 例Ⅴ-4 用豪斯霍尔德方法化下列矩阵为准三角形：解四阶矩阵应作两次豪斯霍尔德变换。第一次令i=1，由式(Ⅴ-13)和=，依次算出，，。第二次令i=2，由式(Ⅴ-13)和=，即可依次算出最终结果，，。 Ⅴ.3 QR算法的基本原理本节简要地介绍QR算法的一般原理及改进收敛性和提高计算速度的两项措施——先化原始矩阵为准三角形，然后再进行原点位移。具体计算方法在下节讨论。 Ⅴ.3.1 一般原理定理1指出，分块三角形矩阵的特征值就是各对角块的特征值。如果对角块都是1×1或2×2阶矩阵，则可直接求出它的全部特征值。由此设想：对于任意给定的矩阵A=，如果对它连续作这样的相似变换 (V-14) 使所得矩阵序列{A}收敛为分块三角形矩阵，并且对角块都是1×1或2×2阶矩阵，那么就可以求出原始矩阵A的全部特征值。实现这一设想的早期做法是LR算法。对于过程(V-14)中的每一次迭代=，首先对进行三角分解：=。然后取变换矩阵=，从而得==。其中，是单位下三角矩阵，是上三角矩阵。LR算法的缺点是数值计算不稳定，并且除某些特殊类型的矩阵外收敛性很差。为了克服这些缺点，人们提出了QR算法：每次迭代首先把分解成U矩阵和上三角矩阵的乘积，即QR分解 = (Ⅴ-15) 然后取变换矩阵=，从而由和上式得 == (Ⅴ-16) 矩阵到的这种U相似变换，称为QR变换。由于U矩阵的行和列都是单位向量，所以QR算法的显著优点是数据计算稳定，但是就收敛性和每次迭代的计算量来说，并不比LR算法好。解决这一矛盾的方法是迭代前先把原始矩阵化成准三角形，迭代的每一步进行原点位移。对于这两者，后面将分别加以讨论。从上可知，QR算法的基础是矩阵的QR分解。与三角分解不同，QR分解是五条件的，对此有：定理5 对于任何矩阵A (一般地可是复数矩阵)，存在U矩阵Q和对角线元素为非负实数的上三角矩阵R，使分解式A＝QR成立。如果A非奇异，则分解是惟一的。本定理的证明基于下述引理：引理对于任何复元素向量，存在U矩阵M，使线性变换。证明如果b是零向量，则M可以是任何U矩阵，例如M＝I。如果b非零，则可取 M=TD，其中D为与向量b相应的对角U矩阵D＝diag。因为，故矩阵T有两种可能的取法：当时取T=I；当至少有一个为非零元素时，根据定理4的推论，取T为初等对称正交矩阵。注意到U矩阵的乘积仍是U矩阵，引理得证。对于n阶矩阵A，可根据引理取n－1个U矩阵，使得用它们连续左乘A时，自左至右逐列消去对角线以下的元素，从而把A化成对角线元素为非负实数的上三角矩阵 (Ⅴ-17) 事实上，如果经i－1次变换已化A为，并且的前i－1列为三角列则下次变换令，其中的n－i+1阶U矩阵，按引理对列向量选取，使得线性变换。于是，=的前i列都是上三角列。由式(Ⅴ-17)可得，若令，则得A=QR，这就证明了存在性。如果A非奇异，则由和易知R的对角线元素恒为正实数。下面证明惟一性。设A有两个QR分解式和，则由=得 = （Ⅴ-18) 其中是U矩阵，从而也是U矩阵。于是（Ⅴ-19) 因为上三角矩阵的逆和积都是上三角矩阵，而它的共轭转置则是下三角矩阵，故由式 (V-19)可知是对角矩阵。注意到式(V-18)，应是对角U矩阵，因为和的对角线元素为正实数，所以只能是单位矩阵=I，从而=。可见，非奇异矩阵A的QR分解是惟一的。应该指出，从上述证明可知，如果A是实矩阵，则Q可取正交矩阵。此外，关于R的对角线元素的规定，在QR算法中并无必要，实际上对于非奇异矩阵，无论怎样进行QR分解，可以证明Q和R各元素的模都是惟一确定的。 V.3.2 准三角阵的QR算法准三角阵有两个有利于QR算法的性质：第一，可约准三角阵可分割成分块准三角阵。例如，矩阵就是这样，其中的对角块都是不可约准三角阵。因此，对于准三角阵的QR算法，可归结为对不可约准三角阵的算法。第二，QR变换保持准三角形不变。具体地说，有定理6 如果A是不可约准三角阵，则经QR变换A=QR，B=Q*AQ=RQ，所得矩阵B仍是准三角形，并且当A非奇异时B不可约，当A奇异时B可约。其中的U矩阵Q，总是不可约准三角阵。按此定理，如果初始不可约准三角阵奇异，则经一次QR变换即可约简成较小的不可约准三角阵；如果非奇异，则用QR算法将得到不可约准三角阵序列{}。对于后者，只要有某个次对角线元素收敛为零，即可约简成较小的不可约准三角阵。因此，基于准三角阵的QR算法，一般来说收敛性比满矩阵为好。准三角阵更突出的优点是计算量小。事实上，由定理6可知，基于准三角阵的 QR算法，每次迭代都是对不可约准三角阵按式(V-15)和式(V-16)作QR变换。因为和都是准三角阵，所以其中的QR分解，以及U相似变换的计算量都比较小。QR分解就是化为上三角形(=)，U相似变换就是矩阵乘积=。可以推算出：满矩阵QR变换的计算量与n3成正比，而准三角阵QR变换的计算量仅与n2成正比。由此可见，当矩阵的阶数n较大时，基于准三角阵的QR算法，可使计算量大幅度下降。定理6的证明如下：令矩阵A和Q的列分别为和，由分解式A=QR可得（i=1,2,…，n－1）如果A不可约，则它的前n－1列都不可约。由=不可约，推知≠0，并且是不可约列；由不可约，进一步推知≠0，并且是不可约列；如此推下去，最后知≠0，并且是不可约列。这就是说，当A不可约时Q也是不可约准三角阵，并且R的前n－1个对角线元素都不等于零。显然，当A非奇异时≠0，当A奇异时=0。由于上三角矩阵和准三角阵的乘积仍是准三角阵，故B=RQ是准三角阵。注意到B的次对角线元素，由Q不可约，即≠0可知：当A奇异时不可约；当A奇异时B可约，并且它的次对角线元素仅=0。证毕。 V.3.3 收敛性和原点位移可以证明：如果非奇异矩阵A＝的各个特征值其模都不相同，则在QR变换下对角线以下的元素将趋于零，对角线以上元素的模趋于确定的值，而对角线元素则趋于各特征值。若是准三角阵，则在通常情况下 = 其中，和是与迭代次数k无关的常数；。这就是说次对角线元素以因子线性地收敛为零，对角线元素以因子线性地收敛为特征值，其中最后一个对角线元素的收敛因子是，并且特征值按模从大到小在对角线上顺序排列。在实际计算中，线性收敛是不满意的。但是，从上面的分析可以看出，如果每次迭代前将的特征值都减去一个尽量接近于的数值 (这相当于将特征值的坐标原点位移)，并在迭代后加回去，那么收敛因子将减小为。特别是最后一个收敛因子将变得更小，即，从而使迅速趋向零，迅速趋向。这就是用特征值原点位移加速算法收敛的基本思想。在上述特定的情况下，作为的估计数值，显然应取位移值=。由于矩阵A+μI的特征值与A的特征值满足关系=+μ(i=1,2,…，n)，所以带原点位移的QR算法每次迭代分两步：第一步，对位移后的矩阵－I按式(V-15)和式(V-16)作QR变换，即先QR分解－I= (V-20) 然后用所得对－I作U相似变换（－I）= (V-21) 其中，矩阵的特征值都比的小。第二步，恢复特征值的原点，即取矩阵 =+I (V-22) 显然，与的特征值相同。从式(V-21)可知= －I ，代入式(V-22)得 = (V-23) 这就是说，带原点位移的QR变换，可先按式(V-20)QR分解矩阵－I，然后用所得对作U相似变换，即按式(V-23)求得。下面进一步讨论原点位移的方法。可以证明：对于具有等模特征值的矩阵A=，由QR变换得到的矩阵序列{}常常收敛于分块三角形，并且每个对角块对应于模相等的特征值。特别地，对于具有多重复共轭特征值的实矩阵，{}的极限形式是分块三角形，并且对角块为1×1或2×2阶矩阵，其中2×2阶对角块对应于一对复共轭特征值。由此可见，对于一般的矩阵，特别是对于具有复数特征值的实矩阵，采用加速最后一个对角线元素收敛的实数位移=是不适宜的。事实上，这时的不可能接近于任何复数特征值。考虑到{}的极限形式中最后一个对角块的阶数常常是2×2，作为改善办法，可取右下角子矩阵的两个特性值和中模值靠近的一个当作位移值。实践表明，这种原点位移方法对加速QR算法收敛是很有效的。 V.3.4 二重QR算法对于实矩阵A=，当取位移值为右下角2×2阶子块的特征值时，可能是复数，从而按式(V-20)和式(V-23)进行的QR变换需作复数运算。为了减轻计算量，避免实矩阵的复数运算，可采用把连续两次迭代合并为一次的二重QR算法，它的一般原理如下：设经k－1次二重迭代后，原始矩阵已相似变换成。对于第k次二重迭代，首先从右下角2×2阶子矩阵求出位移值和，然后用它们按式(V-20)和式 (V-23)连续作两次QR变换。第一次，对矩阵用位移值作QR变换－I= + I = 第二次，对矩阵用位移值作QR变换－ I= =+ I= 如果把这两次变换合并为一次，并且令 Q=，R= =(－I)( － I) (V-24) 则由上列各式可推知 =QR (V-25) =Q (V-26) 其中，式(V-25)可用下法推证： QR== (－ I) =(－ I) =(－ I) =(－ I) (－I)= (－I) (－ I) 如果和都不是的特征值，则－I、－ I和都是非奇异矩阵。因此，根据QR分解的惟一性，二重QR变换可按式(V-24)~式(V-26)进行，即先算出并对它作QR分解，然后用所得Q对作U相似变换。实际上当和中有的特征值时，二重QR变换也可以这样做。可以证明，在这种情况下，不可约准三角阵二重QR变换的结果是可约的。现在设是实矩阵，这时的位移值和若是复数则必为共轭对，从而它们的和与积都是实数。注意到式(V-24)的展开式： =－ (+)+I 可见是实矩阵，于是由它分解出来的Q可取正交矩阵，按式(V-26)得到的仍是实矩阵。因此，对于实矩阵采用二重QR算法，可避免因原点位移导致的复数运算。１２

展开阅读全文