高等数值分析作业-第一次实验.docx

资源描述

高等数值分析第一次实验 T1. 构造例子说明CG的数值形态。当步数 = 阶数时CG的解如何？当A的最大特征值远大于第二个最大特征值，最小特征值远小于第二个最小特征值时，方法的收敛性如何？ Answer: 对于问题1：当步数 = 阶数时CG的解如何？ Ø 在MATLAB中构造N阶对称正定矩阵代码如下： N=1000 D = diag(rand(N,1)); U = orth(rand(N,N)); A = U'*D*U; 在计算时，取X0=zeros(N,1);b=ones(N,1); 自己编写CG算法，如下： Xk = X0; rk=b-A*Xk; pk=rk; crk_1=rk'*rk; for k=1:N k=k+1; apk=A*pk; ak=crk_1/(pk'*apk); Xk=Xk+ak*pk; rk=rk-ak*apk; crk=rk'*rk; bk_1=crk/crk_1; crk_1=crk; pk=rk+bk_1*pk; m(k)=norm(rk); r(k)=k; end plot(r,m,'r-'); Ek=m(k) 计算结果如下（绘制出来的log10rk随迭代次数的变化如上图所示）： N 1000 2000 3000 4000 log10rk -81.8505 -98.3653 -126.3256 -115.8889 运行时间（s） 4.309855 30.205448 105.792648 289.610550 由上表可以看出对于对称正定矩阵A，CG算法还是比较稳定的，但求解步数=阶数时，CG算法的解即为准确解（误差极小）。对于问题2：当A的最大特征值远大于第二个最大特征值，最小特征值远小于第二个最小特征值时，方法的收敛性如何？ Ø 构造1000阶的对称正定矩阵如下，收敛准则取为绝对ε<10(-10)：首先构造一个特征值分别为0.1到1的对称正定矩阵A，代码如下（算例1）： D = diag(linspace(0.1,1,N)); U = orth(rand(N,N)); A = U'*D*U; 在之前的基础上，将最大特征值调为107，最小特征值为10-5，代码如下（算例2）： DIA=linspace(0.1,1,N); DIA(1)=10^(-5); DIA(N)=10^7; D = diag(DIA); U = orth(rand(N,N)); A = U'*D*U; 最后生成一个特征值在10-5到107均匀分布的矩阵（算例3）: DIA=linspace(10^(-5),10^7,N); D = diag(DIA); U = orth(rand(N,N)); A = U'*D*U; 计算结果如右图所示，首先对比可以发现矩阵的收敛速度跟其条件数大小有关，条件数小时，收敛速度快，算例1>2>3，同时，A的中间特征值分布对CG的收敛速度有巨大的影响。实际上，在经过几步后，CG的收敛因子将是： λ2λn-1-1λ2λn-1+1 而非 λ1λn-1λ1λn+1 因此，本题中算例2的矩阵的收敛速度较算例3快很多，而与算例1较为接近。 T2. 对于同样的例子，比较CG和Lanczos的计算结果。 Answer: 首先构造一个1000阶的对称正定矩阵，代码如下： D = diag(linspace(1,1000,N)); U = orth(rand(N,N)); A = U'*D*U; 在计算时，取X0=zeros(N,1);b=ones(N,1); CG算法代码同上，在计算时取停机准则为绝对误差e<10-12，Lanczos算法的代码如下所示（这里取得矩阵为对称正定矩阵，因此Lanczos过程求解yk时采用cholesky分解）：第 | 页 8 Xk = X0; n=size(A,1); aj=zeros(n,1); bj=zeros(n,1); r0=b-A*Xk; rk=r0; q=rk/norm(rk); r=A*q; aj(1)=q'*r; r=r-aj(1)*q; if r~=0 bj(1)=norm(r); end q1=r/bj(1); qk=q; k=1; TK(1,1)=aj(1); L=chol(TK); lyk=YK(L',norm(r0)*eye(k,1)); yk=YKN(L,lyk); Xk=X0+qk*yk; rk=b-A*Xk; m(k)=log10(norm(rk)); num(k)=k; TK(1,2)=bj(1); TK(2,1)=bj(1); qk=[q q1]; while norm(rk)>e & k<n k=k+1; r=A*q1-bj(k-1)*q; aj(k)=q1'*r; r=r-aj(k)*q1; if r~=0 bj(k)=norm(r); end q=q1; q1=r/bj(k); TK(k,k)=aj(k); L=chol(TK); lyk=YK(L',norm(r0)*eye(k+1,1)); yk=YKN(L,lyk); Xk=X0+qk*yk; rk=b-A*Xk; m(k)=log10(norm(rk)); num(k)=k; TK(k,k+1)=bj(k); TK(k+1,k)=bj(k); qk=[qk q1]; end 在计算时直接采用cholesky分解（直接采用matlab自带的函数）计算yk，LLTy=r0e1的代码如下： L=chol(TK); lyk=YK(L',norm(r0)*eye(k,1)); yk=YKN(L,lyk); YK函数： n=size(TK,1); yk=zeros(n,1); yk(1)=b(1)/TK(1,1); for i=2:n yk(i)=(b(i)-TK(i,i-1)*yk(i-1))/TK(i,i); end YKN函数： n=size(TK,1); yk=zeros(n,1); yk(n)=b(n)/TK(n,n); for i=1:n-1 j=n-i; yk(j)=(b(j)-TK(j,j+1)*yk(j+1))/TK(j,j); end 计算结果如上图所示，计算时间与迭代步数如下：计算方法 CG方法 Lanczos方法迭代步数 234 235 运行时间（s） 0.187081 0.513452 可以得到如下结论： Ø 当矩阵A为对称正定时，两种方法效果相当，每一步误差也基本相同，但收敛速度基本一样。 Ø 由于Lanczos方法的每一步迭代中都有一个Lanczos过程，其中需要构造Tk和Qk，以及计算yk，故该方法需要耗费更长的计算时间。 Ø 同时计算过程中发现，当取得收敛准则比较严格时，CG算法较Lanczos方法稳定。 T3. 当A只有m个不同特征值时，对于大的m和小的m，观察有限精度下Lanczos方法如何收敛。 Answer：首先构造1000阶有m个特征值的矩阵，构造是保证矩阵的条件数相同（这里均取为1000），构造矩阵的代码如下： N=1000 m=10; DIA=linspace(1,1000,m); VEC=zeros(N,1); k=N/m; i=1; ii=0; while i<=m for j=1:k VEC(ii+j)=DIA(i); end ii=ii+k; i=i+1; end D=diag(VEC); U = orth(rand(N,N)); A1 = U'*D*U; 对构造好的A1进行计算，在计算时，取X0=zeros(N,1);b=ones(N,1); 在计算时取停机准则为绝对误差e<10-10，Lanczos方法的代码同上，得出的结果如上图所示（分别绘制出log10rk和rk随迭代次数的变化图），各种情况下的迭代次数及计算时间如下表所示（这里取得矩阵为对称正定矩阵，因此Lanczos过程求解yk时采用cholesky分解）：特征值个数 10 20 50 100 500 1000 运行时间 0.015727 0.028523 0.072200 0.107578 0.283986 0.453770 迭代次数 10 20 49 73 159 215 可以看到，几个问题的条件数虽然相同，如果A只有m个不同的特征值，则Lanczos方法至多m步就可以找到精确解。实验中，在m较大的时候，算法收敛较快，远小于m。当m较小时，可能需要接近于m步才能找到准确解。另外，由上面计算可以看到在m值较小时，其第k步的误差rk会有一个在计算时会有先增大后减小的过程，最后收敛。 T4. 取初始值近似解为零向量，右端项b仅由A的m个不同特征向量的线性组合表示时，Lanczos方法的收敛性如何？数值计算中方法的收敛性和m的大小关系如何？ Answer：在前面的基础上，我们知道之前构造对称正定矩阵时，U的每一个行向量均为对应A的特征值（D的某一个元素）的特征向量，因此构造m不同时的又端项b代码如下所示： N=1000 m=10; DIA=linspace(1,N,N); D=diag(DIA); U = orth(rand(N,N)); A1 = U'*D*U; b1=zeros(N,1); for i=1:m b1=b1+rand(1)*(U(i,:))'; end X0=zeros(N,1); e=10^(-10); tic [S1,ek,num]=LanczosT3(A1,X0,b1,e); toc 计算时采用的Lanczos算法同之前的题目，计算出来的结果如上所示（这里取得矩阵为对称正定矩阵，因此Lanczos过程求解yk时采用cholesky分解）。各种情况下的迭代次数及计算时间如下表所示： m 10 20 50 100 500 750 1000 运行时间 0.1074 0.1950 0.2967 0.3546 0.3546 0.4325 0.4275 迭代次数 68 120 165 179 202 205 212 我们可以得到如下结论： Ø M较小时，计算过程中收敛误差会产生波动，m较大时，波动减小，最后均收敛； Ø 收敛步数随着 m 值的增大而增加，但是由上表我们可以看出收敛步数的增幅逐渐减小，可以推测当 m 达到一定值后，收敛步数可能趋近于某一定值。 T5. 构造对称不定矩阵，验证Lanczos方法的近似中断，观察收敛曲线中的峰点个数和特征值的分布关系；观测当出现峰点时，MINRES方法的收敛形态怎样。 Answer：对于对称不定矩阵，求解yk时采用追赶法，追赶法的代码如下所示： function s = Zhuigan( A,bb ) n=size(A,1); s=zeros(n,1); b=diag(A); a=diag(A,-1); c=diag(A,1); d=zeros(n,1); u=zeros(n-1,1); for i=1:n-1 d(1)=b(1); u(i)=c(i)/d(i); d(i+1)=b(i+1)-a(i)*u(i); end %-----追的过程------------ y=zeros(n,1); y(1)=bb(1)/d(1); for i=2:n y(i)=(bb(i)-a(i-1)*y(i-1))/d(i); end %-----赶的过程--------------- s(n)=y(n); for i=n-1:-1:1 s(i)=y(i)-u(i)*s(i+1); end end 而对于MINRES方法，考虑求解yk时用MATLAB自带的qr分解进行计算，其中与Lanczos算法不同之处在于，求解yk部分代码如下： ek=zeros(k,1); ek(k)=1; TKT=[TK bj(k)*ek]'; [Q,R]=qr(TKT); gk=Q'*norm(r0)*eye(k+1,1); yk=minresYK(R,gk); 其中，minresYK为自己编写的有R·gk=yk求解yk的函数，代码如下： function yk = minresYK(TK,b) n=size(TK,2); yk=zeros(n,1); yk(n)=b(n)/TK(n,n); for i=1:n-1 k=n-i; yk(k)=b(k); for j=k+1:n yk(k)=yk(k)-TK(k,j)*yk(j); end yk(k)=yk(k)/TK(k,k); end end 对于有m个特征值的对称不定矩阵，本文中采用的生成代码如下（基本思想同之前相同，生成矩阵的特征值分别为-m,-(m-1),……,-1,1,2,……N-m，其中N为矩阵阶数，计算过程中按1000考虑）： N=1000 %10个负特征值 m=10; DIA=linspace(-m+1,N-m,N); DIA(m)=-m; D=diag(DIA); U = orth(rand(N,N)); A1 = U'*D*U; 取X0=zeros(N,1);b=ones(N,1); 在计算时取停机准则为绝对误差e<10-10，计算结果如下：负特征值个数：0 Lanczos 步数：212 计算时间：0.368697 MINRES 步数：210 计算时间：0.544282 负特征值个数：10 Lanczos 步数：369 计算时间：0.841989 MINRES 步数：367 计算时间：1.776133 负特征值个数：50 Lanczos 步数：697 计算时间：2.673012 MINRES 步数：689 计算时间：10.111938 负特征值个数：100 Lanczos 步数：944 计算时间：5.155608 MINRES 步数：939 计算时间：24.470218 负特征值个数：150 Lanczos 未收敛计算时间：5.897715 MINRES 未收敛计算时间：28.467015 负特征值个数：200 Lanczos 未收敛计算时间：5.897715 MINRES 未收敛计算时间：28.467015 由上述结果得到的结论如下： Ø Lanczos方法有峰点说明，Lanczos方法可能会近似中断； Ø 负特征值越多，峰点个数越多。实际上，更一般的结论是，当正负特征值个数相差较多时，峰点个数较少，当正负特征值个数相当时，峰点个数最多； Ø 通过观察说明在Lanczos出现峰点时，MINRES方法收敛过程很稳定； Ø 达到相同精度时，MINRES迭代次数较Lanczos略少，但是差别很小，而MINRES方法要比Lanczos方法花费更多的计算时间； Ø 当负特征值个数过多时，两种方法均无法在1000步内达到收敛进度，但是MINRES的精度较Lanczos方法高。

展开阅读全文