1、气象观测站的优化摘要本文主要讨论并求解了关于气象观察站的优化的问题,用SPSS软件对12个样本用方法进行聚类得到整体聚类树图。然后通过逐步计算R方统计量来确定在不影响信息量的情况下最理想的分类数,为8,具体聚类表格如下:类别12345678编号1234 ,75,106,118,912然后计算各样本的期望和均方值来考虑要去掉的气象点。结果为:4,7,10,12;关键词:气象观测站 年均降雨量 均方值 聚类 统计量 距离矩阵一 问题重述某地区有12个气象观察站,10年来各站测得的年降水量已知, 由于经费问题, 有关单位拟减少气象站数目以节约开支, 但又希望还能够尽量多地获取该地区的降水量信息. 我
2、们从分析观测站数据入手, 从中找出去掉某个或某几个气象站的方案.下表给出了各观察站10年的降水量(mm)。地点 年 1981276.2324.5158.6412.5292.8258.4334.1303.2292.9243.2159.7331.21982 251.6 287.3 349.5 297.4227.8453.6321.5451.0466.2307.5 421.1 455.11983 192.7 433.2 289.9 366.3466.2239.1357.4219.7245.7411.1 357.0 353.21984 246.2 232.4 243.7 372.5460.4158.9
3、298.7314.5256.6327.0 296.5 423.01985 291.7 311.0 502.4 254.0245.6324.8401.0266.5251.3289.9 255.4 362.11986 466.5 158.9 223.5 425.1251.4321.0315.4317.4246.2277.5 304.2 410.71987 258.6 327.4 432.1 403.9256.6282.9389.7413.2466.5199.3 282.1 387.61988 453.4 365.5 357.6 258.1278.8467.2355.2228.5453.6315.6
4、 456.3 407.21989 158.5 271.0 410.2 344.2250.0360.7376.4179.4159.2342.4 331.2 377.71990 324.8 406.5 235.7 288.8192.6284.9290.5343.7283.4281.2 243.7 411.1二模型假设1 . 一般来说, 单个气象站测得的降水量数据具有随机性, 但是各个气象站测出的降水量的分布应该符合一定的规律.2 . 最初所有气象站所测得信息量可以整体反映该地区的降水量;3 . 该地区所提供的12 个气象站10 年来的降水量数据是比较精确的.4:每个气象站的费用基本相同;三:符号说
5、明四:问题分析此题求解主要从三方面入手:(1) 用哪种方法聚类最为合适?(2)可聚类的最大数目?(3)在尽量减少信息量损失情况下,要去掉那些观测站?对一个气象站而言,统计十年降水量的均值和方差。均值表示降水量的大小,方差表示降水量的变化,如果方差很小,就考虑可用以往的测量值来代替,这些气象站就可以考虑去掉。 五:模型建立模型一:先得到相关系数矩阵,然后用最远距离法进行聚类,最后根据方差由小到大计算看在不影响降雨量信息损失的情况下去掉那几个观测站较合适。模型二:1:可去掉气象点的最大数目去掉m个气象点前的均降水量g=,g= 判断|g-g/g|12,无法求解。模型三求解:由SPSS软件得聚类步骤表
6、:分为11类:分为10类:分为9类:分为8类:分为7类:分为7类时,80%,信息损失量过大,因此确定分为8类,即去掉4个气象点。2:由matlab求出12个观测点的年降水量的均方值及其排序为9316511109.396108.2444100.196494.200294.103486.51368241071285.073580.927063.974757.247238.047936.8299可以得知去掉 4 10 7 12站点较为合适七:模型评价1:模型二考虑到用去掉气象点前后均降水量的变化大小来求解该去掉站点的最大数目。具有一定可取性。但是由于降水量随机分布,去掉部分气象站时,均降水量变化不大
7、,所以无法得出可行解。2:模型三采用专业软件和精准的距离聚类法得到最大分类数,再跟据均方值考虑要去掉的气象站。具有一定的可行性,但是没有进一步给对于去掉的气象站,如何来估测起降水量。3:在水文系列中, 作为一个样本10 年数据略嫌不足, 理应提供更充足的数据, 才能在节约开支的同时也保证信息的精度.4:实际上, 任何一个气象观测站的建立与否, 除了能单独地提供降水量的信息外, 还应考虑各测站的合理布设、 各测站的控制作用、 各测站的代表性以及周围环境的优劣等因素. 因以上因素在此问题中皆没有明确给出, 故该模型仅能单独进行数据处理八:附录附录2:模型2求解对于可去掉气象点数目的最大值求解的ma
8、tlab程序a=276.2324.5158.6412.5292.8258.4334.1303.2292.9243.2159.7331.2 251.6 287.3 349.5 297.4227.8453.6321.5451.0466.2307.5 421.1 455.1192.7 433.2 289.9 366.3466.2239.1357.4219.7245.7411.1 357.0 353.2246.2 232.4 243.7 372.5460.4158.9298.7314.5256.6327.0 296.5 423.0291.7 311.0 502.4 254.0245.6324.8401
9、.0266.5251.3289.9 255.4 362.1466.5 158.9 223.5 425.1251.4321.0315.4317.4246.2277.5 304.2 410.7258.6 327.4 432.1 403.9256.6282.9389.7413.2466.5199.3 282.1 387.6453.4 365.5 357.6 258.1278.8467.2355.2228.5453.6315.6 456.3 407.2158.5 271.0 410.2 344.2250.0360.7376.4179.4159.2342.4 331.2 377.7324.8 406.5
10、 235.7 288.8192.6284.9290.5343.7283.4281.2 243.7 411.1b=zeros(1,12);for i=1:12 sum=0; for j=1:10 sum=a(j,i)+sum; end b(1,i)=sum/10;enda1=cov(b);a1sum=0;for i=1:12 sum=sum+b(1,i);endk=0;sg=sum/12;b1=b;for i=1:12 sf=(sum-b(1,i)/11; if(abs(sg-sf)/sg)=12 disp(0);endsgsg=sum/12;b1=b;k=0;sumbfor i=1:12 fo
11、r j=1:12 if i-j sf=(sum-b(1,i)-b(1,j)/10; if(abs(sg-sf)/sg)0.05 s=abs(sg-sf)/sg; k=14; end end endendif k-14 disp(1);endk=0;for i=1:12 for j=1:12 for z=1:12 if (i-j)&(i-z)&(j-z) sf=(sum-b(1,i)-b(1,j)-b(1,z)/9; if(abs(sg-sf)/sg)0.05 k=14; end end end end endif k-14 disp(2);endk=0;for l=1:12 for i=1:1
12、2 for j=1:12 for z=1:12 if (i-j)&(i-z)&(j-z)&(i-l)&(j-l)&(l-z) sf=(sum-b(1,i)-b(1,j)-b(1,z)-b(1,l)/8; if(abs(sg-sf)/sg)0.05 k=14; end end end end end endif k-14 disp(3);endk=0;for l=1:12 for i=1:12 for j=1:12 for z=1:12 for p=1:12 if (i-j)&(i-z)&(j-z)&(i-l)&(j-l)&(l-z)&(i-p)&(j-p)&(z-p)&(l-p) sf=(sum-b(1,i)-b(1,j)-b(1,z)-b(1,l)-b(1,p)/7; if(abs(sg-sf)/sg)0.05 k=14; end end end end end end endif k-14 disp(4);end