资源描述
资料内容仅供您学习参考,如有不当或者侵权,请联系改正或者删除。
1.问题综述
1.1问题的背景
气候变暖已是人们普遍关注的问题. 由于多种不利因素的影响下,气候变暖的趋势在加剧, 它的危害或不利影响进在显现 , 比如全球变暖的一个预期结果是地表空气将变干, 导致陆地开放水体生物的蒸发率上升, 这种增加将导致一系列水循环的改变。这对于地球的生态和整个生物生存条件都会引起变化; 另外海平面如果地球的冰层过快的溶化, 会引起海平面的上升, 这自然会影响地球上人类的生活环境, 这中间有很多数学问题需要研究。
1.2问题的提出
从现有的地球气温有关数据出发, 获取信息, 进而获得气温变化规律, 进而对气候变暖情况及可能的危害进行定量的研究。
拟要求获得以下结果:
1. 建立数学模型, 使用此模型预测气温的变化趋势。
2. 建立数学模型, 使用此模型获取引起气温上升的主要原因。
3. 建立数学模型, 使用此模型对气候变暖的损失进行定量估计。
4. 经过以上对气候变暖的定量研究, 对于当前的一些预防气候变暖的对策进行评价, 并利用你的研究结果提出一些更为合理的对策。
注: 数据请到气象年鉴或地理年鉴搜集。
2.问题初步分析
2.1背景分析
众所周知, 近百年以来, 全球气温一直维持较高速度增长, 己经越来越严重的影响了人们的日常生活和工作。科学界普遍认为, 气温变暖主要是由于地球大气中的二氧化碳等温室气体不断增加引起的, 主要是指人为因素造成的温度上升。气候变暖将对人类的生活环境、 安全产生重大负面影响, 原因是逐渐上升的气温和海平面, 大幅波动的降雨量, 以及严重旱灾、 水灾的频发, 都会改变各地区农业生产情况, 并进一步减低食物和水的来源。气候变暖影响着人类的生存与发展, 成为当今人类社会亟待解决的重大问题, 是人类必须面正确严峻挑战。因此, 很有必要建立数学模型来把握气温的变化趋势, 探寻气温上升的主要原因以及对其带来的损失进行评估, 并找出规律, 指导人们预防气候变暖。
2.2问题分析
对气温的变化趋势预测, 能够先搜集历年平均气温数据, 作散点图, 观察其波动性及变化趋势, 然后可采用回归分析, 时间序列分析, 神经网络等进行分析和预测; 影响地球表面气温变化的因子很多, 但一般认为主要有自然因子和人类活动两大类。科学界普遍认为, 气候变暖的原因是温室气体排放增加、 森林等植被破坏、 工业生产及人类生活排放的废气增加和地面太阳辐射增加等原因。探寻其主要原因可采用关联度分析法等; 对于气候变暖的损失进行定量估计@@
3.问题假设与符号说明
3.1问题的基本假设
3.2符号说明
——
4.气温变化趋势回归模型
4.1回归模型的建立
首先, 我们从中国气象年鉴上搜集了中国从1949年到 的年平均气温、 年最高气温和年最低气温的数据。
然后, 我们对年平均气温、 年最高气温和年最低气温分别作散点图, 观察气温的变化趋势, 发现气温呈近似的线性上升趋势。因此, 应用matlab软件分别对年平均气温、 年最高气温和年最低气温进行了线性回归, 分别如图4.1.1、 图4.1.2、 图4.1.3所示:
图4.1.1 中国历年平均气温
图4.1.2 中国历年最高气温
图4.1.3 中国历年最低气温
得到回归方程分别为:
年平均气温:
年最高气温:
年最低气温:
4.2模型检验与分析
对回归方程分别进行检验得到如下方差分析表:
表4.2 方差分析表
回归方程
可决系数
标准误差
值
显著性
平均气温
0.66525
0.10808
99.365
4.0343
7.1706
* *
最高气温
0.56365
0.13652
64.587
4.0343
7.1706
* *
最低气温
0.63741
0.12328
87.896
4.0343
7.1706
* *
注:‘* *’即>表示高度显著;‘*’ <<即表示显著,其它情况则为不显著。
由方差分析表可知: 这三种线性回归方程的模型拟合程度大致较好, 虽然不是很高, 但用来判断、 表征温度的变化趋势是可行的。
同时, 为更加直观的体现气温的变化趋势我们对年平均气温、 年最高气温和年最低气温进行了累积距平的效果处理, 分别如图4.2.1, 图4.2.2, 图4.2.3。
图4.2.1 平均气温累积
图4.2.2 最高气温累积
图4.2.3 最低气温累积
综上分析, 我们可得到结论: 虽然中国气温有其随机波动性, 但气温整体呈线性上升的确定性趋势, 且回归模型能很好的解释这一确定性趋势。
5. 气温的时间序列分析与预测
5.1时间序列分析方法
时间序列是按时间顺序排列的、 随时间变化且相互关联的数据序列。时间序列根据所研究的依据不同, 可有不同的分类。
1.按所研究的对象的多少分, 有一元时间序列和多元时间序列。
2.按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。
3.按序列的统计特性分, 有平稳时间序列和非平稳时间序列。如果一个时间序列的概率分布与时间t无关, 则称该序列为严格的( 狭义的) 平稳时间序列。如果序列的一、 二阶矩存在, 而且对任意时刻t满足:
( 1) 均值为常数
( 2) 协方差为时间间隔的函数。
则称该序列为宽平稳时间序列, 也叫广义平稳时间序列。我们以后所研究的时间序列主要是宽平稳时间序列。
4.按时间序列的分布规律来分, 有高斯型时间序列和非高斯型时间序列。
5.1.1确定性时间序列分析方法概述
时间序列预测技术就是经过对预测目标自身时间序列的处理, 来研究其变化趋势的。一个时间序列往往是以下几类变化形式的叠加或耦合。
( 1) 长期趋势变动。它是指时间序列朝着一定的方向持续上升或下降, 或停留在某一水平上的倾向, 它反映了客观事物的主要变化趋势。
( 2) 季节变动。
( 3) 循环变动。一般是指周期为一年以上, 由非季节因素引起的涨落起伏波形相似的波动。
( 4) 不规则变动。一般它分为突然变动和随机变动。
一般见表示长期趋势项, 表示季节变动趋势项, 表示循环变动趋势项, 表示随机干扰项。常见的确定性时间序列模型有以下几种类型:
( 1) 加法模型
( 2) 乘法模型
( 3) 混合模型
其中是观测目标的观测记录, , 。
如果在预测时间范围以内, 无突然变动且随机变动的方差较小, 而且有理由认为过去和现在的演变趋势将继续发展到未来时, 可用一些经验方法进行预测。
5.1.2 移动平均法
移动平均法是根据时间序列资料逐渐推移, 依次计算包含一定项数的时序平均数, 以反映长期趋势的方法。当时间序列的数值由于受周期变动和不规则变动的影响, 起伏较大, 不易显示出发展趋势时, 可用移动平均法, 消除这些因素的影响, 分析、 预测序列的长期趋势。
2.1 简单移动平均法
设观测序列为, 取移动平均的项数N<T。一次简单移动平均值计算公式为:
当预测目标的基本趋势是在某一水平上下波动时, 可用一次简单移动平均方法建立预测模型:
其预测标准误差为:
最近 N 期序列值的平均值作为未来各期的预测结果。一般N取值范围: 。当历史序列的基本趋势变化不大且序列中随机变动成分较多时, N 的取值应较大一些。否则N 的取值应小一些。在有确定的季节变动周期的资料中, 移动平均的项数应取周期长度。选择最佳N 值的一个有效方法是, 比较若干模型的预测误差。预测标准误差最小者为好。
5.1.3指数平滑法
一次移动平均实际上认为最近N 期数据对未来值影响相同, 都加权; 而N期以前的数据对未来值没有影响, 加权为0。可是, 二次及更高次移动平均数的权数却不是, 且次数越高, 权数的结构越复杂, 但永远保持对称的权数, 即两端项权数小, 中间项权数大, 不符合一般系统的动态性。一般说来历史数据对未来值的影响是随时间间隔的增长而递减的。因此, 更切合实际的方法应是对各期观测值依时间顺序进行加权平均作为预测值。指数平滑法可满足这一要求, 而且具有简单的递推形式。
i).一次指数平滑法( 预测模型)
设时间序列为为加权系数, 0<<1, 一次指数平滑公式为:
上式是有移动平均公式改进而来的。以作为的最佳估计, 则有
令, 以代替, 即能够得到:
为进一步理解指数平滑的实质, 把上式一次展开有:
上式表明是全部历史数据的加权平均, 加权系数分别为显然有:
由于加权系数符合指数规律, 又具有平滑数据的功能, 故称为指数平滑。
以这种平滑值进行预测, 就是一次指数平滑法。预测模型为
即
也就是以第t期指数平滑值作为t+1期预测值。
ii).一阶差分指数平滑法
当时间序列呈直线增加时, 可运用一阶差分指数平滑模型来预测。其公式如下:
其中的为差分记号。
表示对呈现直线增加的序列作一阶差分, 构成一个平稳的新序列: 表示把表示把经过一阶差分后的新序列的指数平滑预测值与变量当前的实际值迭加, 作为变量下一期的预测值。对于这个公式的数学意义可作如下的解释。
因为:
当我们采用计算的预测值去估计中的, 从而左边的也要改为预测值, 亦即称为。
在前面我们已分析过, 指数平滑值实际上是一种加权平均数。因此把序列中逐期增量的加权平均数( 指数平滑值) 加上当前值的实际数进行预测, 比一次指数平滑法只用变量以往取值的加权平均数作为下一期的预测更合理。 从而使预测值始终围绕实际值上下波动, 从根本上解决了在有直线增长趋势的情况下, 用一次指数平滑法所得出的结果始终落后于实际值的问题。
5.2 气温的时间序列分析
经过观察历史数据及有上文分析可知, 中国年平均气温的时间序列为既含有确定性的动态趋势又含有随机性波动的非平稳时间序列。回归分析方法只能描述气温变化的整体趋势, 提取温度变化信息较少, 无法克服其波动性影响, 而时间序列分析能很好的解决这个问题。
根据我们所得到的数据, 我们运用了spss软件对中国年平均气温进行时间序列分析能够得到:
表5.2.1 各种时序模型统计量比较
年平均气温模型
预测变量数
模型拟合统计量
Ljung-Box 统计值
离群值数
平稳的 R 方
统计量
DF
Sig.
Holt
0
.700
33.134
16
.007
0
Brown
0
.692
30.828
17
.021
0
ARIMA(1,0,0)
0
.588
26.804
17
.061
0
ARIMA(0,0,1)
0
.382
79.560
17
.000
0
ARIMA(1,1,1)
0
.277
24.611
16
.077
0
ARIMA(2,1,1)
0
.284
28.596
15
.018
0
经过以上做各种模型的拟合并得到相应的模型检验值, 从中我们能够发现不论从拟合统计量的指标看, 还是从Ljung-Box统计值看, 指数平滑法Holt和Brown做出的时序模型都比自回归差分滑动模型ARIMA(p,d,q)要好的多, 至于两种指数平滑法哪种好, 我们看哪种预测模型比较合理。
表5.2.2 Brown法和Holt法预测值
实际温度值
Brown法预测值
Holt法预测值
年份
年均温
年最大值
年最小值
均温预测值
最大预测
最小预测
均温预测
最大预测
最小预测
9.875
9.966
9.757
9.815
10.035
9.595
9.788
10.003
9.573
9.923
10.061
9.794
9.831
10.059
9.603
9.798
10.017
9.578
9.935
10.018
9.876
9.847
10.084
9.611
9.808
10.031
9.584
9.912
10.028
9.791
9.863
10.109
9.618
9.817
10.045
9.59
9.942
10
9.832
9.88
10.135
9.624
9.827
10.059
9.596
9.893
9.986
9.788
9.896
10.161
9.63
9.837
10.073
9.602
9.864
10.069
9.692
9.912
10.189
9.635
9.847
10.087
9.608
9.796
9.914
9.541
9.928
10.216
9.639
9.857
10.101
9.614
9.9
9.995
9.837
9.944
10.245
9.643
9.867
10.114
9.62
经过表5.2.2, 我们能够算出预测值与准确值之间的容差:
表5.1.3 预测值与准确值之间的容差
均温容差
最大值容差
最小值容差
Brown法
0.04773
0.23264
0.2816
Holt法
0.06981
0.064267
0.25594
经容差分析, Holt法预测值与准确值容差相对较小, 因此Holt指数平滑方法比较好。其拟合预测图如下:
图5.2.1 Holt法拟合预测图
6.气温上升主要原因的探究
6.1气温上升的原因分析
影响地球表面气温变化的因子很多, 但一般认为主要有自然因子和人类活动两大类。科学界普遍认为, 气候变暖的原因是温室气体排放增加、 人口剧增、 森林等植被破坏、 工业生产及人类生活排放的废气增加和地面太阳辐射增加等。
这些原因中到底那些是最主要的是我们需要探讨的问题。关联度分析是进行因素间时间序列的比较来确定哪些是影响大的主导因素的方法, 其意义是指在系统发展过程中, 如果两个因素变化的态势是一致的, 即同步变化程度较高, 则能够认为两者关联较大; 反之, 则两者关联度较小。因为影响气温上升的各因素均是随时间变化的序列, 因此, 可采用关联度分析方法获取气温上升的主要原因。
6.2各因素数据的搜集及预处理
考虑到年平均气温在短期内变化趋势不明显, 趋势体现在其长期性上。我们中国气象年鉴及中国统计年鉴上搜集了工业废气排放量、 二氧化碳排放量、 人口数、 太阳辐射量和森林覆盖率从1970年到 近40年的数据。
其中, 由于中国森林覆盖率是每三年统计一次, 数据不健全。因此, 我们经过三次样条插值的方法, 得出建国后各年的森林覆盖率:
图6.2 中国历年森林覆盖率
6.3各因素与气温的关联度分析
i)首先我们选取参考数列
则称
( 1)
为比较数列对参考数列在时刻的关联系数, 其中为分辨系数。称式,分别为两级最小差及两级最大差。
一般来讲, 分辨系数越大, 分辨率越大; 分辨系数越小, 分辨率越小。
(1) 式定义的关联系数是描述比较数列与参考数列在某时刻关联程度的一种指标, 由于各个时刻都有一个关联数, 因此信息显得过于分散, 不便于比较, 为此我们给出更好的评判标准。
ii)其次我们定义关联度
为数列对参考数列的关联度。
由ii)易看出, 关联度是把各个时刻的关联系数集中为一个平均值, 亦即把过于分散的信息集中处理。利用关联度这个概念, 我们能够对各种问题惊醒因素分析, 考虑之后遇到的问题。
Step1 数据的搜集
Step2 数据的归一化
考虑到数据间的量纲的相互影响( 即使量纲一样也会出现大数吃小数的情况) , 因此首先我们进行了数据的标准化处理, 我们知道处理的方式很多, 有均值化变换、 倍数变换、 最大最小化变换和百分数化变换。考虑到前后比较, 我们采用了均值化变换, 这样更能够在时序下相互比较。
具体的方法是给定一个数列
其均值为
而将每一项都除以各列的平均值得到新的数列, 即为均值化变换。
Step3 MATLAB软件的求解。( 程序见附录)
根据软件的运行我们得到了工业废气排放量、 二氧化碳排放量、 人口、 太阳辐射和森林覆盖率对年平均气温变化的关联度分析结果:
表6.3.1关联度分析结果
1970~1979
0.5626
0.5613
0.8283
0.8766
0.9175
1980~1989
0.5362
0.5703
0.8637
0.8747
0.8864
1990~1999
0.7069
0.6239
0.8826
0.8374
0.6807
~
0.5079
0.5577
0.9577
0.9452
0.8802
1970~
0.732
0.7784
0.9321
0.972
0.9104
从上表每隔十年进行一次关联度分析和对整个阶段进行一次关联度分析的数据变化来看, 对于气温变化其关键作用的分别有人口、 太阳辐射和森林覆盖率, 其中最为重要的因素是太阳的辐射。具体到从四个阶段分析, 我们能够看出森林覆盖率在早期相对比较重要, 但后来人口的影响更加明显, 其实这也间接说明了人类活动对气候环境有很大的影响。
至于我们一向认知的二氧化碳排放量这个因素在影响气候环境时, 不是很明显, 甚至关联度很低。这里, 考虑到所建模型存在仅从数据差异看因子关联的局限性, 没有进行气温上升的机理分析, 未能从生物学的角度来权衡分析。因此, 同我们一般的认识有所偏差, 这是很正常的。而对于它们间存在的关系, 我们在模型的进一步讨论中对其进行建模分析。
7.气温上升原因的进一步探讨
7.1多元线性回归模型
经过我们对五个因素与年平均气温间的关联度分析, 我们知道其中有三个因子的关联度较大, 即: 人口数、 太阳辐射和森林覆盖率。因此, 在此基础上又进行了进一步讨论分析。为了探寻它们与气温之间的关系, 我们采用了多元线性回归的方式进行拟合。具体为:
其中:
———常数项
———各个因素前的系数
———随机干扰项
对于该多元线性回归模型, 需要进行四方面检测, 具体有: 剩余标准误差、 可决系数、 检验和检验。
模型的求解与检验结果如下:
回归方程:
其中,,分别表示人口、 太阳辐射和森林覆盖率。
检验结果:
表7.1.1 方差分析表
方差来源
偏差平方和
自由度
方差
值
显著性
回归
0.0153
3
0.0051
55.1932
2.8663
* *
剩余
0.0033
36
9.2182e-005
4.3771
总和
0.0186
39
可决系数: =0.90632
剩余标准误差: =0.0096011
各因素的显著性为: [显著; 显著; 显著] 经过了检验
7.2气温与二氧化碳排放量间的关系探讨
采用关联度分析时, 在多个因素检验过程中二氧化碳排放量与气温变化关联度较低, 与我们一惯的认知相悖。因此, 我们将进一步单独考虑二氧化碳排放量与气温变化的关系。
首先, 作二氧化碳排放量其与气温的散点图。( 如图7.2.1)
图7.2.1二氧化碳与气温的散点图
然后, 观测点的分布及变化趋势, 做曲线拟合。( 如图7.2.2)
图7.2.2 二氧化碳与气温的拟合图
最后, 得到拟合方程为:
方程检验结果:
可决系数
标准误差
值
= 0.86226
= 0.10797
110.1421
4.0982
7.3525
由于>故经过了的检验。
经过以上拟合分析与检验分析, 我们得知虽在多因素检验过程中, 二氧化碳排放量对其气温变化不是很明显, 但单独考虑时, 它们两者间的关系应该说还是比较明显的, 这也同时弥补了关联度分析时考虑所带来的误差; 同时也在数据关系层面证实了二氧化碳与气温变化间或多或少存在相关联系; 同时也必须承认气温变化所考虑的因素还有很多很多这个事实。
8.气候变暖损失的定量估计
9.气候变暖的对策评价及建议
【参考文献】
【1】
【2】
展开阅读全文