收藏 分销(赏)

基于马尔科夫链对全国粮食产量的预测毕业论文.doc

上传人:可**** 文档编号:3045033 上传时间:2024-06-14 格式:DOC 页数:15 大小:154.50KB 下载积分:10 金币
下载 相关 举报
基于马尔科夫链对全国粮食产量的预测毕业论文.doc_第1页
第1页 / 共15页
基于马尔科夫链对全国粮食产量的预测毕业论文.doc_第2页
第2页 / 共15页


点击查看更多>>
资源描述
摘要 本文主要是运用应用随机过程中的马尔科夫链,通过它的马尔可夫性也就是无后效:通过即要确定过程将来的状态,知道它此时的情况就够了,并不需要对它以往状态的认识。 利用马尔可夫链模型,结合实际数据构建二次规划模型,运用Excel与MATLAB统计软件对转移概率矩阵进行了估计和预测,并对从1982年到2012的全国粮食产量进行划分状态,即求出它的转移概率矩阵,然后对以后的年份所处的状态进行预测和分析,也就是N步转移概率矩阵,然后在对2013年的数据进行比对,看是是否正确等 关键词:马尔科夫链模型 MATLAB 无后效性 转移概率矩阵 目 录 1基本模型与研究思路 1 1.1马尔可夫链模型说明 1 1.2研究思路 2 2模型设计 4 2.1马尔科夫链定义模型 4 2.2 n步转移概率,C-K方程 5 3实际问题的马尔科夫求解 6 3.1 6 3.2 7 3.3 8 4 结论分析 10 参考文献 11 1基本模型与研究思路 1.1马尔可夫链模型说明和随机过程 在当代科学与社会的广阔天地里,人们都可以看到一种叫作随机过程的数学模型:从银河亮度的起伏到星系空间的物质分布、从分子的布朗运动到原子的蜕变过程,从化学反应动力学到电话通讯理论、从谣言的传播到传染病的流行、从市场预测到密码破译,随机过程理论及其应用几乎无所不在。 一些特殊的随机过程早已引起注意,例如1907年前后,Α.Α.马尔可夫研究过一列有特定相依性的随机变量,后人称之为马尔可夫链(见马尔可夫过程);又如1923年N.维纳给出了布朗运动的数学定义(后人也称数学上的布朗运动为维纳过程),这种过程至今仍是重要的研究对象。虽然如此,随机过程一般理论的研究通常认为开始于30年代。1931年,Α.Η.柯尔莫哥洛夫发表了《概率论的解析方法》;三年后,Α.Я.辛钦发表了《平稳过程的相关理论》。这两篇重要论文为马尔可夫过程与平稳过程奠定了理论基础。稍后,P.莱维出版了关于布朗运动与可加过程的两本书,其中蕴含着丰富的概率思想。1953年,J.L.杜布的名著《随机过程论》问世,它系统且严格地叙述了随机过程的基本理论。1951年伊藤清建立了关于布朗运动的随机微分方程的理论(见随机积分),为研究马尔可夫过程开辟了新的道路;近年来由于鞅论的进展,人们讨论了关于半鞅的随机微分方程;而流形上的随机微分方程的理论,正方兴未艾。60年代,法国学派基于马尔可夫过程和位势理论中的一些思想与结果,在相当大的程度上发展了随机过程的一般理论,包括截口定理与过程的投影理论等,中国学者在平稳过程、马尔可夫过程、鞅论、极限定理、随机微分方程等方面也做出了较好的工作。马尔可夫链可以对动态变化的随机现象进行预测,但应用马尔可夫链进行预测需要满足两个假设,即马尔可夫性。其一是无后效性,就是将来的状态只与现在的状态有关,与过去无关。将来t+1时刻状态仅依赖于第t时刻状态的分布,与过去t-1, t-2,,时刻的状态分布及转移状态无关。其二是转移概率稳定性,即马尔可夫理论以固定的转移概率矩阵为基本规律和特征[1],要求转移概率矩阵具有相对稳定性[2]。在长期预测中,转移概率矩阵很难保持不变,因而马尔可夫链预测比较适合短期预测。 通过对市场现象的大量观察发现,同类商品的市场占有率分布是一个随时间不断变化的随机过程,并且当期市场占有率只与前一期的市场占有率有关,而与再远期的市场占有率关联甚微[3],市场占有率的这一特性与马尔可夫链的无后效性相吻合。经过多年的发展,移动通信市场也基本服从这一规律,尤其从移动客户对运营商选择的心理来看,移动客户选择运营商通常依据其对当前各家运营商的评价,而与再远期的评价关系愈来愈小。另外,马尔可夫的转移概率稳定性包含了对研究期市场和移动客户偏好稳定的特殊要求,而根据移动客户的消费习惯,在运营商的市场政策、政府的监管政策没有特殊变化的情况下,由于移动客户通常存在较高的转网成本,因此维持现有转移概率的可能性较大。 本文应用的马尔可夫链是状态集和时间集均为离散的齐次马尔可夫过程。 若已知马尔可夫链的一步转移概率矩阵和初始分布,就可得到绝对分布,假设初始市场占有率为S(0)=(s1(0), s2(0),,, sN(0)),转移概率矩阵为P,则m个周期后的市场占有率为: S(m)=S(0)Pm=S(m-1)P(1) 1.2研究思路和马尔科夫过程的发展 20世纪50年代以前,研究马尔可夫过程的主要工具是微分方程和半群理论(即分析方法);1936年前后就开始探讨马尔可夫过程的轨道性质,直到把微分方程和半群理论的分析方法同研究轨道性质的概率方法结合运用,才使这方面的研究工作进一步深化,并形成了对轨道分析必不可少的强马尔可夫性概念。1942年,伊藤清用他创立的随机积分和随机微分方程理论来研究一类特殊而重要的马尔可夫过程──扩散过程,开辟了研究马尔可夫过程的又一重要途径。   出于扩大极限定理应用范围的目的,马尔科夫在20世纪初开始考虑相依随机变量序列的规律,并从中选出了最重要的一类加以研究。1906年他在《大数定律关于相依变量的扩展》一文中,第一次提到这种如同锁链般环环相扣的随机变量序列,其中某个变量各以多大的概率取什么值,完全由它前面的一个变量来决定,而与它更前面的那些变量无关。这就是被后人称作马尔科夫链的著名概率模型。也是在这篇论文里,马尔科夫建立了这种链的大数定律。   用一个通俗的比喻来形容,一只被切除了大脑的白鼠在若干个洞穴间的蹿动就构成一个马尔科夫链。因为这只白鼠已没有了记忆,瞬间而生的念头决定了它从一个洞穴蹿到另一个洞穴;当其所在位置确定时,它下一步蹿往何处与它以往经过的路径无关。这一模型的哲学意义是十分明显的,用前苏联数学家辛钦(1894-1959〕的话来说,就是承认客观世界中有这样一种现象,其未来由现在决定的程度,使得我们关于过去的知识丝毫不影响这种决定性。这种在已知“现在”的条件下,“未来”与“过去”彼此独立的特性就被称为马尔科夫性,具有这种性质的随机过程就叫做马尔科夫过程,其最原始的模型就是马尔科夫链。   这既是对荷兰数学家惠更斯(Ch. Huygens, 1629-1659)提出的无后效原理的概率推广,也是对法国数学家拉普拉斯(P. S. Laplace, 1749-1827)机械决定论的否定。   这里应该指出,尽管拉普拉斯对概率论的早期发展作出过重大贡献,但是他的部分哲学观点是不利于这门学科的深入发展的。十八世纪以来,随着牛顿力学的彻底胜利,一种机械唯物主义的决定论思潮开始在欧洲科学界蔓延,鼓吹最力者就是拉普拉斯。1759年他在巴黎高等师范学院发表了一篇题为《概率论的哲学探讨》的演讲,淋漓尽致地表达出了这种思想。他说:“假如有人知道了某一时刻支配自然的一切力,以及它的一切组成部分的相对位置,又假如他的智力充分发达,能把这一切数据加以充分的分析,把整个宇宙中从最巨大的天体到最微小的原子的一切运动完全包括在一个公式里面,这样对他就没有什么东西是不确定的了,未来也好,过去也好,他都能纵览无遗。”1812年,拉普拉斯又进一步提出“神圣计算者”的观念,认为这个理想的数学家只须知道世界某一时刻的初始状态,就可以从一个无所不包的微分方程中算出过去和未来的一切状态。换句话说,他认为任意系统在 t > t0时的状态 x可由其初始时刻 t0和初始状态 x0唯一决定。这可真是笔判终身、细评流年,数学家可以摆个卦摊了。马尔科夫的概率模型从根本上否定了系统中任一状态 x与其初始状态 x0之间的因果必然性,从而也否定了“神圣计算者”的神话。   还应该指出,马尔科夫所建立的概率模型不但具有深刻的哲学意义,而且具有真实的物质背景,在他的工作之前或同时,一些马尔科夫链或更复杂的随机过程的例子已出现在某些人的研究中,只不过这些人没有自觉地认识到这类模型的普遍意义或用精确的数学语言表述出来罢了。例如苏格兰植物学家布朗 ( R. Brown, 1773-1858) 于1827年发现的悬浮微粒的无规则运动、英格兰遗传学家高尔顿(F.Galton, 1822-1911) 于1889年提出的家族遗传规律、荷兰物理学家埃伦费斯特 ( P. Ehrenfest, 1880-1933) 于1907年关于容器中分子扩散的实验,以及传染病感染的人数,谣言的传播,原子核中自由电子的跃迁,人口增长的过程等等,都可用马尔科夫链或过程来描述。也正是在统计物理、量子力学、遗传学以及社会科学的若干新课题、新事实面前,决定论的方法显得百孔千疮、踵决肘见。   有趣的是,马尔科夫本人没有提到他的概率模型在物理世界的应用,但是他利用了语言文学方面的材料来说明链的性质。在《概率演算》第四版中,他统计了长诗《叶甫盖尼·奥涅金》中元音字母和辅音字母交替变化的规律:这是长诗开头的两句,意为:“我不想取悦骄狂的人生,只希望博得朋友的欣赏。”诗人那火一般的诗篇在数学家那里变成了一条冷冰冰的锁链:在这条锁链上只有两种链环,C代表辅音、 代表元音(为了使问题简化起见,不仿把两个无音字母算作辅音)。马尔科夫分别统计了在C后面出现C和 的概率p和1-p,以及在 后出现C和 的概率q和1-q,把结果与按照俄语拼音规则计算出的结果进行比较,证实了语言文字中随机的(从概率的意义上讲)字母序列符合他所建立的概率模型。   完成了关于链的大数定律的证明之后,马尔科夫又开始在一系列论文中研究链的中心极限定理。1907年他在《一种不平常的相依试验》中证明了齐次马尔科夫链的渐近正态性;1908年在《一个链中变量和的概率计算的极限定理推广》中作了进一步的推广;1910年他发表了重要的论文《成连锁的试验》,在其中证明了两种情况的非齐次马尔科夫链的中心极限定理。与此同时他在一些假定的前提下证明了模型的各态历经性,成为在统计物理中具有重要作用的遍历理论中第一个被严格证明的结果。遍历理论亦称ergodic理论, 是奥地利物理学家玻耳兹曼(L. Boltzmann, 1844-1906) 于1781年提出来的,其大意是:一个系统必将经过或已经经过其总能量与当时状态相同的另外的任何状态。   马尔科夫链的引入,在物理、化学、天文、生物、经济、军事等科学领域都产生了连锁性的反应,很快地涌现出一系列新的课题、新的理论和新的学科,并揭开了概率论中一个重要分支--随机过程理论蓬勃发展的序幕 如果可以确定粮食来年状态的所有可能状态及其初始分布,进而确定变量的状态转移概率[4],建立马尔可夫预测模型,根据模型求出绝对分布,就可预测短期的粮食状态。其中转移概率矩阵是马尔可夫链理论预测的核心问题[5],但实际情况中,并不总是能从市场调查直接得到转移概率矩阵。本文采用二次规划模型,结合实际数据求解转移概率矩阵。过去,该方法计算过程较为复杂,有时手工计算难以完成,难以将其推广应用;也有些学者利用LINGO软件进行求解,但通用性不强,针对每个问题都必须重新编程,对于没有计算机编程基础的预测者而言并不实用[6]。因此本文应用内置于Office产品Excel中的规划求解工具实现马尔可夫转移矩阵计算,不仅操作简便通用,而且可大大提高预测工作的效率和准确度。 2.1马尔科夫链定义模型 随机过程{}称为马尔科夫链,若它只可以取有限或可列个值,并对任意状态有: 在上式中 表示过程 处状态 ,称为{0,1,2,…}为该过程的状态空间,记为S。 当马尔科夫链的转移概率 只与 有关,而与n无关时,称为齐次马尔科夫链,否则称为非齐次。 其中pij为状态i到状态j的转移概率。 我们将 排成一个矩阵的形式,令 P= 称P为转移概率矩阵,一般简称为转移矩阵,由于概率非负,且过程必须从一过程转移到另一过程,所以有: (1) (2) 2.2 n步转移概率,C-K方程 称条件概率 为马尔科夫链的n步转移概率,相应地称 为n步转移概率矩阵。 对一切 有 (1) (2) 3.实际问题的马尔科夫预测 例如,考虑中国几十年的粮食产量分为三个状态,即“丰收”、“平收”和“欠收”。记E1为“丰收”状态,E2为“平收”状态,E3为“欠收”状态。下图给出了全国1982~2012年期间全国粮食产量的状态变化情况,1981年的全国粮食总产量为32502(单位:万吨) 年份 粮食产量 增长速度 状态       1982年: 35450  8.32%丰  E1 1983年: 38728  8.46%丰  E1 1984年: 40731  4.92%  E2 1985年: 37911 -7.44%欠  E3 1986年: 39151  3.17%   E2 1987年: 40473  3.27%   E2 1988年: 39404 -2.71%   E2 1989年: 40755  3.31%   E2 1990年: 44624  8.67%丰  E1 1991年: 43529 -2.52%  E2 1992年: 44266  1.66%   E2 1993年: 45649  3.03%   E2 1994年: 44510 -2.56%   E2 1995年: 46662  4.61%  E2  1996年: 50454  7.52%丰  E1 1997年: 49417 -2.10%   E2 1998年: 51230  3.54%   E2 1999年: 50839 -0.77%   E2 2000年: 46218 -10.00%重欠 E3 2001年: 45262 -2.11%   E2 2002年: 45711  0.98%   E2 2003年: 43067 -6.14%欠  E3 2004年: 46947  8.26%丰  E1 2005年: 48401  3.00%  E2 2006年: 49746  2.70%   E2 2007年: 50150  0.81%   E2 2008年: 52850  5.11%   E1 2009年: 53082  0.44%   E2 2010年: 54641  2.85%   E2 2011年: 57121  4.34%   E2 2012年: 58957  3.11%   E2 3.1首先计算状态转移概率矩阵 假定某一个事件的发展过程有n个可能的状态,即E1,E2, …,En。记为从状态转变为状态的状态转移概率,则矩阵 从表3.7.1中可以知道,在6个从E1出发(转移出去)的状态中,有1个是从E1转移到E1,有5个是从E1转移到E2,有0个是从E1转移到E3, 所以 按照上述同样的办法计算可以得到  所以,中国粮食产量的状态转移概率矩阵为 E2 E1 0.167 0.136 0.728 0.833 0 0.136 0.667 E3 0.333 0 3.2进行预测计算 状态概率表示事件在初始(k=0)状态为已知的条件下,经过k次状态转移后,在第k 个时刻(时期)处于状态的概率。根据概率的性质,显然有 从初始状态开始,经过k次状态转移后到达状态这一状态转移过程,可以看作是首先经过(k-1)次状态转移后到达状态,然后再由经过一次状态转移到达状态。根据马尔可夫过程的无后效性及Bayes条件概率公式,有: 若记行向量,则由(3.7.7)式可以得到逐次计算状态概率的递推公式: 式中:为初始状态概率向量。 3.3利用Matlab编程进行马尔可夫预测计算 以1982年的农业收成状态为初始状态,预测今后年(即2013-2018) >> p=[0.167 0.833 0;0.136 0.728 0.136;0.333 0.667 0]; for i=1:1:6 y=p^i end y = 0.1670 0.8330 0 0.1360 0.7280 0.1360 0.3330 0.6670 0 y = 0.1412 0.7455 0.1133 0.1670 0.7340 0.0990 0.1463 0.7630 0.0907 y = 0.1627 0.7359 0.1014 0.1607 0.7395 0.0998 0.1584 0.7378 0.1038 y = 0.1610 0.7389 0.1001 0.1606 0.7388 0.1006 0.1614 0.7383 0.1003 y = 0.1607 0.7388 0.1005 0.1608 0.7387 0.1005 0.1608 0.7388 0.1004 y = 0.1608 0.7387 0.1005 0.1608 0.7388 0.1005 0.1608 0.7388 0.1005 >>p=[0.167 0.833 0;0.136 0.728 0.136;0.333 0.667 0]; >> x=[1 0 0]; >> for i=1:1:6 y=x*p^i end y = 0.1670 0.8330 0 y = 0.1412 0.7455 0.1133 y = 0.1627 0.7359 0.1014 y = 0.1610 0.7389 0.1001 y = 0.1607 0.7388 0.1005 y = 0.1608 0.7387 0.1005 4.结论分析 从求解的结果可以看出,既有2013年到2018年的转移概率矩阵,也有2013年到2018年的每年所处状态的概率分布,下面就拿2013年的转移概率矩阵来解说一下:从这中可知 y = 0.1670 0.8330 0 0.1360 0.7280 0.1360 0.3330 0.6670 0 在这三个状态(E1,E2,E3)中,无论是一转移到二的概率为0.8330,还是二到一的概率为0.1360,一到三的概率为0还是三到一概率0.3330,二到三的概率为0.1360,还是三到二的概率为0.6670, 都是转移到二状态的概率占明显优优势,而加上它在2013年的状态二所处的概率为83.3%,有理由说2013年的粮食产量处于二状态,而2013年实际粮食产量为60193.5万吨,环比增长2.1%,及属于平收(状态二)2014年全国粮食总产量60709.9万吨,比2013年增加516万吨,增长0.9%,处于二状态,2015年全国粮食总产量62143.5万吨 同比增长2.4%, 产量状态 年份 2013 2014 2015 2016 2017 2018 预测 二 二 二 二 二 二 实际 二 二 二 从预测结果可以看出,对于13 年,14年,15年的全国粮食产量的预测都是比较准确的,因此可以推断出在以后的三年内我国的粮食产量不会有比较大的起伏 ,会在固定在一个平稳的低速增长速度, 参考文献 [1]吴育华,杜纲.管理科学基础[M].修订版.天津:天津大学出版社, 2008. [2]张波,商豪.应用随机过程,中国人民大学出版社,2014 13
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服