资源描述
○ A 基础理论
● B 应用研究
○ C 调查报告
○ D 其他
本科生毕业设计(论文)
马氏链模型及其一些应用
二级学院
:
专 业
:
年 级
:
学 号
:
作者姓名
:
指导教师
:
完成日期
:
2013年5月10日
目录
1 马氏链模型的思想原理 1
1.1 马氏链模型的简介 1
1.2马氏链模型的基本原理 1
2 马氏链模型的两个应用 3
2.1 马氏链模型在广东各城市人均GDP中的应用 3
2.1.1 人均GDP类型划分 3
2.1.2 年份的状态转移矩阵 6
2.2 马氏链模型在教育评价中的应用 8
3 评价与改进 12
参考文献..............................................................................................................................13
马氏链模型及其一些应用
摘 要:本文给出马氏链模型在预测广东各城市人均GDP以及在教育评价中的应用.首先将人均GDP情况分为5种状态,然后根据往年人均GDP的数据,建立马氏链模型,对10年后人均GDP进行科学分析和预测;利用两班两次考试成绩应用马氏链模型分析法分析两班的教学效果.
关键词:马氏链模型;人均GDP;教育评价;概率转移矩阵
Markov chain model and its some applications
Abstract:This article give a markov chain model in the prediction of guangdong cities GDP per capita and the application of education evaluation. GDP per capita is first divided into five kinds of state, and then according to the data of the GDP per capita in the previous years, markov chain model is established, scientific analysis and projections for GDP per person 10 years from now; Twice with two class exam results using markov chain model analysis, the analysis of two class teaching effect.
Key words:Markov chain model;GDP per capita;Education evaluation;The transfer matrix of probability
1 马氏链模型的思想原理
1.1 马氏链模型的简介
在考察有随机因素影响的动态系统时,常常碰到这样的情况:系统在每个时期所处的状态是随机的.从这个时期到下个时期的状态按照一定的概率进行转移,并且下个时期的状态只取决于这个时期的状态和转移概率,与以前各时期的状态无关.这种性质称为无后效性,或马尔可夫(Markov)性,通俗地说就是:已知现在,将来与历史无关.具有无后效性的,时间、状态均为离散的随机转移过程通常用马氏链(Markov Chain)模型描述.马氏链模型在经济、教育、社会、生态、遗传等许多领域有着广泛的应用.
1.2 马氏链模型的基本原理
按照系统的发展,时间离散化为,对每个,系统的状态用随机变量表示.设可以取k个离散值且记即状态概率,从到的概率记即转移概率.如果的取值只取决于的取值及转移概率.而与的取值无关.那么这种离散状态按照离散时间的随机转移过程称为马氏链.由状态转移的无后效性和全概率公式可以写出马氏链的基本方程为
……………………………………(1)
并且和应满足
……………………………………(2)
……………………………………(3)
……………………………………(4)
引入状态概率向量(行向量)和转移概率矩阵
……………………………………(5)
(3)式表明转移矩阵是非负阵,(4)式表示的行和为1,称为
随机矩阵.
定义1:一个有k个状态的马氏链如果存在正整数使从任意状态经次转移都以大于零的概率到达状态则称为正则链.
用下面的定理容易检验一个马氏链是否为正则链.
定理1:若马氏链的转移矩阵为.则它是正则链的充要条件是:存在正整数使(指的每一元素大于零).
定理2:正则链存在惟一的极限状态概率使得当状态概率与初始状态概率无关.又称为稳态概率,满足
……………………………………(6)
……………………………………(7)
定理3:设P是一个马氏链转移矩阵(的行向量是概率向量),是初始分布行向量,则第步的概率分布为
……………………………………(8)
2 马氏链模型的两个应用
2.1 马氏链模型在广东各城市人均GDP中的应用
为了了解广东各城市发展水平和发展趋势,逐步消除各城市发展不均衡以此来促进经济协调发展.因此,本文应用马氏链优化模型来确定广东22个城市人均GDP的变化规律,并对其进行预测及分析.
2.1.1 人均GDP类型划分
判断一个地区的发展程度重要的指标就是人均GDP,根据《1990年世界发展报告》中的分类标准可以将各国家(城市)人均GDP划分为贫穷、温饱、小康、富裕和发达五种类型.针对广东现实状况,按照下面的标准划分为五种类型:
-贫穷(人均GDP在0美元~300美元);
-温饱(人均GDP在300美元~800美元);
-小康(人均GDP在800美元~1500美元);
-富裕(人均GDP在1500美元~3000美元);
-温饱(人均GDP在3000美元以上).
因为人均GDP具备了“无后效性”这个特点,所以可以看成是一个以{,,,,}为状态空间的马氏链.
由广东的年鉴表可以查到广东2005~2010年各城市的GDP如表1.
表1 广东2005~2010年各城市的GDP(元)
年份
城市
2005
2006
2007
2008
2009
2010
广州
53809
62495
69673
76440
79383
87458
深圳
60801
68441
76273
83431
84147
94296
珠海
45320
52189
61303
66798
68042
77888
汕头
12883
14459
16483
18634
19982
22776
佛山
42066
50394
59329
68033
71691
80313
顺德
423825
51127
59407
68605
72881
81154
韶关
11608
13875
16607
19258
20245
24505
河源
7483
9222
11847
14127
14163
16301
梅州
7670
8474
9940
11539
12453
14554
惠州
21909
24503
28288
31748
33142
38650
汕尾
7419
8492
10062
11938
13336
15845
东莞
33287
39173
45057
50471
48988
52798
中山
36435
42286
48441
52921
54156
60797
江门
19546
22858
26225
29910
30999
35622
阳江
12717
14845
17241
20340
22260
26676
湛江
12729
14804
16713
19774
16708
20161
茂名
12729
14804
16713
19774
20847
25496
肇庆
11890
13626
16441
20041
22554
27987
清远
9079
11939
16540
21001
23468
29487
潮州
11215
12681
14601
16960
18381
21107
揭阳
7417
8500
10217
12539
14075
17264
云浮
8664
9843
11776
13889
14741
17074
针对《1990年世界发展报告》中的标准当时是由人民币对美元按照1:8的汇率换算,将表1的数据转换为以美元为单位,由此得到表2.
表2 广东2005~2010年各城市的GDP(美元)
年份
城市
2005
2006
2007
2008
2009
2010
广州
6726.125
7811.875
8709.125
9555
9922.875
10932.25
深圳
7600.125
8555.125
9534.125
10428.875
10518.375
11787
珠海
5665
6523.625
7662.875
8349.75
8505.25
9736
汕头
1610.375
1807.375
2060.375
2329.25
2497.75
2847
佛山
5258.25
6299.25
7416.125
8504.125
8961.375
10039.125
顺德
52978.125
6390.875
7425.875
8575.625
9110.125
10144.25
韶关
1451
1734.375
2075.875
2407.25
2530.625
3063.125
河源
935.375
1152.75
1480.875
1765.875
1770.375
2037.625
梅州
958.75
1059.25
1242.5
1442.375
1556.625
1819.25
惠州
2738.625
3062.875
3536
3968.5
4142.75
4831.25
汕尾
927.375
1061.5
1257.75
1492.25
1667
1980.625
东莞
4160.875
4896.625
5632.125
6308.875
6123.5
6599.75
中山
4554.375
5285.75
6055.125
6615.125
6769.5
7599.625
江门
2443.25
2857.25
3278.125
3738.75
3874.875
4452.75
阳江
1589.625
1855.625
2155.125
2542.5
2782.5
3334.5
湛江
1591.125
1850.5
2089.125
2471.75
2088.5
2520.125
茂名
1591.125
1850.5
2089.125
2471.75
2605.875
3187
肇庆
1486.25
1703.25
2055.125
2505.125
2819.25
3498.375
清远
1134.875
1492.375
2067.5
2625.125
2933.5
3685.875
潮州
1401.875
1585.125
1825.125
2120
2297.625
2638.375
揭阳
927.125
1062.5
1277.125
1567.375
1759.375
2158
云浮
1083
1230.375
1472
1736.125
1842.625
2134.25
将广东22个城市2005~2010年人均GDP的数据为依据建立马氏链模型.由表2可以看出广东2005~2010年各城市的人均GDP均超过了温饱水平,故将广东各城市的人均GDP划分为下面三种类型:
-小康(人均GDP在800美元~1500美元);
-富裕(人均GDP在1500美元~3000美元);
-温饱(人均GDP在3000美元以上).
按照上述四种类型的分类标准,表3给出了广东各城市2005~2010年人均GDP的状态个数的数据.
表3 广东各城市2005~2010年人均GDP的状态个数
年份
类型
2005
2006
2007
2008
2009
2010
9
6
5
2
0
0
6
8
8
11
13
8
7
8
9
9
9
14
2.1.2 年份的状态转移矩阵
根据各年的状态数量变化情况,得到了2005~2006年状态转移数量,如表4,通过观察可以发现,有个9从出发(转移出去)的状态中,有6个是从转移到的,有3个是从转移到,所以
表4 广东各城市2005~2006年状态转移情况
本期状态
下期状态
6
3
0
0
5
1
0
0
7
由此计算方法可以得到2005~2006年的概率转移矩阵
同理可以得到2006~2007年,2007~2008年,2008~2009年,2009~2010年的状态转移矩阵
为减少随机误差,增加一步转移矩阵计算的可信度和准确性,取状态转移矩阵的平均值,通过matlab计算可以得到一步转移矩阵:
假设在期间没有发生如战争、天灾、疾病等严重影响经济发展的外因,那么对于上述状态转移阵求极限,极限的结果必然最后各城市的人均GDP类型变为(发达地区).因此,利用马氏链模型来预测未来十年后的各地区的人均GDP情况.
现取2005~2010年广东各城市的人均GDP地区类型数平均值为初始地区类型数.
根据定理3,利用步转移矩阵得到10年后的人均GDP的情况:
由此可知:10年后广东省贫困和温饱情况下的城市皆为0个,小康情况下的城市为0.0002个,富裕情况下的城市为2.8476个,发达情况下的城市为17.9683个.这些预测结果是在假设在没有扰动的情况下进行预测的,按照目前稳定的经济发展状况,10年广东省大多城市从现在的小康社会步入到比较富裕和发达的社会,这是符合马氏链模型概率转移矩阵求极限即经过无数次转移后广东各城市成为发达地区类型的规律.
但是本次预测是基于不出现重大自然灾害、战争和金融危机的假设下进行的,而且马尔科夫链的预测仅适用于短期预测,因此具有一定的局限性.
2.2 马氏链模型在教育评价中的应用
在教育教学评价中,利用马氏链模型进行评价,通过分析学生两次测试的不同成绩等级的变化,根据学生的“进步度”来把握整体的进步情况,以此来评定教学效果的好坏更为科学、客观.
将学生成绩分为五个等级,即优秀、良好、中等、及格、不及格.计算方法为:90分以上(含90分)为优秀,80~89分(含80分)为良好,70~79分(含70分)为中等,60~69分(含60分)为及格,60分以下为不及格.建立如下模型:
1、 定义1:其中为的转移进步度,为的权重.值的大小和正负表示进步或退步的程度,指数“3”是用来调节正负和权重大小.
2、 定义2:为转移矩阵的进步矩阵.
3、 定义3:为转移矩阵的效率度.
现在选取湛江师范学院09数本2班以及09统计1班两学期数学分析的成绩作为样本数据,记9数本2班、9统计1班分别为A、B班.第一学期结束时进行测试,作为初始状态,第二学期,经过教师一个学期的教学过程,教学效果有所转变,学期末进行第二次测试,作为转移后的状态.
通过统计可以看到A、B两个班学生成绩情况如附录1,由于B班的人数比A班多一人为便于统计、分析去掉B班学号排在最后一名同学的成绩,对总体评估效果影响忽略不计.然后统计一步转移之后转移频数和各状态的频数如表5、表6.
表5 A班各成绩等级之间的一步转移频数
状态
转移频数
优秀
良好
中等
及格
不及格
优秀
8
18
4
4
0
良好
1
1
3
0
0
中等
0
0
1
0
0
及格
0
0
0
0
0
不及格
0
0
0
0
0
表6 B班各成绩等级之间的一步转移频数
状态
转移频数
优秀
良好
中等
及格
不及格
优秀
5
5
1
4
1
良好
0
2
5
5
0
中等
0
0
2
3
0
及格
0
0
1
3
2
不及格
0
0
0
1
1
经过计算可以得到A、B两班第二次的平均成绩分别为:82.525,69.048.不能就此认定A班的教学效果优于B班,因为这样的计算方法没有充分考虑到两个班学生基础原有的差异,A班为选拔成绩较好的学生组成的课改实验班,学习成绩总体要比B班好,显然单纯比较平均分是不够客观不够科学的.必须要利用能反应总体进步情况的因素来评估,这里用马氏链模型来分析正好符合这一特点.设第一次测验后各等级水平的学生人数分别为;第二次测验后,原来90分以上学生成绩的名学生中,仍保持者有人,下降为80~89分者有人,下降70~79分为人,下降为60~69分为人,下降为60~69分为人,可得出第一次考试成绩在90分以上的学生的成绩转移情况.同理,可求其他各等级转移情况分别为、、、.根据表5可以计算出各两班等级概率转移矩阵、.
从而利用定义2可以求出、的进步矩阵
由定义3可得、的效率值分别为:、.
从模型直观上看,假如教学效率高,总体上学生进步大,那么其效率值就越大.因为A、B两班的效率值都是负数,说明两班的第二学期的成绩相比上学期是退步的,这是由于多方面的因素造成的,可能第一学期学生刚上大学学习热情高,努力程度相比第二学期较高,花时间在学习上也多,而第二学期则有放松的状态,学习时间有所减少;也有可能是由于试题的难度有所差异造成的.但由于
即A班的效率值大于B班,由此说明A班的教学效果明显比A班好.
在教学评价过程中,由于学生的来源差别大,基础有所不同,因此仅依学生成绩直接评价教师教学效果的好坏是不够合理的.而马氏链模型评估模型则充分考虑到了整个教学过程的变化,着重考虑系统未来发展下去的趋势,而对过去的状态不予以考虑,因此更加公平、公正.
3 评价与改进
本文主要介绍了研究马氏链模型的意义、基本概念,根据这些预备知识基础上结合马氏链模型的基本原理,借助实例对马氏链模型的有关方法进行预测和分析,得出结论,做出评价.能合理地预测出未来的人均GDP的变化,能利用马尔可夫链理论进行发展性评价研究的优越性和客观性.由于本人的能力有限,在许多方面并不让做到很完美,如在预测广东各城市历年的人均GDP,找数据时,只能找到2005~2010年的数据,数据不够完善,对结果有一定的影响.而且在确定基础矩阵时只是选取平均矩阵作为基础矩阵,若能将矩阵优化后作为基础矩阵,结果可能会更科学,又由于影响10年后的人均GDP有很多的不确定因素,本文给以不考虑,若能做扰动分析会更合理;在教育评价中,仅根据进步效率值来做出评价还是比较片面,若能综合其他因素会更好.
参考文献
[1] 姜启源.数学模型[M].北京:高等教育出版社,2008:333-341.
[2] 吴建国.数学建模案例精编[M]. 北京:中国水利水电出版社,2005:5-50.
[3]湛江师范学院2004届本科优秀毕业论文选编[M]. 湛江:湛江师范学院教务处编,2004:127-131.
[4] 肖振宇, 王煊. 中国各地区人均GDP的马尔可夫预测及变动分析[J]. 西北农林科技大学学 报(社会科学版), 2004:1-6.
[5]朱孔来.应用马尔可夫链预测粮食产量[J].农业系统科学与综合研究,1990:50~53.
[6] 温海彬.马尔可夫链预测模型及一些应用[J/OL]2012[2012-1-20].
[7] 程向阳.马尔可夫链模型在教育评估中的应用[J/OL]. 大学数学, 2007(2012-2-10).
[8]R.Hulst.On the Dynamics of Vegetation, Markov Chains as Models of Succession[J].Vegetation,1979,40(1):3-14.
13
展开阅读全文