资源描述
,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,S5.NUDT,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考!,数学建模中预测方法,1/130,1,历届CUMCM数据预测题目,A题 SARS传输问题,年 A题 长江水质评价和预测问题,20 B题 艾滋病疗法评价及疗效 预测问题,20 A题中国人口增加预测问题,20 D题“会议筹备”对与会人数确实定,2010 B题 上海世博会影响力 相关数据预测,2/130,2,一、预测概念,系统预测:依据系统发展改变,实际,数据和,历史,资料,利用当代,科学,理论和方法,以及各种经验、判断和知识,对事物在,未来,一定时期内可能改变情况,进行推测、预计和分析。,几个问题,三六九,出门走。,早霞不出门,晚霞行千里。,3/130,3,预测特点,科学性:据统计资料和当前信息,利用一定程序、方法和模型,分析预测对象与相关原因相互联络,而揭示预测对象特征和改变规律。,近似性:受许多随机原因影响,事前预测结果,往往与未来实际发生结果有一定偏差。,不足:对预测对象认识常受知识、经验、观察和分析能力限制,又掌握资料和信息不够准确完整,或建模时简化等,造成预测分析不够全方面。,一、预测概念,4/130,4,依据预测内容:科学预测、技术预测、社会预测、经济预测、军事预测,依据预测期限:短期预测(1年内)、中期预测(25年)、长久预测(5及以上),依据预测性质:定性预测、定量预测、综合预测,预测分类,一、预测概念,5/130,5,预测技术种类繁多,据统计有150各种。其中广泛采取有1520种。,定性预测方法,定量预测方法,时间序列分析,因果关系分析,移动平均,指数平滑,Box-Jenkins法,回归分析法,计量经济模型,状态空间分析,Markov预测,灰色系统模型,教授会议法/Delphi法,主观概率法,领先指标法,神经网络预测法,一、预测概念,6/130,6,预测普通步骤,一、预测概念,7/130,7,二、时间序列分析预测法,时间序列,:系统中某一变量或指标数值或统计观察值,按时间次序排列成一个数值序列,就称为,时间序列(Time Series),,又称,动态数据,。,年份,1990,1991,1992,1993,1994,1995,一季度,4.77,6.38,7.46,10.34,8.48,10.39,二季度,6.16,8.06,6.37,10.45,8.15,10.48,三季度,5.04,9.64,8.46,9.54,9.43,12.23,四季度,5.13,6.83,8.89,8.27,9.67,10.98,某市六年来汽车货运量(亿吨公里),8/130,8,二、时间序列分析预测法,系统预测中讨论时间序列,普通是某,随机过程,一个样本。经过对其分析研究,,找出动态过程特征、最正确数学模型、预计模型参数,并检验利用数学模型进行统计预测精度,,是时间序列分析内容。,年份,1990,1991,1992,1993,1994,1995,一季度,4.77,6.38,7.46,10.34,8.48,10.39,二季度,6.16,8.06,6.37,10.45,8.15,10.48,三季度,5.04,9.64,8.46,9.54,9.43,12.23,四季度,5.13,6.83,8.89,8.27,9.67,10.98,某市六年来汽车货运量(亿吨公里),9/130,9,二、时间序列分析预测法,某市六年来汽车货运量,10/130,10,时间序列特征:,趋势性T,:总体上连续上升或下降总改变趋势,其间变动幅度可能有时不等。,季节性S,:以一年为周期,四个季节呈某种周期性,各季节出现波峰和波谷规律类似。,周期性C,:决定于系统内部原因周期性改变规律,又分短周期、中周期、长周期等几个。,不规则性I,:包含突然性和随机性变动两种。,二、时间序列分析预测法,任一时间序列可表示为几个变动不一样组合总结果,且可表示为:,加法模型:Y=T+S+C+I,乘法模型:Y=TSCI,11/130,11,二、时间序列分析预测法,某市六年来汽车货运量时间序列分解,趋势项,周期项,随机项,12/130,12,平滑预测法,包含,移动平均法,和,指数平滑法,两种,其详细是把时间序列作为随机变量,利用算术平均和加权平均方法做未来趋势预测。这么得到趋势线比实际数据点连线要平滑一些,故称平滑预测法。,趋势外推预测法,依据预测对象历史发展统计资料,拟合成预先指定某种时间函数,并用它来描述预测目标发展趋势。,平稳时间序列预测法,因为平稳时间序列随机特征不随时间改变,所以可利用过去数据预计该时间序列模型参数,从而能够预测未来。,二、时间序列分析预测法-,分类,13/130,13,二、时间序列分析预测法-,平稳时间序列,时序图检验,依据,平稳时间序列均值与方差为常数,性质,平稳序列时序图应该显示出该序列一直在一个常数值附近随机波动,而且波动范围有界、无显著趋势及周期特征,自相关图检验,平稳序列通常含有短期相关性,。该性质用自相关系数来描述就是伴随延迟期数增加,平稳序列自相关系数对很快地衰减向零。,纯随机性检验(白噪声检验),平稳性检验,14/130,14,AR(p)模型,MA(q)模型,ARMA(p,q)模型,平稳时间序列分析模型:ARMA模型全称是自回归移动平均(auto regression moving average)模型,它是当前最惯用,拟合平稳时间序列模型,。ARMA模型又可细分为AR模型、MA模型和ARMA模型三大类。,二、时间序列分析预测法,-,平稳时间序列,15/130,15,确定性时间序列分析(,平滑法,、,趋势外推拟正当),通常这种非平稳时间序列显示出非常显著规律性,比如有显著趋势或有固定改变周期。,随机性时间序列分析,(,ARIMA模型,),由随机原因造成非平稳时间序列,通常这种随机波动非常难以确定和分析。,经过差分法或适当变换使非平稳序列化成为平稳序列,。,在实际情况中,绝大部分序列都是非平稳,因而对非平稳序列分析更普遍、更主要,对应地各种分析方法也更多。通常包含以下两种方法:,二、时间序列分析预测法-,非平稳序列,非平稳序列分析法,16/130,16,ARIMA(Autoregressive Integrated Moving Average)模型,,差分自回归滑动平均模型(滑动也译作移动),又称求合自回归滑动平均模型。,ARIMA(p,d,q)中,AR是自回归,p为自回归项数;MA为滑动平均,q为滑动平均项数,,d为使之成为平稳序列所做差分次数(阶数),。,ARIMA(p,d,q)模型是ARMA(p,q)模型扩展。,二、时间序列分析预测法-,非平稳序列,17/130,17,Box-Jenkins法-时间序列分析法,18/130,18,例:建立国际航线旅客月度人数ARIMA模型。我们已经有一组1949年至1961年国际航线旅客月度人数144条统计。使用ARIMA过程进行建模和预测。其数据列于下表所表示。,二、时间序列分析预测法实例分析,YEAR,1,2,3,4,5,6,7,8,9,10,11,12,1949,112,118,132,129,121,135,148,148,136,119,104,118,1950,115,126,141,135,125,149,170,170,158,133,114,140,1951,145,150,178,163,172,178,199,199,184,162,146,166,1952,171,180,193,181,183,218,230,242,209,191,172,194,1953,196,196,236,235,229,243,264,272,237,211,180,201,1954,204,188,235,227,234,264,302,293,259,229,203,229,1955,242,233,267,269,270,315,364,347,312,274,237,278,1956,284,277,317,313,318,374,413,405,355,306,271,306,1957,315,301,356,348,355,422,465,467,404,347,305,336,1958,340,318,362,348,363,435,491,505,404,359,310,337,1959,360,342,406,396,420,472,548,559,463,407,362,405,1960,417,391,419,461,472,535,622,606,408,461,390,432,19/130,19,(1)绘制时序图,二、时间序列分析预测法实例分析,20/130,20,(2)对平稳性和季节性识别,对平稳性和季节性识别通常有时序图和自相关图两种方法,或二者结合起来一起判断。,时序图,是经过直接观察时间序列折线图来检验序列是否平稳。假如时间序列有某种趋势或展现出增加或降低范围扩散现象,则序列是不平稳。,自相关图。假如序列折线图并不显著地展现上述现象,而我们又无法直接判断序列终究平稳是否,通常能够利用,自相关图,来检测序列是否平稳。,二、时间序列分析预测法实例分析,21/130,21,二、时间序列分析预测法实例分析,22/130,22,(3)变换不平稳序列为平稳序列,假如时间序列呈线性趋势,均值不是常数,利用一阶差分将产生一个平稳序列。,假如时间序列呈二次趋势,均值不是常数,利用二阶差分将产生一个平稳序列。,假如时间序列展现出随时间上升或下降而偏差,方差不是常数,通常可利用取自然对数转化为平稳序列。,假如时间序列展现指数趋势,均值和方差都不是常数,通常也可利用取自然对数转化为平稳序列。,假如时间序列展现“相对环”趋势,通常将数据除以同时发生时间序列对应值转化为平稳序列。,二、时间序列分析预测法实例分析,23/130,23,a)取对数消除振幅变大趋势-线性增加趋势,二、时间序列分析预测法实例分析,24/130,24,b)需要对这个新序列数据再进行滞后一次(,消除增加,)和滞后12次(,消除季节,)共两次差分最终转换为平稳序列,(4),检验待选时间序列模型自相关函数,二、时间序列分析预测法实例分析,25/130,25,ACF图中,我们认为自相关系数在延迟1阶后都落入2倍标准差内,然后在延迟12阶处突然有一个较大自相关系数,紧接着又落入2倍标准差内,很象在1,12处截尾,26/130,26,(5)预计备选时间序列模型参数预计,(6)利用确定模型进行预测,二、时间序列分析预测法实例分析,27/130,27,1、定义,一元线性回归预测是处理因变量y与自变量x 之间线性关系回归预测法,其数学模型为:,其中a、b,称为回归系数,首先依据x、y,现有统计数据,在直角坐标系中作散点图,观察y随x而变是否为近似线性关系。若是,则求出式(7.4.1)中a、b值,就可确定其数学模型,然后由x未来改变去求对应y 值。,三、回归分析预测法-,一元线性回归,Y=a+bx,y,x,a,x,0,28/130,28,使拟合数值与实际值总方差为最小,即拟合程度最好,则得二者之差,e,i,依据极值原理,式(7.4.6)对a、b,分别求偏导,并令其=0,得,三、回归分析预测法-,一元线性回归,2、a、b确定方法最小二乘法,29/130,29,三、回归分析预测法-,一元线性回归,30/130,30,三、回归分析预测法-,一元线性回归,31/130,31,3、回归效果检验,y=a+bx,一定程度上反应了y与x之间统计线性相关关系,该关系是否亲密,决定了所采取线性预测模型多大程度上可信。这能够经过y与x相关系数r,xy,大小来确定。,三、回归分析预测法-,一元线性回归,32/130,32,3、回归效果检验,r,xy,取值(P136图7-7):,|,r,xy,|=1,样本点完全落在回归线上,y与x有完全线性关系;,0,r,xy,1,y与x有一定正线性相关关系,即y伴随x增加而成百分比倍数增加;,-1,r,xy,表中对应数字r,临界值,,表示x、y,间存在线性相关,预测模型可用。,33/130,33,4、简化算法,对含有类似等差时间序列关系统计数据进行预测时,,能够采取此法。,由计算a、b,式(7.4.2)、(7.4.3),发觉,若能使其中,x,i,=0,则计算a、b就会大大简化为,三、回归分析预测法-,一元线性回归,34/130,34,怎样使,x,i,=0?,当,x,i,为等差自然数列时,可引入“集中时间序列”即使等差序列呈对称形态。,在给,x,i,编号时能够这么处理:,(1)若,n为奇数,取x,i,时间间隔为1,将,x=0置于资料期,中央;,(2)若n为偶数,取x,i,时间间隔为2,将,x=-1(+1)置,于资料期中央上(下)期。,例7.4.1 某服装厂最近5年服装产量以下表所表示,请预,测该厂今明两年产量。,年份 倒5年 倒4年 倒3年 前年 去年 今年 明年,产量(万元),300 350 380 430 500?,三、回归分析预测法-,一元线性回归,法,35/130,35,解:以年份为自变量x,i,,产量为因变量y,i,,在直角坐标系中画,散点图后发觉y、x之间基本上呈线性关系,故可用一元线性,回归方法进行预测。,此处n=5为奇数,所以可列下表整理资料,并使,x,i,=0,年份,倒5年,倒4年,大前年,前年,去年,平均值,x,i,-2,-1,0,1,2,0,0,y,i,300,350,380,430,500,1960,392,x,i,y,i,-600,-350,0,430,1000,480,X,i,2,4,1,0,1,4,10,Y,i,2,90000,122500,144400,184900,250000,791800,三、回归分析预测法-,一元线性回归,36/130,36,查相关系数表,此处,n=5,若取,=0.01,置信度(1-)=99%,查得,三、回归分析预测法-,一元线性回归,37/130,37,因为,r,xy,r,临界值,,所以,x,y之间确实存在着线性相关,故,预测模型 能够用于预测。,三、回归分析预测法-,一元线性回归,38/130,38,1、基本概念,社会经济,S中,影响事物发展往往是多个原因,一元回归只是一个抽象,是抓主要矛盾结果。有时分不清主次,只有经过多原因多元回归才能反应事物本质。,比如一个城市公共交通营运总额y与该市人口总数x,1,、国民生产总值,x,2,、商品流通量(或人口流动数),x,3,等多原因相关,经过分析抓住主要矛盾后,可建立以下二元线性回归预测模型:,三、回归分析预测法-,多元线性回归,39/130,39,普通而言,设系统变量y与k个自变量x,1,x,2,,x,k,之间存在统计线性相关关系,且给定n组样本数据点以下:,(y,1,x,11,x,21,x,k1,),(y,2,x,12,x,22,x,k2,),(y,n,x,1n,x,2n,x,kn,),则其满足:,多元线性回归预测模型能够表示为:,多元线性回归与矩阵方法相结合,是社会经济系统预测与规划一个主要伎俩。,三、回归分析预测法-,多元线性回归,40/130,40,2、多元线性回归模型参数预计,设式(7.4.10)中 ,则其k+1个参数a,j,可利用最小二乘法进行预计,记,三、回归分析预测法-,多元线性回归,41/130,41,于是,式(7.4.10)能够表示为:,三、回归分析预测法-,多元线性回归,42/130,42,令误差平方和:,由极小值条件 可得:,记 系数矩阵(对称),适于计算机实现,最小二乘法预计 是,A,无偏预计。,三、回归分析预测法-,多元线性回归,43/130,43,手算,时,,极小值条件能够表示为:,三、回归分析预测法-,多元线性回归,44/130,44,整理可得:,解上面方程组即可得到a,0,a,1,a,k,预计值。,三、回归分析预测法-,多元线性回归,45/130,45,3、相关系数,记 RSS回归平方和,ESS剩下平方和,TSS总平方和,三、回归分析预测法-,多元线性回归,46/130,46,3、相关系数,复相关系数,r,:表示y与全部自变量x,1,x,k,整体线性,相关程度。,三、回归分析预测法-,多元线性回归,47/130,47,3、相关系数,r,=1,:,y,与,x,1,x,k,含有完全正线性相关关系,全部样本点完全落在回归直线上。,r,=-1,:,y,与,x,1,x,k,含有完全负线性相关关系,全部样本点完全落在回归直线上。,0,r,1,:,y,与,x,1,x,k,含有一定正线性相关关系。,-1,r,0,:,y,与,x,1,x,k,含有一定负线性相关关系。,r,=0,:,y,与,x,1,x,k,之间不存在线性相关关系。,对一元线性回归而言,相关系数含义见P136图7-7.,三、回归分析预测法-,多元线性回归,48/130,48,4、回归模型统计检验,(1)标准离差检验:用于检验回归模型精度。,(2)相关系数检验:用复相关系数检验整体线性相关关系是,否可信。,r=1:完全线性相关(全部点均在拟合直线上);,r=0:不相关。,假如r在某个显著性水平,下超出了r,临界值,(附表二),则认为r在显著性水平,下与0显著不一样,检验经过。,反应预计值和样本值平均误差,要求:,三、回归分析预测法-,多元线性回归,49/130,49,4、回归模型统计检验,(3),回归方程显著性检验(F检验),:在一定显著性水平,下,检验假设a,i,=0(i=1,k)是否成立。,结构统计量F:,则当,时否定假设,认为在显著性水平,下,回归模型有意义(查附表四)。,三、回归分析预测法-,多元线性回归,50/130,50,4、回归模型统计检验,(4),回归系数显著性检验(t 检验),:对,每个自变量,x,i,与y,相关关系,单独,进行显著性检验,检验假设a,i,=0是否成立。,则当对j=1,k都有:,时认为在显著性水平,下,a,j,与0有显著差异,即x,j,对y 有显著影响(查附表三)。,三、回归分析预测法-,多元线性回归,51/130,51,4、回归模型统计检验,(5)剩下项独立性检验(DW 检验):就拟合误差,i,相,互独立性进行检验。,依据、n、k,,查DW表(附表五)得,d,u,、d,l,值,然后依据书上139页检验规则表得出检验结论。,三、回归分析预测法-,多元线性回归,52/130,52,4、回归模型统计检验,(6),预测区间确定,经过以上检验后回归模型可用。但因为模型是由数理统计方法得到,有一定误差,预测结果也有一定误差,即预测结果有一定波动范围,即预测置信区间。,在置信度为0.95时,预测结果置信区间或波动范围为,其中,S为标准离差,为自变量某组取值为x,10,x,20,x,k0,时预测值。则预测区间能够表示为 。,三、回归分析预测法-,多元线性回归,法,53/130,53,步骤:,给出待建回归预测模型,进行参数预计,即求a,0,a,1,a,k,,算法:,对模型进行统计检验,归纳:多元线性回归分析预测法,54/130,54,Cobb-Douglas生产函数普通形式:,若A(t)在一定时内近似为常数A,则,令 y=lnY,x,1,=lnL(t),x,2,=lnK(t),即得线性回归模型。,非线性回归模型线性化处理,对数线性化,55/130,55,对形如 非线性多项式预测模型,能够用变量代换方法转换为线性。,,则原模型变为,从而能够用求解线性回归模型方式进行求解。,非线性回归模型线性化处理,多项式回归预计,56/130,56,1)对时序统计数据,两法均可进行预测。但用回归法有一些缺点:回归法对当前和历史数据是同等对待,缺乏反应趋势灵活性。出现新数据点时,都要对回归方程进行重新预计。,2)故对时序统计资料进行预测,大多不用回归法,而用时序法。即使要用回归法,也多采取简化算法,不然太麻烦。,3)时序法不考虑事物改变原因,而是从最终止果去研究,并设事物会遵照过去规律,当前趋势一样适应未来。实际上未来绝不是过去和现在简单重复。故时序法用于短期预测较准,用于长久预测时,除非发展非常稳定,不然效果较差,尤其是碰到发展转折点时,时序法无能为力。,时序分析与回归分析比较:,57/130,57,4)预测通常采取两种以上方法进行对比和验证:,时序法研究改变趋势,回归法研究原因间因果关系。,较长时间预测采取回归法较准,短期预测可使用时序法,时序法需数据资料较少。,回归法所需数据较多,通常要求占有数据时间应为预测时间3倍以上。,时序分析与回归分析比较:,58/130,58,灰色预测模型,(Gray Forecast Model),是经过,少许、不完全信息,,建立数学模型并做出预测一个预测方法.当我们应用运筹学思想方法处理实际问题,制订发展战略和政策、进行重大问题决议时,都必须对未来进行科学预测.预测是依据客观事物过去和现在发展规律,借助于科学方法对其未来发展趋势和情况进行描述和分析,并形成科学假设和判断.,四、灰色预测模型,59/130,59,灰色系统理论是研究处理灰色系统分析、建模、预测、决议和控制理论.灰色预测是对灰色系统所做预测.当前惯用一些预测方法(如回归分析等),需要较大样本.若样本较小,常造成较大误差,使预测目标失效.灰色预测模型所需建模信息少,运算方便,建模精度高,在各种预测领域都有着广泛应用,是处理小样本预测问题有效工具.,四、灰色预测模型,60/130,60,灰色系统理论是由,华中理工大学邓聚龙教授,于1982年提出并加以发展。二十几年来,引发了不少国内外学者关注,得到了长足发展。当前,在我国已经成为社会、经济、科学技术在等很多领域进行预测、决议、评定、规划控制、系统分析与建模主要方法之一。尤其是它对时间序列短、统计数据少、信息不完全系统分析与建模,含有独特功效,所以得到了广泛应用。在这里我们将简明地介绍灰色建模与预测方法。,四、灰色预测模型,61/130,61,灰色系统定义,灰色系统是黑箱概念一个推广。我们把既含有已知信息又含有未知信息系统称为灰色系统.作为两个极端,我们将称信息完全未确定系统为黑色系统;称信息完全确定系统为白色系统.区分白色系统与黑色系统主要标志是系统各原因之间是否含有确定关系。,四、灰色理论预测模型-,灰色系统定义和特点,62/130,62,灰色系统特点,(1)用灰色数学处理不确定量,使之量化.,(2)充分利用已知信息寻求系统运动规律.,(3)灰色系统理论能处理贫信息系统.,四、灰色理论预测模型-,灰色系统定义和特点,63/130,63,经过下面数据分析、处理过程,我们将了解到,有了一个时间数据序列后,怎样建立一个基于模型灰色预测。,1.数据预处理,首先我们从一个简单例子来考查问题.,【例】,设原始数据序列,四、灰色理论预测模型-,灰色系统模型,64/130,64,对数据累加,于是得到一个新数据序列,四、灰色理论预测模型-,灰色系统模型,65/130,65,归纳上面式子可写为,称此式所表示数据列为原始数据列一次累加生成,简称为,一次累加生成,.显然有,将上述例子中,分别做成图7.1、图7.2,可见图7.1上曲线有显著摆动,图7.2展现逐步,递增形式,说明原始数据起伏已显著弱化.能够,构想用一条指数曲线乃至一条直线来迫近累加生成,数列,四、灰色理论预测模型-,灰色系统模型,66/130,66,图7.2,图7.1,为了把累加数据列还原为原始数列,需进行后减运算,或称相减生成,它是指后前两个数据之差,如上例中,四、灰色理论预测模型-,灰色系统模型,67/130,67,归纳上面式子得到以下结果:一次后减,其中,四、灰色理论预测模型-,灰色系统模型,68/130,68,建模原理,给定观察数据列,经一次累加得,设 满足一阶常微分方程,(7.1),(7.2),(7.3),四、灰色理论预测模型-,灰色系统模型,69/130,69,其中是a,u常数,a称为发展灰数;u称为内生控制灰数,是对系统常定输入.此方程满足初始条件,解为,(7.3),对等间隔取样离散值(注意到,),则为,(7.4),灰色建模路径是一次累加序列(7.2)经过最小二乘法来,预计常数,a,与,u,.,四、灰色理论预测模型-,灰色系统模型,70/130,70,因,留作初值用,故将,用差分代替微分,又因等间隔取样,,分别代入方程(7.3),故得,类似地有,于是,由式(7.3)有,四、灰色理论预测模型-,灰色系统模型,71/130,71,因为,包括到累加列,两个时刻值,所以,,取前后两个时刻平均代替更为合理,即将,替换为,把,项移到右边,并写成向量数量积形式,(7.5),四、灰色理论预测模型-,灰色系统模型,72/130,72,将(7.5)写为矩阵表示式,令,这里,T表示转置.令,(7.6),四、灰色理论预测模型-,灰色系统模型,73/130,73,则(7.6)式矩阵形式为,方程组(7.6)最小二乘预计为,(7.6),(7.7),四、灰色理论预测模型-,灰色系统模型,74/130,74,把预计值,代入(7.4)式得时间响应方程,由(7.8)式算得,是拟合值;,为预报值.这是相对于一次累加序列,拟合值,用后减运算还原,,就可得原始序列,拟合值,可得原始序列,预报值.,(7.8),四、灰色理论预测模型-,灰色系统模型,75/130,75,精度检验,(1)残差检验:分别计算,四、灰色理论预测模型-,灰色系统模型,76/130,76,(3)预测精度等级对照表,见表7.1.,四、灰色理论预测模型-,灰色系统模型,77/130,77,因为模型是基于一阶常微分方程(7.3)建立,故称为一阶一元灰色模型,记为GM(1,1).须指出是,建模时先要作一次累加,所以要求原始数据均为非负数.不然,累加时会正负抵消,达不到使数据序列随时间递增目标.假如实际问题原始数据列出现负数,可对原始数据列进行,“数据整体提升”,处理.,注意到一阶常微分方程是导出GM(1,1)模型桥梁,在我们应用GM(1,1)模型于实际问题预测时,无须求解一阶常微分方程(7.3).,四、灰色理论预测模型-,灰色系统模型,78/130,78,GM(1,1),建模步骤,总而言之,GM(1,1)建模步骤以下:,四、灰色理论预测模型-,灰色系统模型,79/130,79,【例】某企业1999逐年销售额.试用建立预测模型,预测年销售额,要求作精度检验。,四、灰色理论预测模型,案例分析,年份,1999,序号,1,2,3,4,5,销售额,2.874,3.278,3.337,3.390,3.679,80/130,80,解(1)由原始数据列计算一次累加序列 ,结果见表7.3.,表7.3 一次累加数据,年份,1999,序号,1,2,3,4,5,2.874,3.278,3.337,3.390,3.679,2.874,6.152,9.489,12.879,16.558,四、灰色理论预测模型,案例分析,81/130,81,(2)建立矩阵:,四、灰色理论预测模型,案例分析,82/130,82,四、灰色理论预测模型,案例分析,83/130,83,四、灰色理论预测模型,案例分析,84/130,84,四、灰色理论预测模型,案例分析,85/130,85,四、灰色理论预测模型,案例分析,86/130,86,【例3】某市1-6月交通事故次数统计见表7.5.试建立灰色预测模型.,表7.5 交通事故次数统计,【例4】某市2001年火灾统计数据见表7.7.试建立模型,并对该市20火灾发生情况做出预测。表7.7 某市2001年火灾数据,四、灰色理论预测模型,案例分析,年份,火灾(起),87,97,120,166,161,87/130,87,以冯诺依曼型计算机为中心信息处理技术高速发展,使得计算机在当今信息化社会中起着十分主要作用。不过,当用它来处理一些人工智能问题时却碰到了很大困难。,比如,一个人能够很轻易地识别他人脸孔,但计算机则极难做到这一点。,大脑是由生物神经元组成巨型网络,它在本质上不一样于计算机,是一个大规模并行处理系统,它含有学习、联想记忆、综合等能力,并有巧妙信息处理方法。,人工神经网络起源于对人脑实际神经网络模拟,背景知识,四、神经网络预测法-背景知识,88/130,88,人工神经网络(,Artificial Neural Netwroks,,简称ANN)是对人类大脑系统一个仿真,简单地讲,它是一个数学模型,能够用电子线路来实现,也能够用计算机程序来模拟,是人工智能研究一个方法。,实际上它是由大量、功效比较简单形式神经元相互连接而组成复杂网络系统,用它能够模拟大脑许多基本功效和简单思维方式。尽管它还不是大脑完美元缺模型,但它能够经过学习来获取外部知识并存贮在网络内,能够处理计算机不易处理难题,尤其是,语音和图像识别、了解、知识处理、组合优化计算和智能控制等,一系列本质上是非计算问题。,什么是人工神经网络,四、神经网络预测法背景知识,89/130,89,1943年,美国心理学家,W.McCulloch,和数学家,W.Pitts,在提出了一个简单神经元模型,即MP模型。1958年,F.Rosenblatt等研制出了,感知机(Perceptron),。,几个发展阶段,第一次热潮(40-60年代未),1982年,美国物理学家,J.J.Hopfield,提出,Hopfield模型,,它是一个互联非线性动力学网络他处理问题方法是一个重复运算动态过程,这是符号逻辑处理方法所不具备性质.1987年首届国际ANN大会在圣地亚哥召开,国际ANN联合会成立,创办了各种ANN国际刊物。1990年12月,北京召开首届学术会议。,低潮(70-80年代初),第二次热潮,四、神经网络预测法-背景知识,90/130,90,生物神经元模型,四、神经网络预测法-背景知识,91/130,91,生物神经元模型就是一个简单信号处理器。,树突是神经元信号输入通道,接收来自其它神经元信息。轴突是神经元信号输出通道。,信息处理与传递主要发生在,突触,附近。神经元细胞体经过树突接收脉冲信号,经过,轴突,传到,突触前膜,。当,脉冲,幅度到达一定强度,即超出其阈值电位后,突触前膜将向突触间隙释放神经传递化学物质(,乙酰胆碱,),使位于突触后膜离子通道(Ion Channel)开放,产生,离子流,,从而在突触后膜产生正或负电位,称为,突触后电位,。,生物神经元模型运行机理,四、神经网络预测法-背景知识,92/130,92,突触有两种:,兴奋性突触,和,抑制性突触,。前者产生,正突触后电位,,后者产生,负突触后电位,。一个神经元各树突和细胞体往往经过突触和大量其它神经元相连接。这些突触后电位改变,将对该神经元产生综合作用,即当这些突触后电位总和超出某一阎值时,该神经元便被激活,并,产生脉冲,,而且产生脉冲数与该电位总和值大小相关。脉冲沿轴突向其它神经元传送,从而实现了神经元之间信息传递。,四、神经网络预测法-背景知识,93/130,93,连接权:,求和单元:,激励函数(响应函数):,人工神经元模型三要素,四、神经网络预测法-人工神经元模型,94/130,94,模型中,为输入信号,,为输出信号,,为神经元阈值。该模型数学表示式为:,人工神经元模型数学表示一,四、神经网络预测法-人工神经元模型,95/130,95,人工神经元模型数学表示二,四、神经网络预测法-人工神经元模型,96/130,96,阈值函数:,分段线性函数:,sigmoid,函数:,激励函数形式,四、神经网络预测法-人工神经元模型,97/130,97,前馈型网络,:,反馈型网络,:,输,入,层,隐,层,输,出,层,网络结构,四、神经网络预测法-人工神经元模型,98/130,98,学习期,:,各计算单元状态不变,各连接线上权值经过学习来修改,工作期,:,连接权固定,计算单元状态改变,以到达某种稳定状态,工作方式,四、神经网络预测法-人工神经元模型,99/130,99,有教师学习,:,外界存在一个教师,对给定一组输入,提供给有输出(标准答案),学习系统可依据实际输出与标准答案之间差值来调整系统参数,学 习,系 统,教师,环境,输入,应有,响应,+,误差信号,实际响应,1.,学习方式,四、神经网络预测法-人工神经元模型,100/130,100,无教师学习:,学习系统按照环境提供数据一些统计规律来调整本身参数,环境,学 习,系 统,动作,输出,输入,状态,环境,学习系统,输入,强化学习:,环境对系统输出结果只给出评价信息(奖或惩),系统经过强化受奖动作来改进本身性能,四、神经网络预测法-人工神经元模型,101/130,101,考查神经元,k,在,n,时刻输入和输出,输入:,实际输出:,应有输出:,由误差信号结构能量函数:,其中,E,(.)为求期望算子,求解最优化问题:,得出系统参数:,学习规则,四、神经网络预测法-人工神经元模型,102/130,102,通常情况下用时刻,n,瞬时值 代替,J,,即求解最优化问题,由数值迭代算法(如最速下降法、模拟退火算法等),可得,其中 为学习步长,四、神经网络预测法-人工神经元模型,103/130,103,神经学家Hebb提出学习规则:当某一连接两端神经元同时激活(或同为抑制)时,该连接强度应增强,反之应减弱,数学描述以下:,其中 分别为 两端神经元状态,最惯用一个情况是:,Hebb学习规则,四、神经网络预测法-人工神经元模型,104/130,104,对于多层网络,因为有隐层后学习比较困难,限制了多层网络发展,BP算法出现处理了这一困难。,BP算法(向后传输算法),四、神经网络预测法-BP算法,输,入,层,隐,层,输,出,层,105/130,105,对于多层前馈型网络,网络中有两种信号在流通,,(1)工作信号,施加输入信号向前传输直到在输出层产生实际输出信号,是输入信号和权值函数,(2)误差信号,网络实际输出与应有输出间差值,它由输出层开始逐层向后传输,BP算法原理,下面推导用于多层前馈型网络学习BP算法,四、神经网络预测法-BP算法,106/130,106,下面就逐一样本学习情况来推导BP算法,如右图,令单元,j,净输入为,则,求 对 梯度,该单元误差信号为 ,定义单元,j,平方误差为 ,则输出层总平方误差瞬时值为:,设在第,n,次迭代中某一层第,j,个单元输出为,当,j,单元所在层为输出层时,四、神经网络预测法-BP算法,107/130,107,其中 称为,局部梯度,权值 修正量为,当,j,单元所在层为隐层时,108/130,108,权值 修正量为,其中,四、神经网络预测法-BP算法,109/130,109,输入层,隐层,输出层,结构多层前向神经网络,四、神经网络预测法-BP网络matlab实现,110/130,110,net =newff (A,B,C,trainfun ),Matlab命令,A,是一个,n,2矩阵,第,i,行元素为输入信号,x,i,最,小值和最大值,;,参数说明,B,为一,k,维行向量,其元素为各,隐层节点数,;,trainfun,为学习规则采取,训练函数,(常见训练函数以下,表)。,C,为一,k,维字符串行向量,每一分量为对应层神经元,激,励函数,;,111/130,111,函数名,功效,函数名,traingd,梯度下降法,traincgf,traingdm,势能修正法,traincgp,traingdx,自调整学习效率法,traincgb,trainrp,恢复BP法,trainscg,FR共轭梯度法,trainbfg,BFGS拟牛顿法,PR共轭梯度法,trainoss,一步共轭+拟牛顿,PB共轭梯度法,trainlm,LM法,标量共轭梯度法,trainbr,Bayesian规范法,常见训练函数,四、神经网络预测法-BP网络matlab实现,112/130,112,MATLAB中激励函数为,其字符串分
展开阅读全文