资源描述
单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,管理统计学-第八章,(一)按相关,程度,划分,完全相关,不完全相关,不相关,(二)按相关,方向,划分,正相关:同方向变动,负相关:反方向变动,(三)按相关,形式,划分,线性相关,非线性相关,(四)按,变量多少,划分,单相关:两变量间的相关,复相关,偏相关,(五)按相关,性质,划分,真实相关,虚假相关,Kendalls tua-b,相关系数,二、普通相关系数的,种类,及计算,总体相关系数,(一)积矩相关系数,样本相关系数,(参数相关),(二)等级相关系数,等级相关系数适用于顺序级和,刻度级的配对样本。,(非参数相关),Spearman,相关系数,(三)偏相关系数,(四)复相关系数,1.,总体相关系数,2.,样本相关系数,积矩相关系数,适用于等间隔测度的数据或比例数据之间的线性关系的密切程度。,图中,普通相关系数的几何解释,与,即,表示向量,一组,角的余弦就是配对样本,的相关系数。,的模。,样本,可以视为一个向量。,相关系数,为0,的两个随机变量,不相关,但不,一定相互独立。,相关系数为0的两个服从正态分布的随机变量,一定相互独立。,相互独立的随机变量间的相关系数,必然为0,。,普通相关系数的取值范围,样本相关系数也是区间-1,1之间的一个量。,普通相关系数的直观散点图,设有配对样本观察值,与,则其直观散点图中,标是(,)。,每个点的平面坐,散点图,散点图,(Graphs Scatter),积矩相关系数的检验,检验的种类,偏相关系数的检验,相关系数异于零的显著性检验,积矩相关系数的检验,式中,,是样本容量,,是简单相关系数(,Pearson,),检验统计量,等级相关系数的检验,这是一个双尾检验问题,设定假设:,练习,,,某企业产品广告费和销售收入资料如下,,,判断广告费和销售收入之间关系密切程度如何?,3,10,28,40,66,117,140,404,序号,广告费(万元),销售收入(百万元),1,2,3,4,5,6,7,3,5,7,8,11,13,14,61,1,2,4,5,6,9,10,37,9,25,49,64,121,169,196,633,1,4,16,25,36,81,100,263,合计,普通,相关分析的,SPSS的实现过程,:Analyze菜单,Correlate,项中选择,Bivariate,命令。,Flag Significant Correlation,:,是否用星号标明输出结果的显著性。,Means and Standard Deviations,:,输出所选变量的均值、标准差和样本个数。,Cross Product Deviations and Covariances,:,输出平方和及协方差。,回归分析,一元回归,多元回归,全部强行进入回归,逐步回归,回归,:,揭示出不确定数量关系的内在数量变化规律,,,并通过一定的,表达式,描述数量之间的这种内在关系的方法。,不确定性的函数关系,回归的涵义,数据之间的关系 函数,确定性的函数关系,回归方程,回归分析的任务,(1),通过分析大量的样本数据,,,确定变量之间的统计关系,,,并以数学表达式形式给出,;,(2),对确定的数学关系式的可信度进行统计检验,,,找出对某一特定变量影响较为显著的变量和不显著的变量,;,(3),利用确定的数学关系式,,,根据自变量预测或控制因变量的取值,,,并找出这种预测或控制的精确度。,回归分析时变量的设定,回归分析的,被解释变量,必须是刻度级的,,,如果是顺序级的,,,要用,Numeric,型的来表示。如果被解释变量是名义级的,,,将用,Logistic,回归等方法处理。,解释变量,可以是刻度级、顺序级、名义级的变量,,,不论是什么级别的数据,,,都必须用,Numeric,型的来表示。,一元线性回归分析,一元线性回归模型的,求解,一元线性回归模型的,SPSS,实现,一元线性回归模型的,设定,一元线性回归模型的,检验,样本回归模型,:,样本回归直线,:,一元线性回归模型的求解,最小平方法,回归方程的,显著性,检验,线性回归,方程的检验,回归,系数的显著性检验,回归,效果,的检验,回归方程的显著性检验,F,检验,:,回归方程不显著,:,回归方程显著,:,总离差平方和,:,剩余平方和,/,残差平方和,:,回归离差平方和,若全部观测值都落在回归直线上,,,则,判定相关系数越接近,1,,表明回归平方和占总离差平方和的比例越大,,,用,x,的变动解释,y,值变动的部分就越多,,,回归的效果就越好。,回归效果的检验,判定相关系数检验,若,x,完全无助于解释,y,的变动,,则,F,检验,校正的判定系数,统计量,中不含有自由度。所谓,校正的判定系数,是指,“,考虑了自由度的判定系数,”。,其定义如下,:,剔除了,自由度的影响。,校正的判定系数,Adjusted,式中:,回归效果的检验,F,检验,:,样本容量,:,自变量的个数,(,含常数项,),:,判定系数,回归系数的显著性检验,T,检验,成立,即,当,时,显著异于,0。,针对回归系数的,统计量的显著性检验决定了相,应的变量能否作为解释变量进入回归方程。,回归系数的显著性检验,T,检验,成立,即,当,时,显著异于,0。,针对回归系数的,统计量的显著性检验决定了相,应的变量能否作为解释变量进入回归方程。,SPSS的实现,:Analyze菜单,Regression,项中选择,Linear,命令。,Enter,:强行进入法,,,即所选自变量全部进入模型,。,Remove,:强制剔除法,即建立回归方程时,根据设定的条件从回归方程中剔除部分自变量。,Backward,:向后剔除法,根据,Option对话框中设定的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的F值最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。,Forward,:向前选择法,。,Stepwise,:逐步进入法,,根据,Option,对话框中设定的判据及方差分析结果,选择符合判据的自变量与因变量相关程度最高的进入回归方程。依据,Forward,选入自变量,依据,Backward,将模型中F值最小且符合剔除判据的变量剔除,,,重复。,Method,处下拉菜单,共有5个选项:,WLS选项,是存在异方差时,利用加权最小二乘法替代普通最小二乘法估计回归模型参数。通过WLS可以选定一个变量作为加权变量。,在实际问题中,如果无法自行确定权重变量,可以用SPSS的权重估计来实现。,Descriptives,:输出自变量和因变量的均值、标准差相关系数矩阵及单侧检验概率。,Estimates,:输出与回归系数相关统计量。有:回归系数、回归系数的标准误差、标准回归系数、T统计量和相应的相伴概率、各自变量的容忍度。,Confidence intervals,:输出每一个非标准化回归系数95%的可信区间。,Covariance matix,:输出方程中,各自变量,间的相关系数矩阵及各变量的协方差矩阵。,Model fit,:输出判定系数、调整的判定系数、回归方程的标准误差,F检验的,ANOVA方差分析表。,R squared change,:当回归方程中引入或剔除一个自变量后,判定系数、F值产生的变化。,Casewise diagnostics,:输出标准化残差绝对值,3的样本数据点的相关信息,包括:标准化残差、观测值预测值、最小(最大)预测值、残差、最小(最大)残差以及它们的均值和标准差,。,Outliers outside standard devistion,:设置奇异值的判据,默认,3倍的标准差。,All case:输出所有样本数据有关残差值。,Part and partial correlation,:输出方程中各自变量与因变量之间的简单相关系数、偏相关系数与部分相关系数。,Collinearity diagnostics,:多重共线性分析,输出各自变量的容限度、方差膨胀因子、最小容忍度、特征值、条件指标及方差比例等。,Durbin-Watson,:输出Durbin-watson检验值。,Plots对话框,用来检验残差序列的正态性、随机性和是否存在异方差现象。,Produce all partial plots,:输出每一个自变量残差相对于因变量残差的散布图。,*,ZPRED,选项:标准化预测值。,*,ZRESID,选项:标准化残差。,*,DRESID,选项:剔除残差。,*,ADJPRED,选项:修正后预测值。,*,SRESID,选项:,t,分析残差。,*,SDRESID,选项:,t,分析剔除残差。,Mahalanobis,:保存,Mahalanobis,距离,Cooks,:保存,Cook,距离,Leverage values,:保存,中心点杠杆值,Individual,:保存,一个观测量上限与下限的预测区间。,Studentized,:标准化残差,Deleted,:剔除残差,Studentized deleted,:标准化剔除残差,DfBeta(s),:因排除一个特定的观察值所引起的回归系数的变化。若该值2,则被排除的观测值有可能是影响点。,DfFit,:因排除一个特定的观测值所引起的观测值的变化。,Use probalitlity of F,:以回归系数显著性检验中各自变量的F统计量的相伴概率作为自变量是否引入模型或者从模型中剔除的标准。实际应用中,应使Entry值小于Remove值,否则,自变量一进入方程就会被立即剔除。,Use F value,:以回归系数显著性检验中的各自变量的F统计量作为自变量进入模型或者从模型中剔除的标准。,Include constant in equationF,:表示回归方程中将包含常数项。,练习,,,某企业产品广告费和销售收入资料如下,,,判断广告费和销售收入之间关系密切程度如何?,3,10,28,40,66,117,140,404,序号,广告费(万元),销售收入(百万元),1,2,3,4,5,6,7,3,5,7,8,11,13,14,61,1,2,4,5,6,9,10,37,9,25,49,64,121,169,196,633,1,4,16,25,36,81,100,263,合计,多元线性回归分析,一个被解释变量,(,因变量,),,的线性模型,,,多个解释变量,(,自变量,),多元回归的种类,全部强行进入回归,:,所有自变量全部进入回归模型,逐步回归,:,所有的自变量依次进入回归模型,多元回归方程为,回归方程的显著性检验,多元线性回归的检验与估计,二、多元线性回归,三、回归,系数,的显著性检验,四、回归分析的置信区间,五、标准回归系数,回归效果的检验,回归系数,总体均值,方程,的检验,多元回归的,SPSS,处理,按数列中所排列指标的表现形式不同分为:,绝对数数列,相对数数列,平均数数列,(平均指标数列),(相对指标数列),时点数列,时期数列,时间数列分析,(,总量指标列,),时间序列的基本构成要素,年份,国内生产总值,(亿元),年份,国内生产总值,(亿元),1997,1998,1999,2000,2001,2002,48 198,60 794,71 177,78 973,84 402,89 677,2003 2004,2005,2006,2007,2008,99 215,109 655,120 333,135 823,159 878,182 321,要素一:时间,t,要素二:指标数值,a,影响时间数列变动的因素可分解为,:,(1)长期趋势(T),(2)季节变动(S),(3)循环变动(C),(4)不规则变动(I),可解释的变动,不可解释的变动,长期趋势(),现象在较长时期内受某种根本性因素作用而形成的总的变动趋势,季节变动(),现象在一年内随着季节的变化而发生的有规律的周期性变动,循环变动(),现象以若干年为周期所呈现出的波浪起伏形态的有规律的变动,不规则变动(),是一种无规律可循的变动,包括严格的随机变动和不规则的突发性影响很大的变动两种类型,时间序列的分解分析,(一)时间数列的组合模型,1 加法模型:Y=T+S+C+I,计量单位相同的总量指标,对长期趋势产生的或正或负的偏差,2 乘法模型:Y=TSCI,计量单位相同的总量指标,对原数列指标增加或减少的百分比,常用模型,(二)移动平均法,1、定义:对时间数列的各项数值,按照一定的时距进行逐期移动,计算出一系列序时平均数,形成一个派生的平均数时间数列,以此削弱不规则变动的影响,显示出原数列的长期趋势。,2、移动平均法的步骤,(1)确定移动时距,一般应选择,奇数项,进行移动平均;,若原数列呈,周期变动,,应选择现象的,变动周期,作为移动的时距长度。,(2)计算各移动平均值,并将其编制成时间数列,奇数项移动平均:,原数列,移动平均,新数列,偶数项移动平均:,移动平均,新数列,原数列,月 份,总产值,三项移动平均,四项移动平均,二项移动平均,1,2,3,4,5,6,7,8,9,10,11,112,506,473,542,546,585,547,570,576,569,610,583,615,507.00,520.33,557.67,559.33,567.33,564.33,571.67,585.00,587.33,602.67,506.75,536.50,555.00,562.00,569.50,565.50,581.25,584.50,594.25,526.63,545.75,558.50,565.75,567.50,573.38,582.88,589.38,移动平均数计算表,例:,(三)最小平方法,1、含义:最小平方法是通过时间序列的变动分析,建立定量分析数学模型,配合一条较为理想的趋势线来测定数列变化的趋势。,直线趋势方程:,曲线趋势方程:,(1),原数列的实际值与趋势值的离差平方和为最小,即,(2),原数列的实际值与趋势值的离差之和等于零,即,2、最小平方法配合趋势线时必须满足的两点要求:,3、判断趋势类型的方法,(1)绘制散点图,(2)分析数据特征,当数据的,一阶差分,趋近于一常数时,可以配合,直线方程,当数据的,二阶差分,趋近于一常数时,可以配合,二次曲线方程,当数据的,环比发展速度,趋近于一常数时,可配合,指数曲线方程,4、直线趋势,利用最小平方法配合趋势直线,要求原数列的实际数值与趋势直线上的趋势值的离差平方和为最小,即:,将上述两式分别展开并进行整理后,可得到如下标准方程式:,解上述标准方程即可得到的a、b数值,【例】已知我国19962008年GDP资料(单位:亿元)如下,拟合直线趋势方程。,年份,t,GDP(y),ty,t,2,1996,1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,1,2,3,4,5,6,7,8,9,10,11,12,13,35 334,49 198,60 794,71 177,78 973,84 402,89 677,99 215,109 655,120 333,135 823,159 878,182 321,35 334,69396,182382,284708,394865,506412,627739,793720,986895,1203330,1494053,1918536,2370173,1,4,9,16,25,36,49,64,81,100,121,144,169,合计,91,1275780,10894543,819,解:,求解a、b的简捷方法,取时间数列中间项为原点,0,1,2,3,-1,-2,-3,0,1,2,3,4,5,6,7,当,t=0时,有,N为奇数时,令,t=,-3,-2,-1,0,1,2,3,,N为偶数时,令,t=,-5,-3,-1,1,3,5,,年份,t,t,GDP(y),ty,t,2,1996,1997,1998,1999,2000,2001,2002,2003,2004,2005,2006,2007,2008,1,2,3,4,5,6,7,8,9,10,11,12,13,-6,-5,-4,-3,-2,-1,0,1,2,3,4,5,6,35 334,49 198,60 794,71 177,78 973,84 402,89 677,99 215,109 655,120 333,135 823,159 878,182 321,-212004,-240990,-243176,-213531,-157946,-84402,0,99215,219310,360999,543292,799390,1093926,36,25,16,9,4,1,0,1,4,9,16,25,36,合计,91,0,1275780,1964083,182,5.曲线趋势,(1)抛物线,抛物线趋势方程为:,采用最小平方法分别对a、b、c求偏导,并进行整理后得如下标准方程组:,例:某企业2003-2008年工业总产值及有关计算资料如下表所示,年份,工业总产值(万元)y,t,t,2,t,4,ty,t,2,y,2003,2004,2005,2006,2007,2008,1640,1740,1862,2005,2171,2359,-5,-3,-1,1,3,5,25,9,1,1,9,25,625,81,1,1,81,625,-8200,-5220,-1862,2005,6513,11795,41000,15660,1862,2005,19539,58975,1640.15,1735.89,1861.63,2005.37,2171.11,2358.85,合计,11777,0,70,1414,5031,139041,11777.0,解:,代入简化后的方程组得:,2004年趋势值,将 的各项取值代入上述趋势方程,便可计算出各期趋势值:,2003年趋势值:,其他年份依次类推。,指数曲线趋势方程为:,(2)指数曲线,求解指数曲线方程中,的数值,通常先将指数曲线化为直线,然后再利用最小平方法,将指数曲线趋势方程两边分别求对数得:,设 。则上述方程变化为如下方程:,采用最小平方法确定的标准方程组如下:,解方程组求得 数值后,再查反对数表即可得到 的数值,例:某厂2003-2008年棉布产量及计算资料如下表所示:,年份,棉布产量(万米,),2003,2004,2005,2006,2007,2008,14.85,18.28,22.84,28.40,35.46,43.79,-5,-3,-1,1,3,5,25,9,1,1,9,25,1.171 7,1.262 0,1.358 7,1.453 3,1.549 7,1.641 4,-5.858 5,-3.786 0,-1.358 7,1.453 3,4.649 1,8.207 0,15.12,18.62,22.95,28.27,34.83,42.92,合计,163.62,0,70,8.436 8,3.306 2,162.71,将上述资料代入简化后的标准方程组得:,8.436 8=6A,3.306 2=70B,解得:A=1.406 1,B=0.004 72,查反对数表得:,则由此而确定的指数曲线趋势方程为:,将 的各项取值代入所确定的指数曲线趋势方程,便可得到各期的趋势值:,2003年趋势值:,2004年趋势值,其他年份依次类推。,季节变动的概念和测定,(一)季节变动的概念,季节变动是指社会经济现象在一定时间长度内由于受自然与社会因素的影响而发生的具有周期性、规律性的重复变动。,(二)季节变动的测定方法,1.按月(季)平均法,1)定义:按月(季)平均法是对原时间序列资料不作处理,直接根据历年的周期数据加以平均(给出的资料是月度资料就按月平均,是季度资料就按季平均),并与总平均数对比,求出有关的季节比率,借以反映现象在各期的变动程度。,(3)若干年内每月(季)的数字总计,求总的月(季)平均数,即:,(4)将若干内同月(季)平均数与总月(季)平均数对比,求各月(季)的季节比率,即:,(5)调整季节比率。计算季节比率时,若是月度资料,各月季节比率之和应等于1200%;若是季度资料,各季季节比率之和应等于400%。若根据时间序列资料计算的结果不等,就应进行调整,。,2)按月(季)平均法求季节比率的步骤:,(1)分别就每年各月(季)的数字加总,求各该年的月(季)平均数,即:,(2)各年同月(季)数字加总,求若干年内同月(季)的平均数,即:,首先,计算调整系数,公式为:,其次,计算调整后的季节比率,公式为:,第一年,第二年,第三年,第四年,第五年,五年,合计,季平,均数,季节,比率(%),(1),(2),(3),(4),(5),(6),(7),(8),一季度,二季度,三季度,四季度,1861,2203,2415,1908,1921,2343,2515,1986,1834,2154,2098,1799,1837,2025,2304,1965,2073,2414,2339,1697,9526,11139,11670,9625,1905.2,2227.8,2334,1925,90.81,106.19,111.25,91.75,四季,合计,8387,8764,7885,8131,8793,41960,8392,400.00,年平,均数,2096.7,2191,1 971.25,2 032.75,2 198.25,2098,例:某旅店客房出租按月平均法测定的季节变动,2.移动平均趋势剔除法,1)含义:移动平均趋势剔除法是先对时间序列计算移动平均,剔除长期趋势的影响,再测定季节变动。,2)步骤,(1)根据各年的月(季)资料(y)采用移动平均法求趋势值(T),月份资料按十二项移动平均,季度资料按四项移动平均;,(2)将实际数y与趋势值T对比,即y/T;,(3)将y/T按月(季)排列,再按月(季)求平均季节比率;,(4)调整季节比率。,年份,季别,出租客房数y,四个季度,移动总数,四季的移动平均数,趋势值T,(1),(2),(3),(4),(5),(6),第一年,第二年,第三年,第四年,第五年,1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4,1,2,3,4,1861,2203,2415,1908,1921,2343,2514,1986,1834,2154,2098,1799,1837,2025,2304,1965,2073,2414,2339,1967,8387,8447,8587,8686,8764,8677,8488,8072,7885,7888,7759,7965,8131,8367,8756,8791,8793,2096.75,2111.75,2146.75,2171.50,2191.00,2169.75,2122.00,2018.00,1971.25,1972.00,1939.75,1991.25,2032.75,2091.75,2189.00,2197.75,2198.25,2104.25,2129.25,2159.125,2181.25,2180.375,2145.875,2070,1994.625,1971.625,1955.875,1965.5,2011.75,2062.25,2140.375,2193.375,2198,114.77,89.61,88.97,107.42,115.30,92.55,88.60,107.99,106.41,91.98,93.46,100.66,111.72,91.81,94.51,109.83,例:某旅店客房出租按移动平均趋势剔除法测定的季节变动,季节变动和不规则变动的测定,季度 年份,1,2,3,4,合计,第一年,第二年,第三年,第四年,第五年,88.97,88.60,93.46,94.51,107.42,107.99,100.66,109.83,114.77,115.30,106.41,111.72,89.61,92.55,91.98,91.81,合计,365.54,425.90,448.20,365.45,平均,91.39,106.48,112.05,91.36,401.28,季节比率,91.1,106.1,111.7,91.1,400,四季的季节比率之和为401.28%,应进行调整。,循环变动的测定,(一)直接法,直接法是将每年各季或各月的数值与上年同期进行对比,即求出年距发展速度:,直接法简便易行,可以大致消除趋势变动T和季节变动S的影响,适用于季度和月度时间序列。,(二)剩余法,基本思想是;对各期时间序列资料用长期趋势和季节比率消除趋势变动和季节变动,而得反映循环变动与不规则变动的数列,然后再采用移动平均法消除不规则变动,便可得出反映循环变动程度的各期循环变动系数。,将CI数列进行移动平均修匀,则修匀后的数列即为各期循环变动的系数。,在一个时间序列的变动中,消除长期趋势变动和季节变动,即为不规则变动。,不规则变动的测定,用公式表示为:,不规则变动相对数在1上下波动。大于1,表示对数列的影响为正;小于1,表示对数列的影响为负;离1愈远,影响愈大;等于1,则表示无不规则变动。,直线趋势方程:,t,y,i,一阶差分,y,i,-,y,i-1,1,2,3,4,n,a+b,a+2b,a+3b,a+4b,a+nb,b,b,b,b,抛物线趋势方程:,t,y,i,一阶差分,二阶差分,1,2,3,4,n,a+b+c,a+2b+4c,a+3b+9c,a+4b+16c,a+nb+n,2,c,b+3c,b+5c,b+7c,b+(2n-1)c,2c,2c,2c,指数曲线趋势方程:,t,y,i,y,i,/,y,i-1,1,2,3,4,n,ab,ab,2,ab,3,ab,4,ab,n,b,b,b,b,此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢,
展开阅读全文