收藏 分销(赏)

相关性分析及回归分析演示幻灯片.ppt

上传人:精*** 文档编号:10006259 上传时间:2025-04-17 格式:PPT 页数:29 大小:951.50KB
下载 相关 举报
相关性分析及回归分析演示幻灯片.ppt_第1页
第1页 / 共29页
相关性分析及回归分析演示幻灯片.ppt_第2页
第2页 / 共29页
相关性分析及回归分析演示幻灯片.ppt_第3页
第3页 / 共29页
相关性分析及回归分析演示幻灯片.ppt_第4页
第4页 / 共29页
相关性分析及回归分析演示幻灯片.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,相关分析,与,回归分析,1,学习目标,相关分析、回归分析等数据处理与分析的方法。,掌握相关性分析理论及模型建立的方法,理解相关系数等参数的经济意义,掌握回归分析理论及模型建立的方法,理解拟合度等相关参数的意义,Excel,学习重点,Excel,中的数据分析工具,回归,相关系数,2,相关分析,相关分析是对两个变量之间线形关系的描述与度量,变量之间是否存在关系?,如果存在关系,他们之间是什么样的关系?,变量之间的关系强度如何?,样本所反映的变量之间的关系能否代表总体变量之间的关系?,相关分析步骤,绘制散点图判断

2、变量之间的关系形态,如果是线形相关,可以用相关系数来度量两个变量之间的关系强度,对相关系数进行显著性检验,以判断样本所反映的关系是否能用来代表两个变量总体上的关系。,3,散点图,通过图形方式对变量之间的关系形态进行大致的描述,A-,正相关:一个变量增加或减少时,另一个变量也相应增加或减少;,B-,负相关:一个变量增加或减少时,另一个变量却减少或增加;,C-,非线性相关:变量之间的关系近似地表现为一条曲线;,D-,无相关:说明两个变量是独立的,即由一个变量值,无法预测另一个变量值。,(a),(b),(c),(d),4,相关系数,相关系数:根据样本数据计算的两个变量之间线形相关程度的统计量,用符号

3、r,来表示。,5,相关系数表示的意义,相关系数,r,是对两变量线性相关的测量,数值的范围从,-1,到,0,,到,+1,,表达变量间的相关强度。,r,值为,+1,表示两组数完全正相关,r,值为,-1,表示两组数完全负相关,说明它们间存在反向关系,一个变量变大时另外一个就变小,当,r,值为,0,时表示两变量之间不存在线性关系,相关系数取值范围限于:,r,Excel,中计算相关系数有两种方法,Excel,数据分析功能,CORREL(),函数,6,加载“分析工具库”,文件,/,选项,/Excel,选项,加载项,/,分析工具库,/Excel,加载项,/,单击“跳转”,在加载宏对话框中勾选“分析工具库

4、7,示例,1-,利用,Excel,数据分析计算相关系数,根据表中的数据计算不良贷款、贷款余额、累计应收贷款、贷款项目个数、固定资产投资额之间的相关系数,法,1,:数据,/,数据分析,/,相关系数,/,做如下图所示设置,可见,不良贷款与各项贷款余额的相关性最高,8,示例,1-,利用,Excel,数据分析计算相关系数,法,2-,利用,CORREL(),函数也可以求出上述任意两个变量之间的相关系数,=CORREL(Array1,Array2),array1,和,array2,为需要确定相关性的两组数据,两种方法的区别,方法,1,可以求出一批变量之间的相关系数,方法,2,只可以求出,2,个变量之间

5、的相关系数,回归分析,回归分析侧重考察变量之间的数量伴随关系,并通过建立变量之间的数学表达式将这种关系描述出来,进而确定一个或几个自变量的变化对另一个特定变量(因变量)的影响程度,从而由自变量的取值预测因变量的可能值。,从一组样本数据出发,确定变量之间的数学关系式。,对该关系式的可信度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响是显著的,哪些是不显著的。,利用所求的关系式,根据一个或几个变量的取值来估计或预测另一个特定变量的取值,并给出这种估计或预测的可靠程度。,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析。按照自变量和因变量之间的关系类型,可分为线

6、性回归分析和非线性回归分析。,10,一元线形回归分析,回归基本上可视为一种拟合过程,即用最恰当的数学方程去拟合一组由一个因变量和一个或多个自变量所组成的原始数据。,最简单的形式是线性回归,它有一个因变量和一个自变量,因此就是用一个线性方程,y=a+bx+,去拟合一系列对变量,x,和,y,的数据观察值的过程。,11,回归模型建立的步骤,获取自变量和因变量的观测值;,绘制,XY,散点图,观察自变量和因变量之间是否存在线性关系;,写出带未知参数的回归方程;,工具,-,数据分析,-,回归。,回归方程检验;,R,2,判断回归方程的拟合优度;,t,统计量及相伴概率值,自变量与因变量之间的关系;,F,统计量

7、及相伴概率值,判断方程的回归效果显著性。,进行预测。,12,回归模型的检验,判定系数,R,2,用来判断回归方程的拟合优度。通常可以认为当,R,2,大于,0.9,时,所得到的回归直线拟合得较好,而当,R,2,小于,0.5,时,所得到的回归直线很难说明变量之间的依赖关系。,t,统计量,如果对于某个自变量,其,t,统计量的,P,值小于显著水平(或称置信度、置信水平),则可认为该自变量与因变量是相关的。,F,统计量,如果,F,统计量的,P,值小于显著水平(或称置信度、置信水平),则可认为方程的回归效果显著。,13,示例,2-,一元回归分析示例,14,散点图与趋势线,根据数据建立散点图,自变量放在,X,

8、轴,因变量放在,Y,轴,简单线性拟合,添加趋势线,(,类型为“线性”,),,选定“显示公式”和“显示,R,2,值”,得到趋势线,(,线性,),方程和,R,2,15,利用分析工具进行一元线形回归分析,加载宏,分析工具库,数据,数据分析,回归,在“回归”对话框输入,X,值和,Y,值的区域,选择“标志”,确定输出区域,将,X,代入线性方程,进行预测,X=210,,,Y=1379.372,16,数据分析结果,t,统计量的,P,值小于显著水平(,0.05,),可认为该自变量对因变量的影响是显著的。,F,统计量的,P,值小于显著水平(,0.05,),可认为回归模型的总体效果显著,所有自变量和因变量的线性关

9、系总体显著。,判定系数,R2,是对估计的回归方程拟合优度的度量,取值范围,0,,,1,。,R2,越接近,1,,表明回归直线与观测点越接近,回归直线的拟合程度越好。,R2=0.8463=84.63%50%,说明方程拟合程度较好,17,示例,3-,二次方程拟合示例,已知一种新牌子化肥的不同施用量对庄稼产量的影响如下表。请你确定当化肥施用量为,5.5,克时估计预期的产量。,化肥施用量,x(,克,),0,1,2,3,4,5,6,7,8,9,10,产量,(,公斤,),0.21,0.35,0.41,0.46,0.5,0.52,0.53,0.53,0.53,0.51,0.49,18,二次方程拟合步骤,根据数

10、据建立散点图,自变量放在,X,轴,因变量放在,Y,轴,添加趋势线,类型为多项式,选定“显示公式”和“显示,R,2,值”,结果很明显,拟合程度从线性方程的,60%,提高到二次方程的,97%,。,反映出观察到的饱和程度。,19,示例,4-,最大利润模型(思考),假设庄稼以每公斤,4,元的价格出售,化肥要以每克,0.2,元的价格购买。请确定能产生最大利润的化肥施用量。,(,运用规划求解,),总收益,=,价格,产量,=4,元,(-0.0066X,2,+0.0897x+0.2419),总成本,=,化肥成本,化肥施用量,=0.2X,20,多元回归分析,多元线性回归模型的一般形式,多元线性回归预测步骤,获得

11、候选自变量和因变量的观测值;,从候选自变量中选择合适的自变量,最优子集法,向前增选法等,确定回归系数,判断回归方程的拟合优度;,根据回归方程进行预测。,21,示例,5,:销售量的多元回归分析,某一生产空调的企业将其连续,15,年的销量和员工的薪酬及当地的平均户总收入情况的数据作了一个汇总,这些数据显示在工作表“多元回归补充”中。该企业的管理人员试图根据这些数据找到销量与其他两个变量之间的关系,以便进行销量的预测并为未来的预算工作提供参考。试根据这些数据分析一下,建立何种模型比较合适,并假设未来某年员工的薪酬为,25,万元,平均户总收入为,33.4,的情况下,预测该年的销量。,22,结果分析,F

12、统计量的,P,值小于显著水平(,0.05,),可认为回归模型的总体效果显著,所有自变量和因变量的线性关系总体显著。,R2=0.9984=99.84%50%,说明方程拟合程度较好,t,统计量的,P,值小于显著水平(,0.05,),可认为该自变量对因变量的影响是显著的。,建立回归方程,销量,=5.92*,员工薪酬,+8.65*,平均户总收入,+105.44,预测值,=5.92*250+8.65*33.4+105.44,23,示例,6-,建立不良贷款的回归方程,利用示例,1,中的数据,构建不良贷款对其他变量的估计方程。置信度为,95%,。,数据,-,数据分析,-,回归,以不良贷款为因变量,以各项贷

13、款余额、本年累计应收贷款、贷款项目个数、本年固定资产投资额为自变量,进行回归模型估计,24,结果分析,可见,需要剔除本年累计应收贷款、贷款项目个数、本年固定资产投资额,3,个自变量,只用各项贷款余额作为自变量构建回归模型,t,统计量的,P,值大于显著水平(,0.05,),建立回归方程时应剔除该自变量,t,统计量的,P,值小于显著水平(,0.05,),可用该自变量建立回归方程,25,求不良贷款的回归方程,构建不良贷款对贷款余额的估计方程,y=-0.82929+0.03789x,回归系数,0.03789,表示贷款余额每增加,1,亿元,不良贷款平均增加,0.03789,亿元,26,课堂练习、作业,课

14、堂练习:示例,1-6,作业:,P200-2,、,3,、,5,,,7,,,9,、,11,、,17,、,18,所有用到的数据请自行安排组织写入到,excel,,每个题目一个工作表,在做回归分析时,不要只摆结果,也请认真做好分析,是否可以构建回归方程,-R2,、,F,、,t,统计量的分析,回归方程是什么,如果需要进行预测,请写出预测结果,27,思考题,-,基于多元线性回归模型的国民经济发展研究,国内生产总值,(GDP),和国民生产总值,(GNP),在经济学中常作为衡量国家或地区经济发展综合水平的重要指标。对影响,GDP,的几个重要因素进行分析,可以为我国国民经济发展走势提供理论与数据支持。,GDP,

15、的计算方法一般有支出法和收入法。支出法核算,GDP,,就是从产品的使用出发,把一年内购买的各项最终产品的支出加总而计算出的该年内生产的最终产品的市场价值。在现实生活中,产品和劳务的最后使用,主要是居民消费、企业投资、政府购买和出口。考虑到数据的可得性,考虑选取全社会固定资产投资、社会消费品零售额、进出口贸易总额、地方财政收入这四个变量作为解释变量来研究,GDP,的变化情况。,数据的搜集,上海对外贸易学院主页,-,图书馆,-,电子数据库,-,事实类数据库,-,中国经济信息网,中经专网,-,统计数据,-,地区年鉴,搜集中国各地在,2011,年的下述数据,因变量,:,国内生产总值,自变量,:,选取全社会固定资产投资、社会消费品零售额、进出口贸易总额、地方财政收入,将搜集的数据整理到,excel,运用所学的相关分析和多元回归分析确定上述各因素对,GDP,的影响,并写出决策结论,.,

展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服