收藏 分销(赏)

3.1《回归分析的基本思想及其初步应用》.pptx

上传人:天**** 文档编号:10295651 上传时间:2025-05-18 格式:PPTX 页数:25 大小:313.55KB
下载 相关 举报
3.1《回归分析的基本思想及其初步应用》.pptx_第1页
第1页 / 共25页
3.1《回归分析的基本思想及其初步应用》.pptx_第2页
第2页 / 共25页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,回归分析,选修,2-3,1/25,1,、两个变量关系,不相关,相关关系,函数关系,线性相关,非线性相关,问题,1,:现实生活中两个变量间关系有哪些?,相关关系:,对于两个变量,当自变量取值一定时,因变量取值带有一定随机性两个变量之间关系。,2/25,2,、,现实生活中存在着大量相关关系。,如:人身高与年纪;,产品成本与生产数量;,商品销售额与广告费;,家庭支出与收入。等等,探索:水稻产量,y,与施肥量,x,之间大致有何规律?,3/25,10 20 30 40 50,500,450,400,350,300,发觉:图中各点,大致分布在某条直线附近。,探索,2,:在这些点附近可画直线不止一条,哪条直线最能代表,x,与,y,之间关系呢?,x,y,施化肥量,水稻产量,施化肥量,x,15 20 25 30 35 40 45,水稻产量,y,330 345 365 405 445 450 455,散点图,4/25,最小二乘法:,称为样本点中心,。,5/25,1,、已知回归直线斜率预计值为,1.23,,样本点,中心为(,4,5,),则回归直线方程为(),C,练习:,6/25,0326,2,、某考查团对全国,10,个城市进行职员人均工资水平,x,(千元)与居民人均消费水平,y,(千元)统计调查,,y,与,x,含有相关关系,回归方程,y,=0.66,x+,1.562,,若某城市居民人均消费水平为,7.675,(千元),预计该城市人均消费额占人均工资收入百分比约为,(),A,83%B,72%C,67%D,66%,A,7/25,问题,2,:对于线性相关两个变量用什么方法来刻划之间关系呢?,2,、最小二乘预计,最小二乘预计下线性回归方程:,8/25,例,1,从某大学中随机选取,8,名女大学生,其身高和体重数据如表,1-1,所表示。,59,43,61,64,54,50,57,48,体重,/kg,170,155,165,175,170,157,165,165,身高,/cm,8,7,6,5,4,3,2,1,编号,求依据一名女大学生身高预报她体重回归方程,并预报一名身高为,172cm,女大学生体重。,问题一:结合例,1,得出线性回归模型及随机误差。而且,区分函数模型和回归模型。,解:,1,、选取身高为自变量,x,,体重为因变量,y,,作散点图:,9/25,2.,回归方程:,探究:身高为,172cm,女大学生体重一定是,60.316kg,吗?假如不是,你能解析一下原因吗?,10/25,因为全部样本点不共线,而只是散布在某一直线附近,所以身高和体重关系能够用,线性回归模型,来表示:,注:随机误差,e,包含预报体重不能由身高线性函数解释全部部分。,11/25,函数模型与“回归模型”关系,函数模型:因变量,y,完全由自变量,x,确定,回归模型:预报变量,y,完全由解释变量,x,和随机误差,e,确定,12/25,问题二:在线性回归模型中,,e,是用,bx+a,预报真实值,y,随机误差,它是一个不可观察量,那么应怎样研究随机误差呢?,结合例,1,除了身高影响体重外其它原因是不可测量,不能希望有某种方法获取随机误差值以提升预报变量预计精度,但却能够预计预报变量观察值中所包含随机误差,这对我们查找样本数据中错误和模型评价极为有用,所以在此我们引入残差概念。,13/25,问题三:怎样发觉数据中错误?怎样衡量随机模型拟合效果?,(1),我们能够经过分析发觉原始数据中可疑数据,判断建立模型拟合效果。,14/25,残差图制作和作用:,制作:坐标,纵轴,为残差变量,横轴能够有不一样选择,.,横轴,为编号:能够考查残差与编号次序之间关系,,横轴,为解释变量:能够考查残差与解释变量关系,,作用:判断模型适用性若模型选择正确,残差图中点应该分布在以横轴为中心带形区域,.,15/25,下面表格列出了女大学生身高和体重原始数据以及对应残差数据。,编号,1,2,3,4,5,6,7,8,身高,/cm,165,165,157,170,175,165,155,170,体重,/kg,48,57,50,54,64,61,43,59,残差,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,16/25,残差图制作及作用。,坐标纵轴为残差变量,横轴能够有不一样选择;,若模型选择正确,残差图中点应该分布在以横轴为心带形区域,;,对于远离横轴点,要尤其注意,。,身高与体重残差图,异常点,错误数据,模型问题,几点说明:,第一个样本点和第,6,个样本点残差比较大,需要确认在采集过程中是否有些人为错误。假如数据采集有错误,就给予纠正,然后再重新利用线性回归模型拟合数据;假如数据采集没有错误,则需要寻找其它原因。,另外,残差点比较均匀地落在水平带状区域中,说明选取模型计较适当,这么带状区域宽度越窄,说明模型拟合精度越高,回归方程预报精度越高。,17/25,显然,,R,2,值越大,说明残差平方和越小,也就是说模型拟合效果越好。,在线性回归模型中,,R,2,表示解析变量对预报变量改变贡献率。,R,2,越靠近,1,,表示回归效果越好(因为,R,2,越靠近,1,,表示解析变量和预报变量线性相关性越强),。,假如某组数据可能采取几个不一样回归方程进行回归分析,则能够经过,比较,R,2,值来做出选择,即选取,R,2,较大模型作为这组数据模型。,注:相关指数,R,2,是度量模型拟合效果一个指标。在线性模型中,,它代表自变量刻画预报变量能力。,(,2,)我们能够用,相关指数,R,2,来刻画回归效果,其计算公式是,18/25,问题四:若两个变量展现非线性关系,怎样处理?(分析例,2,),例,2,一只红铃虫产卵数,y,和温度,x,相关。现搜集了,7,组观察数据列于表中:,温度,x,o,C,21,23,25,27,29,32,35,产卵数,y,/,个,7,11,21,24,66,115,325,(,1,)试建立产卵数,y,与温度,x,之间回归方程;并预测温度为,28,o,C,时产卵数目。,(,2,)你所建立模型中温度在多大程度上解释了产卵数改变?,19/25,选变量,解:选取气温为解释变量,x,,产卵数,为预报变量,y,。,画散点图,假设线性回归方程为,:,=bx+a,选 模 型,分析和预测,当,x,=28,时,,y=,19.8728-463.73 93,预计参数,由计算器得:线性回归方程为,y=,19.87,x,-463.73,相关指数,R,2,=0.7464,所以,一次函数模型中温度解释了,74.64%,产卵数改变。,0,50,100,150,200,250,300,350,0,3,6,9,12,15,18,21,24,27,30,33,36,39,当,x,=28,时,,y=,19.8728-463.73 93,方法一:一元函数模型,20/25,y=,c,1,x,2,+,c,2,变换,y=,c,1,t+,c,2,非线性关系 线性关系,问题,选取,y=c,1,x,2,+c,2,问题,3,产卵数,气温,问题,2,怎样求,c,1,、,c,2,?,t,=x,2,方法二,二元函数模型,21/25,平方变换:,令,t=x,2,,产卵数,y,和温度,x,之间二次函数模型,y=bx,2,+a,就转化为产卵数,y,和温度平方,t,之间线性回归模型,y=bt+a,温度,21,23,25,27,29,32,35,温度平方,t,441,529,625,729,841,1024,1225,产卵数,y,/,个,7,11,21,24,66,115,325,作散点图,并由计算器得:,y,和,t,之间线性回归方程为,y=,0.367,t,-202.54,,相关指数,R,2,=0.802,将,t=x,2,代入线性回归方程得:,y=,0.367,x,2,-202.54,当,x,=28,时,,,y,=0.36728,2,-202.5485,,且,R,2,=0.802,,,所以,二次函数模型中温度解,释了,80.2%,产卵数改变。,t,22/25,产卵数,气温,变换,y=bx+a,非线性关系 线性关系,对数,方法三:指数函数模型,23/25,温度,x,o,C,21,23,25,27,29,32,35,z=lgy,0.85,1.04,1.32,1.38,1.82,2.06,2.51,产卵数,y,/,个,7,11,21,24,66,115,325,x,z,当,x=28,o,C,时,,y 44,,指数回归模型中温度解释了,98%,产卵数改变,由计算器得:,z,关于,x,线性回归方程,为,z=0.272,x,-3.849,,,相关指数,R,2,=0.98,对数变换:在 中两边取自然对数得,令 ,则,就转换为,z,=bx+a,24/25,函数模型,相关指数,R,2,线性回归模型,0.7464,二次函数模型,0.802,指数函数模型,0.98,最好模型是哪个,?,显然,指数函数模型最好!,25/25,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服