收藏 分销(赏)

高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修1-2 课件.ppt

上传人:pc****0 文档编号:13270513 上传时间:2026-02-16 格式:PPT 页数:26 大小:1,018KB 下载积分:10 金币
下载 相关 举报
高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修1-2 课件.ppt_第1页
第1页 / 共26页
高中数学 1.1 回归分析的基本思想及其初步应用课件 新人教A版选修1-2 课件.ppt_第2页
第2页 / 共26页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,人教A版高中数学选修12,多媒体课件,多思、创新、融合,回归分析的基本思想,及其初步应用,通过对必修的学习,我们知道,变量之间存在关系时,有两种关系:,确 定 性 关 系,非确定性关系,函数关系,相关关系,函数关系是非常明确的关系,相关关系却是一种变化的,通过,数学,3,的学习我们知道,,回归分析,(regression analysis),是相关关系的一种分析方法,它是对具有相关关系的两个变量进行统计分析一般步骤为:,散点图,求回归方程,利用回归方程预报,下面我们通过实际案例。进一步学习回归分析的基本思想及其应用,例,1.,从某大学中随机选取,8,名女大学生。其身高和体重数据如表所示:,编号,1,2,3,4,5,6,7,8,身高,cm,165,165,157,170,175,165,155,170,体重,kg,48,57,50,54,64,61,43,59,求根据一名大学生的身高预报她的体重的回归方程,并预报一名,172cm,的女大学生的体重。,解,利用前面的知识我们首先作身高,x,和体重,y,的散点图:,从图可以看出,样本点的分布有比较好的线性关系,因此可以用线性回归来刻画它们之间的关系,.,会求它们的方程吗,?,事实上,从散点图可以看出,样本点并不是分布在这条直线上,而是分布在它的两边,所以严格来说:,y=bx+a,不是真正的表示它们之间的关系,这时我们把身高和体重的关系做一下调整来模拟回归关系:,Y=bx+a+e,其中,a,和,b,为模型的未知参数,,e,称为,随机误差,如何产生的?,身高,X(cm,),体重,y(kg),饮食习惯,运动习惯,质量误差,线性回归模型,y=bx+a+e,与我们了的一次函数模型不同之处在于多了一个随机误差,e,,,y,的值有它们一起决定,解释变量,x,预报变量,y,随机误差,e,如何估计a,b,e?,1.a,,,b,的估计:,a,b,的估计和最小二乘法估计一样,其中,称为样本的中心,2.e,的估计,y=0.849x-85.712,通过,数学,3,的学习我们知道,它们之间是正相关的,我们用它们的,相关系数,r,来衡量它们之间的相关性的强弱,在上面的例子中我们假设体重与身高没有关系即:体重都为:,则,她们身高体重的散点图应该在一条水平直线上:,事实上,并非如此,它们和,45.5,之间存在差别,这时我们就引入随机误差,利用随机误差和解释变量共同来预报变量,y,把所有的这种效应利用,总体偏差平方和,合并成一个数,总体偏差平方和,解释变量,随机误差,?,?,我们现在要弄清楚这个总的效应中,有多少来自解释变量,有多少来自随机误差,即:哪一个效应起决定性作用?,怎样去刻画每个效应呢?,根据我们在,数学,3,总的知识,我们知道:每个点与回归方程的差异我们可以用 来表示,记作:,(,残差,(residual),它刚好可以表示随机误差的效应。,为什么说可以用残差来,表示随机误差的效应?,为了回归的准确和计算的方便我们引入,残差平方和,(residual sum of squares),它代表随机误差的效应,求出了随机误差的效应后,我们就比较容易得到解释变量的效应了。同学们知道怎样求吗?,解释变量的效应,总体偏差平方和,残差平方和,回归平方和,(,regression sun of squares,),你会计算上面的,总体偏差平方和,、,残差平方和,、,回归平方和,吗?,354,128.361,225.639,有了这些评估效应的方法,我们就可以利用它们来刻画总体效应,事实上,为了将我们的计算简化,我们又引入相关指数,R,2,来刻画回归的效果:,残差平方和,总体偏差平方和,显然,当,R,2,的值越大,说明残差所占的比例越小,回归效果约好;反之,回归效果越差。一般的,当,R,2,越接近于,1,说明解释变量和预报变量之间的相关性越强,如果同一个问题,采用不同的回归方法分析,我们可以通过,选择,R,2,大的来作为回归模型,一般方法:,1.,利用散点图观察两个变量是否线性相关,2.,利用残差来判断模型拟合的效果,(,残差分析,),利用,残差图,来分析数据,对,可疑数据,(,残差较大的数据,),进行重新调查,有错误就更正,然后重新利用回归模型拟合,如果没有错误,则需要找其他原因。,残差图:,编号,1,2,3,4,5,6,7,8,身高,cm,165,165,157,170,175,165,155,170,体重,kg,48,57,50,54,64,61,43,59,残差,-6.373,2.627,2.419,-4.618,1.137,6.627,-2.883,0.382,问题数据,越窄越好,说明,1.,回归方程只适合对所研究总体的估计,2.,回归方程是对数据的模拟,数据的改变,可能会导致回归方程的变化,3.,不同的回归样本数据,有不同的回归方程,也适合不同的回归总体,,4.,回归方程是预报变量的平均值,而不是精确值,5.,回归的好坏可以由相关指数来评价,建立回归方程的一般步骤:,1.,确定变量,2.,制作散点图,观察是否相关,3.,确定回归方程的类型,(,线性回归、指数回归、对数回归等,),4.,利用公式确定回归参数,5.,利用残差分析回归是否合理或模型是否合适,例,2,一只红蛉虫的产卵数,y,与温度,x,有关,现收集了,7,组数据,请建立,y,与,x,建德回归方程,温度,x,21,23,25,27,29,32,35,产卵数,y/,个,7,11,21,24,66,115,325,解,1.,制作散点图,2.,观察模拟,样本点不能直接利用线性回归,根据我们的函数知识,它应该是一个指数模型,:,y=c,1,e,c,2,x,其中,c,1,c,2,为参数,或,二次函数模型,根据对数回归知识我们知道,:,令,z=,lny,将其变换到样本点的分布直线,z=,a+bx,x,21,23,25,27,29,32,35,z,1.946,2.398,3.045,3.178,4.190,4.745,5.784,z=0272x-3.843,会求着条直线吗?,则,:y=e,0.272x-3.843,2.,我们认为样本点集中在某二次函数,y=c,3,x,2,+c,4,附近,,c,3,c,4,为参数,则,令,t,x,2,则:,y=c,5,t+c,6,其中,c,5,c,6,为参数,t,441,529,625,729,841,1024,1225,y,7,11,21,24,66,115,325,y=0.367t-202.54,不适合利用线性回归,为什么这样说?,4.,残差分析:,X,21,23,25,27,29,32,35,合计,(,残差平方和,),R,2,Y,7,11,21,24,66,115,329,e,(1),0.518,-0.167,1.760,-9.149,8.889,-14.153,32.928,1450.673,0.98,e,(2),47.693,19.397,-5.835,-41.003,-40.107,-58.268,77.965,15448.432,0.80,由图的对比可以看出,指数模拟,优于,线性模拟,小结,回归分析基本思想及其初步应用,基本思想,实际应用,回归分析,相关性方法分析,回归优劣分析,总偏差平方和,残差平方和,回归平方和,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 教育专区 > 高中数学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服