收藏 分销(赏)

一元线性回归原理.ppt

上传人:a199****6536 文档编号:11265108 上传时间:2025-07-13 格式:PPT 页数:22 大小:1.33MB 下载积分:10 金币
下载 相关 举报
一元线性回归原理.ppt_第1页
第1页 / 共22页
一元线性回归原理.ppt_第2页
第2页 / 共22页


点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第,*,页,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,统计思维,回归的直观理解与原理,:,一元线性回归,1,7/13/2025,(一)问题的提出,例,1,假定需要研究化肥施用量与粮食产量的关系,以便准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量。,表,1,化肥施用量与粮食产量,化肥施用量,x(,万吨,),4541.05,3637.87,2287.49,3056.89,4883.7,3779.3,4021.09,粮食产量,y(,万吨,),48526.69,45110.87,40753.79,43824.58,50890.11,46370.88,46577.91,化肥施用量,x(,万吨,),2989.06,3021.9,3953.97,3212.13,3804.76,1598.28,1998.56,粮食产量,y(,万吨,),42947.44,41673.21,47244.34,43061.53,47336.78,37127.89,39515.07,化肥施用量,x(,万吨,),3710.56,3269.03,1017.12,1864.23,2797.24,1034.09,粮食产量,y(,万吨,),46598.04,44020.92,34866.91,37184.14,41864.77,33717.78,2,7/13/2025,图,1,化肥施用量与粮食产量的散点图,3,7/13/2025,上述变量间关系的特点:,变量间关系不能用函数关系精确表达,一个变量的取值不能由另一个变量唯一确定,当变量,x,取某个值时,变量,y,的取值可能有几个,各观测点分布在直线周围,x,y,4,7/13/2025,问题,两个变量之间有着密切的关系,但它们之间密切的程度并不能由一个变量唯一确定另一个变量,即它们间的关系是一种非确定性的关系。它们之间到底有什么样的关系呢,?,例,1,中由,20,组数据,粮食产量与化肥施用量的关系式,是如何得到的?,5,7/13/2025,解决方案,运用模型来拟合这些数据点。,观测值分解成两部分:,y,=,b,0,+,b,1,x,+,e,一元线性回归模型,x,y,观测项,=+,结构项,随机项,=+,6,7/13/2025,(二)一元线性回归模型,描述因变量,y,如何依赖于自变量,x,和误差项,的方程称为,回归模型,一元线性回归模型可表示为,y,=,b,0,+,b,1,x,+,e,y,是,x,的线性函数,(,部分,),加上误差项,线性部分反映了由于,x,的变化而引起的,y,的变化,误差项,是随机变量,反映了除,x,和,y,之间的线性关系之外的随机因素对,y,的影响,是不能由,x,和,y,之间,的线性关系所解释的变异性,0,和,1,称为模型的,参数,x,y,7,7/13/2025,一元线性回归模型,(,基本假定,),因变量,x,与自变量,y,之间具有线性关系,在重复抽样中,自变量,x,的取值是固定的,即假定,x,是,非随机的,误差项,是一个期望值为,0,的随机变量,即,E,(,)=0,。对于,一个,给定的,x,值,,y,的期望值为,E,(,y,)=,0,+,1,x,对于所有的,x,值,,的方差,2,都相同,误差项,是一个服从正态分布的随机变量,且,相互独立,。即,N,(0,2,),独立性意味着对于一个特定的,x,值,它所对应的,与其他,x,值所对应的,不相关,对于一个特定的,x,值,它所对应的,y,值与其他,x,所对应的,y,值也不相关,8,7/13/2025,回归方程,(regression equation),描述,y,的平均值或期望值如何依赖于,x,的方程称为,回归方程,一元线性回归方程的形式如下,E,(,y,)=,0,+,1,x,方程的图示是一条直线,也称为直线回归方程,0,是回归直线在,y,轴上的截距,是当,x,=0,时,y,的期望值,1,是直线的斜率,称为回归系数,表示当,x,每变动一个单位时,,y,的平均变动值,x,y,9,7/13/2025,x,y,(,x,n,y,n,),(,x,1,y,1,),(,x,2,y,2,),(,x,i,y,i,),问题:,回归直线如何确定?,10,7/13/2025,Karl Gauss,的最小化图,x,y,(,x,n,y,n,),(,x,1,y,1,),(,x,2,y,2,),(,x,i,y,i,),e,i,=,y,i,-,y,i,目标:找一条直线尽可能的拟合这,n,个样本点。,11,7/13/2025,(,三)最小二乘估计,(least-squares estimation),德国科学家,Karl Gauss(1777,1855),提出用,最小化图中垂直方向的误差平方和,来估计参数,使因变量的观察值与估计值之间的误差平方和达到最小来求得 和 的方法。即,用最小二乘法拟合的直线来代表,x,与,y,之间,的关系与实际数据的误差比其他任何直线都小,12,7/13/2025,问题,如何估计 使得,最小,13,7/13/2025,解决方法,根据微积分法求极值的原理,,通过求偏导数并命其为,0,而得到:,这组方程称为,正规方程组,经过整理,,可得?,14,7/13/2025,其中,,记,可以简写为,经过整理,可得,15,7/13/2025,例,1,假定需要研究化肥施用量与粮食产量的关系,以便准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量。,表,1,粮食产量与化肥施用量,化肥施用量,x(,万吨,),4541.05,3637.87,2287.49,3056.89,4883.7,3779.3,4021.09,粮食产量,y(,万吨,),48526.69,45110.87,40753.79,43824.58,50890.11,46370.88,46577.91,化肥施用量,x(,万吨,),2989.06,3021.9,3953.97,3212.13,3804.76,1598.28,1998.56,粮食产量,y(,万吨,),42947.44,41673.21,47244.34,43061.53,47336.78,37127.89,39515.07,化肥施用量,x(,万吨,),3710.56,3269.03,1017.12,1864.23,2797.24,1034.09,粮食产量,y(,万吨,),46598.04,44020.92,34866.91,37184.14,41864.77,33717.78,最小二乘法求解回归方程实例,16,7/13/2025,解:,17,7/13/2025,回归方程为:,18,7/13/2025,直观来看,回归直线与,20,个样本数据点都很接近,说明回归直线对数据的拟合效果是好的。,图,1,化肥施用量与粮食产量的散点图,19,7/13/2025,最小二乘估计的软件实现、输出结果,回归方程为:,20,7/13/2025,小结:估计的回归方程,一元线性回归中估计的回归方程为,用,样本统计量 和 代替回归方程中的未知参数 和 ,就得到了,估计的回归方程,总体,回归参数 和,是未知的,必须利用样本数据去估计,其中:是估计的回归直线在,y,轴上的截距,是直线的斜率,它表示对于一个给定的,x,的值,是,y,的估计值,也表示,x,每变动一个单位时,,y,的平均变动值,.,21,7/13/2025,“回归”名称的由来,十九世纪,英国生物学家兼统计学家高尔顿研究父母身高与其子女身高的遗传问题时,观察了,1078,对夫妇,以每对夫妇的平均身高作为,x,(单位:英寸,,1,英寸,=2.54,厘米),取他们的一个成年儿子的身高作为,y,,绘制散点图发现趋势近乎一条直线,计算出的直线方程为:,这种趋势表明子代的身高,向中心回归,,才使得人类的身高在一定时间内相对稳定,没有出现两极分化现象。,其后研究变量,x,和变量,y,的统计关系时借用这个名词。,22,7/13/2025,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服