1、3.1 回归分析(一)教学目标(1)通过实例引入线性回归模型,感受产生随机误差的缘由;(2)通过对回归模型的合理性等问题的争辩,渗透线性回归分析的思想和方法;(3)能求出简洁实际问题的线性回归方程教学重点,难点线性回归模型的建立和线性回归系数的最佳估量值的探求方法教学过程一问题情境1 情境:对一作直线运动的质点的运动过程观测了次,得到如下表所示的数据,试估量当x=时的位置y的值时刻/s位置观测值/cm依据数学(必修)中的有关内容,解决这个问题的方法是:先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间与位置观测值y之间有着较好的线性关系因此可以用线性回归方程来刻画它们之间的关系
2、依据线性回归的系数公式,可以得到线性回归方为,所以当时,由线性回归方程可以估量其位置值为2问题:在时刻时,质点的运动位置确定是吗?二同学活动思考,争辩:这些点并不都在同一条直线上,上述直线并不能精确地反映与之间的关系,的值不能由完全确定,它们之间是统计相关关系,的实际值与估量值之间存在着误差三建构数学1线性回归模型的定义:我们将用于估量值的线性函数作为确定性函数;的实际值与估量值之间的误差记为,称之为随机误差;将称为线性回归模型说明:(1)产生随机误差的主要缘由有:所用的确定性函数不恰当引起的误差;忽视了某些因素的影响;存在观测误差 (2)对于线性回归模型,我们应当考虑下面两个问题: 模型是否
3、合理(这个问题在下一节课解决); 在模型合理的状况下,如何估量,?2探求线性回归系数的最佳估量值:对于问题,设有对观测数据,依据线性回归模型,对于每一个,对应的随机误差项,我们期望总误差越小越好,即要使越小越好所以,只要求出访取得最小值时的,值作为,的估量值,记为,注:这里的就是拟合直线上的点到点的距离用什么方法求,?回忆数学3(必修)“24线性回归方程”P71“热茶问题”中求,的方法:最小二乘法利用最小二乘法可以得到,的计算公式为,其中,由此得到的直线就称为这对数据的回归直线,此直线方程即为线性回归方程其中,分别为,的估量值,称为回归截距,称为回归系数,称为回归值在前面质点运动的线性回归方程
4、中,3 线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位;4 化归思想(转化思想)在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们依据专业学问或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式 (1),令,则有 (2),令,则有 (3),令,则有 (4),令,则有 (5),令,则有四数学运用1例题:例1下表给出了我国从年至年人口数据资料,试依据表中数据估量我国年的人口数年份人口数/百万解:为了简化数据,先将年份减去,并将所得值用表示,对
5、应人口数用表示,得到下面的数据表:作出个点构成的散点图,由图可知,这些点在一条直线四周,可以用线性回归模型来表示它们之间的关系依据公式(1)可得这里的分别为的估计值,因此线性回归方程为由于年对应的,代入线性回归方程可得(百万),即年的人口总数估量为13.23亿.例2 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本(万元)与人均产出(万元)的数据:人均资本/万元人均产出/万元 (1)设与之间具有近似关系(为常数),试依据表中数据估量和的值; (2)估量企业人均资本为万元时的人均产出(精确到)分析:依据,所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方
6、程处理但由对数运算的性质可知,只要对的两边取对数,就能将其转化为线性关系解(1)在的两边取常用对数,可得,设,则相关数据计算如图所示1人均资本/万元345.56.578910.511.5142人均产出/万元4.124.678.6811.0113.0414.4317.525.4626.6645.230.477120.602060.740360.812910.84510.903090.954241.021191.06071.1461340.61490.669320.938521.041791.115281.159271.243041.405861.425861.65514仿照问题情境可得,的估量值,分别为由可得,即,的估量值分别为和 (2)由(1)知样本数据及回归曲线的图形如图(见书本 页)当时,(万元),故当企业人均资本为万元时,人均产值约为万元2练习:练习第题五回顾小结:1 线性回归模型与确定性函数相比,它表示与之间是统计相关关系(非确定性关系)其中的随机误差供应了选择模型的准则以及在模型合理的状况下探求最佳估量值,的工具;2 线性回归方程中,的意义是:以为基数,每增加1个单位,相应地平均增加个单位;3求线性回归方程的基本步骤六课外作业