1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,回归分析,选修,1-2,(一),2/14/2026,1,回顾:,必修,3(,第二章 统计,),知识结构,收集数据,(,随机抽样,),整理、分析数据估计、推断,简单随机抽样,分层抽样,系统抽样,用样本估计总体,变量间的相关关系,用样本的频率分布估计总体分布,用样本数字特征估计总体数字特征,线性回归分析,2/14/2026,2,1,、两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,问题,1,:现实生活中两个变量间的关系有哪些?,相关关系:,对于两个变量,当自变量取值一定时,因变量的取值
2、带有一定随机性的两个变量之间的关系。,2/14/2026,3,思考,:相关关系与函数关系有怎样的不同?,函数关系中的两个变量间是一种确定性关系,.,相关关系是一种非确定性关系,.,函数关系是一种理想的关系模型,.,相关关系在现实生活中大量存在,是更一般的情况,.,2/14/2026,4,问题,2,:对于线性相关的两个变量用什么方法来刻划之间的关系呢?,2,、最小二乘估计,最小二乘估计下的线性回归方程:,2/14/2026,5,对一作直线运动的质点的运动过程作了,8,次观测,得到下表,试估计当,x=9s,时质点的位置,y,的值。,时刻,x,/s,1,2,3,4,5,6,7,8,位置观测值,y/c
3、m,5.54,7.52,10.02,11.73,15.69,16.12,16.98,21.06,例如:,2/14/2026,6,解,:(,1,),作出散点图,从散点图看出,样本呈,直线趋势,,时间,x,与位置观测值,y,有较好的,线性关系,,可以用,线性回归方程,刻画它们之间的关系,.,2/14/2026,7,i,x,i,y,i,x,i,2,x,i,y,i,1,1,5.54,1,5.54,2,2,7.52,4,15.04,3,3,10.02,9,30.06,4,4,11.73,16,46.92,5,5,15.69,25,78.45,6,6,16.12,36,96.72,7,7,16.98,49
4、118.9,8,8,21.06,64,168.5,36,104.66,204,560.1,(,2,),列表,2/14/2026,8,(,3,),求线性回归方程,:,y,=3.5361+2.1214x,2/14/2026,9,3,、,回归分析的基本步骤,:,画散点图,求回归方程,列表,2/14/2026,10,数学,必修,统计,画出散点图,.,求出,b,a,的值,.,求回归直线方程,.,用线性回归方程解决应用问题,.,2/14/2026,11,4,、,线性回归模型,其中,a+bx,是确定性函数,,是随机误差,注:,随机误差,产生的主要原因:,(1),所用的确定性函数不恰当;,(2),忽略了某些
5、因素的影响;,(3),存在观测误差。,思考,:在时刻,x,=9s,时,质点运动位置一定是,22.6287cm,吗?,2/14/2026,12,对于线性回归模型,应注意以下两个问题:,I,模型的合理性;,II,在模型合理的情况下,如何估计,a,b,.,2/14/2026,13,例,1.,下表给出我国从,1949,至,1999,年人口数,据资料,试根据表中数据估计我国,2004,年,的人口数。,年份,49,54,59,64,69,74,79,84,89,94,99,人口数,/,百万,542,603,672,705,807,909,975,1035,1107,1177,1246,年份,0,5,10,
6、15,20,25,30,35,40,45,50,人口数,/,百万,542,603,672,705,807,909,975,1035,1107,1177,1246,分析:先画图,2/14/2026,14,解:作出散点图,从散点图看出,这些点在一条直线附近,可以用,线性回归方程,刻画它们之间的关系,.,2/14/2026,15,i,x,i,y,i,x,i,2,x,i,y,i,1,0,542,0,0,2,5,603,25,3015,3,10,672,100,6720,4,15,705,225,5,20,807,400,6,25,909,625,7,30,975,900,8,35,1035,1225,
7、9,40,1107,1600,10,45,1177,2025,11,50,1246,2500,列表,2/14/2026,16,根据公式得:,b=14.453,a=527.591,线性回归方程为:,y,=527.591+14.453,x,当,x=55,时,,y=1322.506(,百万,),2/14/2026,17,例题,2.,一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了,10,次试验,测得数据如下:,零件数(,x,),个,10,20,30,40,50,60,70,80,90,100,加工时间,y,62,68,75,81,89,95,102,108,115,122,(1)y
8、与,x,是否具有线性相关?,(2),若,y,与,x,具有线性相关关系,求回归直线方程,(3),预测加工,200,个零件需花费多少时间?,2/14/2026,18,分析:这是一个回归分析问题,应先进行线性相关检验或作散点图来判断,x,与,y,是否具有线性相关才可以求解后面的问题。,作散点图如下:,不难看出,x,y,成线性相关。,2/14/2026,19,解,(,1,)列出下表:,i,1,2,3,4,5,6,7,8,9,10,x,i,10,20,30,40,50,60,70,80,90,100,y,i,62,68,75,81,89,95,102,108,115,122,x,i,y,i,620,1360,2250,3240,4450,5700,7140,8640,10350,12200,2/14/2026,20,问题,:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。,在怎样的情况下求得的回归直线方程才有实际意义,?,即建立的线性回归模型是否合理,?,如何对一组数据之间的线性相关程度作出定量分析?,2/14/2026,21,