1、1.了解随机误差、残差、残差图的概念.2.会用残差分析判断线性回归模型的拟合效果.3.掌握建立回归模型的步骤.4.通过对典型案例的探究,了解回归分析的基本思想方法和初步应用.1.回归分析(1)函数关系是一种确定性关系,而相关关系是一种非确定性关系,即自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系.(2)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法,回归分析的基本步骤是画出两个变量的散点图,求回归直线方程,并用回归直线方程进行预报.【做一做1-1】在回归分析过程中,散点图的作用是()A.查找个体个数B.比较个体数据的大小关系C.探究个体分类D.粗略
2、判断变量是否线性相关解析:散点图能直观形象地反映两个变量间的关系,可以粗略地判断两个变量间是否存在线性关系.故选D.答案:D【做一做1-2】在下列各组量中:正方体的体积V与棱长a;一块农田的水稻产量与施肥量;人的身高与年龄;家庭的支出与收入;某户家庭的用电量与电价.其中量与量之间的关系是相关关系的是()A.B.C.D.解析:是函数关系V=a3;电价是统一规定的,与用电量的关系是确定的关系.中的两个量之间的关系都是相关关系,因为水稻的产量与施肥量在一定范围内是正比、反比或其他关系,并不确定;人的身高一开始随着年龄的增大而增加,之后则不变化或降低,在身高增加时,也不是均匀增加的;家庭的支出与收入有
3、一定的关系,这种关系是相关关系,不是确定关系.答案:D2.线性回归模型(2)线性回归模型y=bx+a+e,其中e称为随机误差,自变量x称为解释变量,因变量y称为预报变量.(3)随机误差产生的原因3.刻画回归效果的方式【做一做3】下列四个命题中正确的是()在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量;残差平方和越小的模型,拟合的效果越好;用R2来刻画回归方程,R2越小,拟合的效果越好;在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.A.B.C.D.解析:e是一个不可观测的量,故
4、不正确;R2越小,残差平方和越大,即模型的拟合效果越差,故不正确;是正确的.故选B.答案:B1.相关关系与函数关系的区别与联系是什么?剖析:(1)两者之间的区别.相关关系是一种非确定性关系.如人的身高与年龄、商品的销售额与广告费等都是相关关系.而函数关系中的两个变量是一种确定性关系.如正方形的面积S与边长x之间的关系S=x2就是函数关系,即对于边长x的每一个确定的值,面积S都有唯一确定的值与之对应.函数关系是一种因果关系,而相关关系不一定是因果关系.(2)两者之间的联系.相关关系与函数关系有着密切的联系,在一定条件下可以相互转化.例如正方形的面积S与其边长x之间虽然是一种确定性关系,但在每次测
5、量时,由于测量误差等原因,其数值大小又表现出一种随机性,而对于具有相关关系的两个变量来说,当求得其回归直线方程后,我们又可以用一种确定的关系对这两个变量间的关系进行估计.2.怎样理解散点图和R2的关系?剖析:散点图可以说明变量间有无线性相关关系,但不能精确地说明两个变量之间关系的密切程度,因此需要计算R2来描述两个变量之间关系的密切程度.知识拓展两种特殊非线性回归模型的转化.(1)将幂型函数y=axm(a为正的常数,x,y取正值)化为线性函数.若将y=axm两边同取以10为底的对数,则有lgy=mlgx+lga.令u=lgy,v=lgx,lga=b,代入上式,得u=mv+b,其中m,b是常数.
6、这是u,v的线性函数.若以u为纵坐标,v为横坐标,则u=mv+b的图象就是一条直线.(2)将指数型函数y=cax(a0,且a1,c0且为常数)化为线性函数.将y=cax两边同取以10为底的对数,有lgy=xlga+lgc,令lgy=u,lga=k,lgc=b,得u=kx+b,其中,k和b是常数,与幂型函数不同的是x依然保持原来的,只是用u代替了y的对数lgy.3.线性回归分析需要注意哪些方面?剖析:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(1)用散点图分析线性相关关系.用散点图能较粗略地分析和判断两个具有相关关系的变量是否线性相关.如果是线性相关的,可以求其线性回归方程;
7、如果不是线性相关的,通过运用某种变换把不呈线性相关关系的两个量变为线性相关关系.题型一题型二题型三题型四概念的理解和判断【例1】有下列说法:线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;通过回归其中正确命题的个数是()A.1B.2C.3D.4题型一题型二题型三题型四解析:解答本题时,可先逐一核对相关概念及性质,然后再逐一作出判断,最后得出结论.反映的正是最小二乘法思想,故正确;反映的是散点图的作用,故正确;是不正确的,在求回归方程之前必须进行相关性检验,以体现两个变量的关系.答案:C题型一题型二题型三题
8、型四反思回归分析的过程:(1)随机抽取样本,确定数据,形成样本点;(2)由样本点形成散点图,判断变量是否具有线性相关关系;(3)由最小二乘法确定线性回归方程;(4)由回归方程观察变量的取值及变化趋势.题型一题型二题型三题型四题型一题型二题型三题型四线性回归分析【例2】为研究质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表所示:(1)作出散点图,并求线性回归方程;(2)求出R2;(3)进行残差分析.分析:题型一题型二题型三题型四解:(1)散点图如图所示.题型一题型二题型三题型四(2)列表如下:题型一题型二题型三题型四题型一题型二题型三题型四【变式训练2
9、】已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下5组数据:求y对x的回归直线方程,并说明回归模型拟合效果的好坏.题型一题型二题型三题型四题型一题型二题型三题型四题型一题型二题型三题型四非线性回归分析【例3】下表为收集到的7组数据:(1)作出x与y的散点图,并猜测x与y之间的关系;(2)建立x与y的关系;(3)利用所得模型,预报当x=40时y的值.题型一题型二题型三题型四题型一题型二题型三题型四(2)对两边取对数把指数关系变为线性关系,令z=lny,则变换后的样本点应分布在直线z=bx+a(a=lnc1,b=c2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性
10、回归方程了,数据可以转化为(3)当x=40时,y=e0.272x-3.8491131.题型一题型二题型三题型四反思解决非线性回归问题的方法及步骤:(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图,并与学过的函数(幂函数、指数函数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;(3)变量置换,通过变量置换把非线性回归问题转化为线性回归问题,并求出线性回归方程;(4)根据相应的变换,写出非线性回归方程.题型一题型二题型三题型四【变式训练3】为了研究某种细菌随时间x(单位:天)变化时,繁殖个数y(单位:个)的变化,收集数据如下:解:(1)作出的散点图如图所示.(
11、1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系.题型一题型二题型三题型四题型一题型二题型三题型四易错辨析易错点:把非线性回归问题当作线性回归问题致错【例4】在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程.题型一题型二题型三题型四错解:由已知条件制成下表:题型一题型二题型三题型四错因分析本题直接取已知数据求回归直线方程,没有画出散点图进行线性相关性的检验,而本题的样本点恰好不是线性相关的.根题型一题型二题型三题型四正解:根据散点图(如图)可知y与x近似地呈反比例函数关系,题型一题型二题型三题型四由散点图(略)可以看出y与t呈近似的线性相关关系,列表如下:题型一题型二题型三题型四题型一题型二题型三题型四反思求回归直线方程,应先对样本点是否线性相关进行判断,因为对于任何一组样本点,都可以根据最小二乘法求得一个回归直线方程,但这条回归直线不一定较好地反映了样本点的分布.可以通过散点图首先作出是否线性相关的判断,然后再选择恰当的回归模型进行模拟.