资源描述
1.1,.,1,回归分析,1,.,1,.,2,相关系数,1/38,2/38,一、线性回归方程,1,.,原理,普通地,设有,n,个搜集到数据以下,:,当,a,b,能够满足使得,Q,(,a,b,),=,(,y,1,-a-bx,1,),2,+,(,y,2,-a-bx,2,),2,+,+,(,y,n,-a-bx,n,),2,取得最小值时,称,y=a+bx,为拟合这,n,对数据线性回归方程,该方程所表示直线称为,回归,直线,.,2,.,公式,3/38,名师点拨,假如散点图中点分布从整体上看大致在一条直线附近,那么我们称这两个变量之间含有线性相关关系,这条直线叫回归直线,从整体上看各点与此直线,“,距离,”,平方之和最小,即最贴近已知数据点,最能代表变量,x,与,y,之间关系,.,普通情况下,在还未断定两个变量之间是否含有线性相关关系情况下,应先进行相关性检验,在确认含有线性相关关系后,再求线性回归方程,.,(1),线性回归方程,y=a+bx,经过样本点中心,称为样本点中心,回归直线一定过此点,.,(2),线性回归方程中截距,a,和斜率,b,都是经过样本预计得来,存在着误差,.,这种误差可能造成预报结果偏差,.,(3),线性回归方程,y=a+bx,中,b,表示,x,增加,1,个单位时,y,改变量,而,a,表示,y,不随,x,改变而改变量,.,(4),能够利用线性回归方程,y=a+bx,预报在,x,取某一个值时,y,预计值,.,4/38,【做一做,1,】,(1),设有一个回归方程为,y=,2,-,2,.,5,x,当变量,x,增加,1,个单位时,(,),A.,y,平均增加,2,.,5,个单位,B.,y,平均增加,2,个单位,C.,y,平均降低,2,.,5,个单位,D.,y,平均降低,2,个单位,(2),某医院用光电比色检验尿汞时,得到尿汞含量,x,(,单位,:,毫克,/,升,),与消化系数,y,一组数据以下表,:,若,x,与,y,含有线性相关关系,则回归直线方程是,.,5/38,解析,:,(1),由回归方程系数,b=-,2,.,5,可知,x,每增加,1,个单位,则,y,平均降低,2,.,5,个单位,.,(2),利用公式得,b=,26,.,95,从而回归直线方程为,y=,26,.,95,x+,28,.,7,.,答案,:,(1)C,(2),y=,26,.,95,x+,28,.,7,6/38,二、相关系数,1,.,相关系数,2,.,正相关、负相关与线性不相关,(1),正相关,:,当,r,0,时,l,xy,0,从而,两个变量值总体上展现出,同时,增减趋势,此时称两个变量正相关,.,(2),负相关,:,当,r,0,时,b,0,一个变量,增加,另一个变量有,降低,趋势,称两个变量负相关,.,(3),线性不相关,:,当,r=,0,时,称两个变量线性不相关,.,7/38,尤其提醒,1,.,判断变量之间线性相关关系,普通用散点图,但在作图中,因为存在误差,有时极难判断这些点是否分布在一条直线附近,从而就极难判断两个变量之间是否含有线性相关关系,此时就必须利用线性相关系数来判断,.,2,.|r|,越靠近,1,它们散点图越靠近一条直线,这时用线性回归模型拟合这组数据效果就越好,.,3,.,相关系数,r,只能描述两个变量之间改变方向及亲密程度,不能揭示二者之间本质联络,.,4,.,相关系数,r,能够定量地反应出变量间相关程度,明确地给出有没有必要建立两变量间回归方程,.,8/38,【做一做,2,】,(1),设两个变量,x,与,y,之间含有线性相关关系,相关系数是,r,回归方程为,y=a+bx,那么必有,(,),A.,b,与,r,符号相同,B.,a,与,r,符号相同,C.,b,与,r,符号相反,D.,a,与,r,符号相反,(2),已知变量,x,和,y,满足关系,y=-,0,.,1,x+,1,变量,y,与,z,正相关,.,以下结论中正确是,(,),A.,x,与,y,正相关,x,与,z,负相关,B.,x,与,y,正相关,x,与,z,正相关,C.,x,与,y,负相关,x,与,z,负相关,D.,x,与,y,负相关,x,与,z,正相关,9/38,解析,:,(1),因为,b,与,r,分母均为正,且分子相同,所以,b,与,r,同号,.,(2),因为变量,x,和,y,满足关系,y=-,0,.,1,x+,1,其中,-,0,.,1,0),则将,y=-,0,.,1,x+,1,代入即可得到,:,z=k,(,-,0,.,1,x+,1),+b=-,0,.,1,kx+,(,k+b,),所以,-,0,.,1,k,0,所以,x,与,z,负相关,综上可知,应选,C,.,答案,:,(1)A,(2)C,10/38,思索辨析,判断以下说法是否正确,正确在后面括号内打,“,”,错误打,“,”,.,(1),线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点数学方法,.,(,),(2),利用样本点散点图能够直观判断两个变量关系是否能够用线性关系表示,.,(,),(3),经过回归方程,y=bx+a,能够预计和观察变量取值和改变趋势,.,(,),(4),因为由任何一组观察值都能够求得一个线性回归方程,所以没有必要进行相关性检验,.,(,),(5),回归分析是含有相关关系两个变量进行统计分析一个方法,.,(,),答案,:,(1),(2),(3),(4),(5),11/38,探究一,探究二,探究三,思维辨析,求回归直线方程,【例,1,】,已知某地域,4,10,岁女孩各自平均身高数据以下,:,求,y,对,x,线性回归方程,.,思绪分析,:,依据求回归系数公式求,a,b,再写出回归直线方程,.,12/38,探究一,探究二,探究三,思维辨析,13/38,探究一,探究二,探究三,思维辨析,反思感悟,求回归直线方程普通步骤,:,(1),作出散点图,依据问题所给数据在平面直角坐标系中描点,观察点分布是否呈条状分布,即是否在一条直线附近,从而判断两变量是否含有线性相关关系,.,(2),当两变量含有线性相关关系时,求回归系数,a,b,写出回归直线方程,.,14/38,探究一,探究二,探究三,思维辨析,变式训练,1,某研究机构对高三学生记忆力,x,和判断力,y,进行统计分析,得下表数据,:,(1),请画出上表数据散点图,(,要求,:,点要描粗,);,(2),请依据上表提供数据,用最小二乘法求出,y,关于,x,线性回归方程,y=bx+a.,15/38,探究一,探究二,探究三,思维辨析,解,:,(1),16/38,探究一,探究二,探究三,思维辨析,相关系数应用,【例,2,】,已知某地每单位面积菜地年平均使用氮肥量,x,(kg),与每单位面积蔬菜年平均产量,y,(t),之间关系有以下数据,:,(1),求,x,与,y,之间相关系数,并检验是否线性相关,;,(2),若线性相关,求蔬菜产量,y,与使用氮肥量,x,之间线性回归方程,并预计每单位面积施氮肥,150 kg,时,每单位面积蔬菜年平均产量,.,17/38,探究一,探究二,探究三,思维辨析,思绪分析,:,本题为探索两个变量之间是否含有线性相关关系问题,能够经过计算线性相关系数来判断,.,解,:,列出下表,并用科学计算器进行相关计算,:,18/38,探究一,探究二,探究三,思维辨析,19/38,探究一,探究二,探究三,思维辨析,反思感悟线性回归分析简明步骤,1,.,随机抽取样本,确定样本数据,.,2,.,判断两变量是否含有线性相关关系,可画出散点图用散点图判断,;,也可计算相关系数,r,用相关系数作出判断,.,3,.,若两变量线性相关,用最小二乘法求出回归直线方程,.,4,.,分析模型拟合效果,看有没有特殊点,不适当时,分析错因,加以纠正,.,5,.,依据回归方程作出预报,.,20/38,探究一,探究二,探究三,思维辨析,变式训练,2,测得某国,10,对父子身高,(,单位,:,英寸,),以下表,:,(1),对变量,y,与,x,进行相关性检验,;,(2),假如,y,与,x,之间含有线性相关关系,求线性回归方程,;,(3),假如父亲身高为,73,英寸,预计儿子身高,.,21/38,探究一,探究二,探究三,思维辨析,22/38,探究一,探究二,探究三,思维辨析,(2),设线性回归方程为,y=bx+a.,所以,y=bx+a=,0,.,464,6,x+,35,.,974,7,.,故所求线性回归方程为,y=,0,.,464,6,x+,35,.,974,7,.,(3),当,x=,73,时,儿子身高预计值为,0,.,464,6,73,+,35,.,974,769,.,9(,英寸,),.,所以当父亲身高为,73,英寸时,预计儿子身高约为,69,.,9,英寸,.,23/38,探究一,探究二,探究三,思维辨析,利用回归直线方程进行预测,【例,3,】,某商场经营一批进价是,30,元,/,台小商品,在市场试验中发觉,此商品销售单价,x,(,x,取整数,)(,元,),与日销售量,y,(,台,),之间有以下关系,:,(1),画出散点图,并判断,y,与,x,是否含有线性相关关系,;,(2),求日销售量,y,对销售单价,x,线性回归方程,;,(3),设经营此商品日销售利润为,P,元,依据,(2),写出,P,关于,x,函数关系式,并预测当销售单价,x,为多少元时,才能取得最大日销售利润,.,思绪分析,:,先由散点图确定,y,与,x,含有相关关系,再用求回归直线方程方法求出回归直线方程,最终,进行对应预测,.,24/38,探究一,探究二,探究三,思维辨析,解,:,(1),散点图如图所表示,从图中能够看出这些点大致分布在一条直线附近,所以两个变量线性相关,.,25/38,探究一,探究二,探究三,思维辨析,26/38,探究一,探究二,探究三,思维辨析,反思感悟,依据已给数据,寻找规律,求出回归直线方程不是最终目标,最终目标应是当一个变量取某个值时,预测另一个变量取值,.,当然,预测值是一个预计值,与实际真正值有一定误差,.,27/38,探究一,探究二,探究三,思维辨析,变式训练,3,某电脑企业有,5,名产品推销员,其工作年限与年推销金额数据以下表,:,(1),求年推销金额,y,对工作年限,x,线性回归方程,;,(2),若第,5,名推销员工作年限为,11,年,试预计他年推销金额,.,28/38,探究一,探究二,探究三,思维辨析,解,:,设所求线性回归方程为,y=a+bx,所以年推销金额,y,对工作年限,x,线性回归方程为,y=,0,.,4,+,0,.,5,x.,当,x=,11,时,y=,0,.,4,+,0,.,5,11,=,5,.,9(,万元,),故能够预计第,5,名推销员年推销金额为,5,.,9,万元,.,29/38,探究一,探究二,探究三,思维辨析,因对回归直线了解不清致误,【典例】,已知,x,y,取值以下表所表示,由散点图分析可知,y,与,x,线性相关,且线性回归方程为,y=,0,.,95,x+,2,.,6,那么表格中数据,m,值为,.,易错分析,:,本题易出现直接将,m,所对应,x,值,4,代入回归直线方程,而求出,m=,6,.,4,作为结果,.,实质上,回归直线方程并不是,x,与,y,函数关系,所以必须利用样本中心点坐标求解,.,答案,:,6,.,7,纠错心得,平时学习时一定要对每一个基础知识了解透彻,.,30/38,探究一,探究二,探究三,思维辨析,跟踪训练,某研究所研究耕种深度,x,(,单位,:cm),与水稻产量,y,(,单位,:t),关系,所得数据以下表,:,试求每公顷水稻产量和耕种深度线性相关系数与线性回归方程,.,31/38,探究一,探究二,探究三,思维辨析,解,:,将数据列成下表,:,32/38,1,2,3,4,5,1,.,对于相关系数,r,以下说法正确是,(,),A.,|r|,越大,相关程度越小,B.,|r|,越小,相关程度越大,C.,|r|,越大,相关程度越小,|r|,越小,相关程度越大,D.,|r|,1,且,|r|,越靠近于,1,相关程度越大,|r|,越靠近于,0,相关程度越小,解析,:,|r|,1,当,|r|,越靠近于,1,误差越小,变量之间线性相关程度越高,;,|r|,越靠近于,0,误差越大,变量之间线性相关程度越低,故选,D,.,答案,:,D,33/38,1,2,3,4,5,2,.,已知某商品销售量,y,(,件,),与销售价格,x,(,元,/,件,),负相关,则其线性回归方程可能是,(,),A.,y=-,10,x+,200B.,y=,10,x+,200,C.,y=-,10,x-,200D.,y=,10,x-,200,解析,:,因为销售量,y,与销售价格,x,成负相关,故排除,B,D,.,又当,x=,10,时,A,中,y=,100,而,C,中,y=-,300,C,不符合题意,故选,A,.,答案,:,A,34/38,1,2,3,4,5,3,.,设某大学女生体重,y,(,单位,:kg),与身高,x,(,单位,:cm),含有线性相关关系,依据一组样本数据,(,x,i,y,i,)(,i=,1,2,n,),用最小二乘法建立回归方程为,y=,0,.,85,x-,85,.,71,则以下结论不正确是,(,),A.,y,与,x,含有正线性相关关系,B.,回归直线过样本点中心,C.,若该大学某女生身高增加,1 cm,则其体重约增加,0,.,85 kg,D.,若该大学某女生身高为,170 cm,则可断定其体重必为,58,.,79 kg,解析,:,本题考查线性回归方程,.,D,项中身高为,170,cm,时,体重,“,约为,”58,.,79,而不是,“,确定,”,回归方程只能作出,“,预计,”,而非确定,“,线性,”,关系,.,答案,:,D,35/38,1,2,3,4,5,4,.,已知,x,y,取值以下表,:,若,x,y,含有线性相关关系,且回归直线方程为,y=,0,.,95,x+a,则,a,值为,.,36/38,1,2,3,4,5,5,.,某工厂为了对新研发一个产品进行合理定价,将该产品按事先确定价格进行试销,得到以下数据,:,(1),求线性回归方程,y=bx+a,其中,b=-,20,(2),预计在今后销售中,销量与单价依然服从,(1),中关系,且该产品成本是,4,元,/,件,为使工厂取得最大利润,该产品单价应定为多少元,?(,利润,=,销售收入,-,成本,),37/38,1,2,3,4,5,38/38,
展开阅读全文