资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,重点难点,重点:,1.,利用散点图判断变量之间是否具有相关关系,2,求回归直线方程和利用回归直线方程作出估计,难点:回归分析与独立性检验的应用,知识归纳,1,变量间的相关关系,(1),相关关系,自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系,2,两个变量的线性相关,(1),散点图,将样本中,n,个数据点,(,x,i,,,y,i,)(,i,1,2,,,,,n,),描在平面直角坐标系中,表示具有相关关系的两个变量的一组数据的图形叫做散点图利用散点图可以判断变量之间有无相关关系,(2),正相关、负相关,如果散点图中各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关,反之,如果两个变量的散点图中点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关,3,回归分析,对具有相关关系的两个变量进行统计分析的方法叫回归分析其基本步骤是:,画散点图,,求回归直线方程,,用回归直线方程作预报,(1),回归直线:观察散点图的特征,如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线,(2),回归直线方程的求法,最小二乘法,r,具有以下性质:,|,r,|,1,,并且,|,r,|,越接近,1,,线性相关程度越强;,|,r,|,越接近,0,,线性相关程度越弱,检验的步骤如下:,作统计假设:,x,与,Y,不具有线性相关关系,根据小概率,0.05,与,n,2,在附表中查出,r,的一个临界值,r,0.05,.,根据样本相关系数计算公式算出,r,的值,作统计推断如果,|,r,|,r,0.05,,表明有,95%,的把握认为,x,与,Y,之间具有线性相关关系,如果,|,r,|,r,0.05,,我们没有理由拒绝原来的假设这时寻找回归直线方程是毫无意义的,(5),建立回归模型的基本步骤:,确定研究对象,明确解释变量和预报变量,画出散点图,观察它们是否存在相关关系,(,如线性相关关系,),按一般规则估计回归方程中的参数,(,如最小二乘法,),得出结果后分析残差图是否异常,若存在异常,则检查数据是否有误,模型是否恰当,4,独立性检验,(1),若变量的不同,“,值,”,表示个体所属的不同类别,则这些变量称为分类变量,(2),两个分类变量,X,与,Y,的频数表,称作,2,2,列联表,.,y,1,y,2,合计,x,1,n,11,n,12,n,1,x,2,n,21,n,22,n,2,合计,n,1,n,2,n,P,(,2,k,),0.50,0.40,0.25,0.15,0.10,0.05,0.025,0.010,0.005,0.001,k,0.455,0.708,1.323,2.072,2.706,3.841,5.024,6.635,7.879,10.828,当,2,6.635,时,有,99%,的把握认为,“,X,与,Y,有关系,”,当,2,3.841,时,有,95%,的把握认为,“,X,与,Y,有关系,”,当,2,3.841,时,没有充分理由认为,X,与,Y,是相关的,误区警示,1,线性回归方程中的系数、公式复杂莫记混用错,2,使用,2,统计量作,2,2,列联表的独立性检验时,要求表中的,4,个数据,n,11,、,n,12,、,n,21,、,n,22,都要大于,5,,在选取样本的容量时,要注意这一点,例,1,有个男孩的年龄与身高的统计数据如下,.,画出散点图,并判断它们是否有线性相关关系,分析:,散点图是分析变量相关关系的重要工具,用描点法可画出散点图,观察散点图中的点是否大致分布在一条直线附近可以判断变量是否线性相关,年龄,(,岁,),1,2,3,4,5,6,身高,(cm),78,87,98,108,115,120,解析:,作出散点图如图:,由图可见,身高与年龄具有线性相关关系,(09,宁夏、海南,),对变量,x,,,y,的观测数据,(,x,i,,,y,i,)(,i,1,2,,,,,10),,得散点图,(1),;对变量,u,,,v,的观测数据,(,u,1,,,v,1,)(,i,1,2,,,,,10),,得散点图,(2),由这两个散点图可以判断,(,),A,变量,x,与,y,正相关,,u,与,v,正相关,B,变量,x,与,y,正相关,,u,与,v,负相关,C,变量,x,与,y,负相关,,u,与,v,正相关,D,变量,x,与,y,负相关,,u,与,v,负相关,解析:,由图,(1),可知,各点整体呈递减趋势,,x,与,y,负相关,由图,(2),可知,各点整体呈递增趋势,,u,与,v,正相关,答案:,C,例,2,下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量,x,(,吨,),与对应的生产能耗,y,(,吨标准煤,),的几组对应数据,.,(1),请画出上表数据的散点图;,x,3,4,5,6,y,2.5,3,4,4.5,(3),已知该厂技改前,100,吨甲产品的生产能耗为,90,吨标准煤,试根据,(2),求出的线性回归方程,预测生产,100,吨甲产品的生产能耗比技改前降低多少吨标准煤?,(,参考数值:,3,2.5,4,3,5,4,6,4.5,66.5),解析:,(1),由题设所给数据,可得散点图如下图,(3),由,(2),的回归方程及技改前生产,100,吨甲产品的生产能耗,得降低的生产能耗为:,90,(0.7,100,0.35),19.65(,吨标准煤,),(2010,山东枣庄模考,),某单位为了了解用电量,y,(,度,),与气温,x,(,),之间的关系,随机统计了某,4,天的用电量与当天气温,并制作了对照表:,气温,(,),18,13,10,1,用电量,(,度,),24,34,38,64,答案:,68,例,3,(2010,辽宁文,,18),为了比较注射,A,,,B,两种药物后产生的皮肤疱疹的面积,选,200,只家兔做实验,将这,200,只家兔随机地分成两组,每组,100,只,其中一组注射药物,A,,另一组注射药物,B,.,下表,1,和表,2,分别是注射药物,A,和药物,B,后的试验结果,(,疱疹面积单位:,mm,2,),表,1,:注射药物,A,后皮肤疱疹面积的频数分布表,疱疹面积,60,65),65,70),70,75),75,80),频数,30,40,20,10,表,2,:注射药物,B,后皮肤疱疹面积的频数分布表,(1),完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;,(2),完成下面,2,2,列联表,并回答能否有,99.9%,的把握认为,“,注射药物,A,后的疱疹面积与注射药物,B,后的疱疹面积有差异,”,.,疱疹面积,60,65),65,70),70,75),75,80),80,85),频数,10,25,20,30,15,疱疹面积小于,70mm,2,疱疹面积不小于,70mm,2,合计,注射药物,A,a,b,注射药物,B,c,d,合计,n,解析,(1),可以看出注射药物,A,后的疱疹面积的中位数在,65,至,70,之间,而注射药物,B,后的疱疹面积的中位数在,70,至,75,之间,所以注射药物,A,后疱疹面积的中位数小于注射药物,B,后疱疹面积的中位数,(2),表,3,:,疱疹面积小于,70mm,2,疱疹面积不小于,70mm,2,合计,注射药物,A,a,70,b,30,100,注射药物,B,c,35,d,65,100,合计,105,95,n,200,由于,2,10.828,,所以有,99.9%,的把握认为,“,注射药物,A,后的疱疹面积与注射药物,B,后的疱疹面积有差异,”,点评:,独立性检验是比较容易掌握的,高考不要求记忆公式,只要求会用公式进行计算,并依据计算结果作出判断,为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表:,药物效果试验列联表,则有,_%,的把握认为药物有效?,患病,未患病,总计,服用药,10,45,55,没有用药,20,30,50,总计,30,75,105,解析:,首先判定表格中的数据是否都大于,5,这一点显然是满足的,可由公式直接求解,最后再与两个临界值相比较得出结论,答案:,95,一、选择题,1,(2010,湖南文,),某商品销售量,y,(,件,),与销售价格,x,(,元,/,件,),负相关,则其回归方程可能是,(,),答案,A,解析,由于销售量,y,与销售价格,x,成负相关,故,x,的系数应为负,排除,B,、,D,;又当,x,10,时,,A,中,y,100,,,C,中,y,300,显然,C,不合实际,故排除,C,,选,A.,2,下面是一个,2,2,的列联表,则表中,a,、,b,的值依次为,(,),A,44,54 B,52,46,C,54,46 D,52,54,答案,B,解析,由,a,21,73,得,,a,52,,,由,54,b,100,得,,b,46,,故选,B.,y,1,y,2,总计,x,1,a,21,73,x,2,2,25,27,合计,54,b,100,3,(2010,宁夏银川,),下表是某厂,1,4,月份用水量,(,单位:百吨,),的一组数据:,月份,x,1,2,3,4,用水量,y,4.5,4,3,2.5,A,10.5 B,5.15,C,5.2 D,5.25,答案,D,解析,利用回归直线过样本点的中心很方便的求出了,a,的值要熟记这一结论,请再练习下题:,(2010,山东聊城市模拟,),已知,x,、,y,的取值如下表所示:,x,2,3,4,y,6,4,5,答案,A,解析,解法一:根据线性回归系数的公式来求,请同学们认真完成课后强化作业,1,为了判断高中三年级学生选修文科是否与性别有关,现随机抽取,50,名学生,得到如下,2,2,列联表:,理科,文科,男,13,10,女,7,20,答案,5%,解析,根据独立性检验临界值可知,,P,(,3.841),0.05,,,3,8414.8445.024,,,这种判断出错的可能性为,0.05.,2,(2010,上海市徐汇区诊断,),有,5,只苹果,它们的质量分别为,125,a,121,b,127(,单位:克,),:若该样本的中位数和平均值均为,124,,则该样本的标准差,S,_.(,克,)(,用数字作答,),答案,2,解析,由平均值为,124,知,a,b,247,,,又中位数为,124,,,a,与,b,一个为,124,,另一个为,123,,,3,(2010,厦门三中阶段训练,),给出下列四个命题:,命题,“,x,R,,,x,2,0,”,的否定是,“,x,R,,,x,2,0,”,;,线性相关系数,r,的绝对值越接近于,1,,表明两个随机变量线性相关性越强;,在,ABC,中,若,cos(2,B,C,),2sin,A,sin,B,0,,则,ABC,一定是等腰三角形,其中假命题的序号是,_,(,填上所有假命题的序号,),答案,解析,“,x,R,,,x,2,0,”,的否定应是,“,x,R,,,x,2,0,”,,命题的否定和否命题不同,否命题应是既否定命题的条件,也否定命题的结论,命题的否定应是命题的条件不变,否定结论全称命题的否定为特称命题原命题和它的否定命题的真假恰好相反,而原命题和否命题的真假无关联,,假,由线性相关系数的定义知,真;,4,(09,广东,),随机抽取某中学甲乙两班各,10,名同学,测量他们的身高,(,单位:,cm),,获得身高数据的茎叶图如图,.,(1),根据茎叶图判断哪个班的平均身高较高;,(2),计算甲班的样本方差;,(3),现从乙班这,10,名同学中随机抽取两名身高不低于,173cm,的同学,求身高为,176cm,的同学被抽中的概率,解析,(1),乙班的平均身高较高,(,可由茎叶图判断或计算得出,),(3),从乙班这,10,名同学中随机抽取两名身高不低于,173cm,的同学,共有,10,种不同的取法:,(173,176),,,(173,178),,,(173,179),,,(173,181),,,(176,178),,,(176,179),,,(176,181),,,(178,179),,,(178,181),,,(179,181),设,A,表示随机事件,“,抽到身高为,176cm,的同学,”,,则,A,中的基本事件有四个:,(173,176),,,(176,178),,,(176,179),,,(176,181),5,调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表试问能以多大把握认为婴儿的性别与出生时间有关系,.,分析,利用表中的数据通过公式计算出,2,统计量,可以用它的值的大小来推断独立性是否成立,出生时间性别,晚上,白天,合计,男婴,24,31,55,女婴,8,26,34,合计,32,57,89,故婴儿的性别与出生时间是相互独立的,(,也可以说没有充分证据显示婴儿的性别与出生时间有关,),6,以下是某地搜集到的新房屋的销售价格,y,和房屋的面积,x,的数据:,(1),画出数据对应的散点图;,(2),求线性回归方程,并在散点图中加上回归直线;,(3),据,(2),的结果估计当房屋面积为,150m,2,时的销售价格,房屋面积,(m,2,),115,110,80,135,105,销售价格,(,万元,),24.8,21.6,18.4,29.2,22,解析,(1),数据对应的散点图如下图所示:,
展开阅读全文