资源描述
山东水浒书业有限公司,优化方案系列丛书,第,1,章 统 计,课前自主学案,课堂互动讲练,知能优化训练,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,6,统计活动:结婚年龄的变化,7,相关性,8,最小二乘估计,8,最小二乘估计,课堂互动讲练,知能优化训练,课前自主学案,学习目标,1.,通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系,2,学会用不同估算方法描述两个变量线性相关的过程,知道最小二乘法的思想,能够根据给出的线性回归方程系数公式建立线性回归方程,课前自主学案,1,抽样方法有,_,、,_,、,_,2,用样本估计总体主要有:用样本的,_,估计总体的频率分布;用样本的,_,估计总体的数字特征,3,样本的数字特征主要有,_,、,_,、,_,、,_,及,_,温故夯基,简单随机抽样,系统抽样,分层抽样,频率分布,数字特征,平均数,众数,中位数,方差,标准差,4,在现实生活中两个变量之间的函数关系是一种,_,的关系,确定,知新益能,1,变量间关系,(1),函数关系:两变量之间的,_,关系;,(2),相关关系:两变量之间的,_,关系,2,散点图,在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将,_,的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图,确定性,不确定性,变量所对应,3,曲线拟合,从散点图上可以看出,如果变量之间,_,,这些点会有一个,_,的大致趋势,这种趋势通常可以用一条,_,来近似,这样近似的过程称为曲线拟合,4,相关关系的分类,(1),线性相关:若两个变量,x,和,y,的散点图中,所有点看上去都在,_,附近波动,则称变量间是线性相关的,存在着某种关系,集中,光滑的曲线,一条直线,y,1,(,a,bx,1,),2,y,2,(,a,bx,2,),2,y,n,(,a,bx,n,),2,(2),非线性相关:若散点图上所有点看上去都在某条曲线,(,不是一条直线,),附近波动,则称此相关为非线性相关的此时,可以用,_,来拟合,5,最小二乘法,(1),定义:如果有,n,个点,(,x,1,,,y,1,),,,(,x,2,,,y,2,),,,,,(,x,n,,,y,n,),,可以用下面的表达式来刻画这些点与直线,y,a,bx,的接近程度:,_,.,使得上式达到,_,的直线,y,a,bx,就是我们所要求的直线,这种方法称为最小二乘法,一条曲线,最小值,(2),应用:利用最小二乘法估计时,要先作出数据的,_,如果,_,呈现出线性关系,可以用最小二乘法估计出线性回归方程;如果,_,呈现出其他的曲线关系,我们就要利用其他的工具进行拟合,散点图,散点图,散点图,6,线性回归方程,b,_,a,_,,,这样得到的直线方程,y,a,bx,称为线性回归方程,,a,,,b,是线性回归方程的,_,系数,1,函数关系与相关关系有何异同点?,问题探究,提示:,关系,异同点,函数关系,相关关系,相同点,两者均是指两个变量之间的关系,关系,异同点,函数关系,相关关系,不同点,是一种确定性的关系,是一种非确定性的关系,是两个变量之间的关系,一个为变量,另一个为随机变量;,两个都是随机变量,是一种因果关系,不一定是因果关系,也可能是伴随关系,是一种理想关系模型,是更为一般的情况,2.,如何利用散点图来研究两个变量之间是否存在某种关系?,提示:,在研究两个变量之间是否存在某种关系时,结合所画的散点图来判断,(1),如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系,(2),如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系,3,回归直线方程的应用有哪些?,提示:,(1),描述两变量之间的依存关系;利用线性回归方程即可定量描述两个变量间依存的数量关系,(2),利用回归方程进行预测或规定,y,值的变化,通过控制,x,的范围来实现目标如已经得到了空气中,NO,的浓度和汽车流量间的回归方程,即可通过控制汽车流量来控制空气中的,NO,的浓度,(3),注意作回归分析要有实际意义,回归分析前,最好先作出散点图,确定合适的拟合模型,4,“,回归直线,”,方程能否按解析几何中求直线方程的方法来求?,提示:,不能求回归直线方程的方法用最小二乘法因为所有数据点都分布在一条直线附近时,这样的直线可画出许多条,而,“,回归直线,”,是这些直线中,“,最贴近,”,已知数据点的,但不一定过数据中的某个点,故一般不按解析几何中求直线方程的方法来求,课堂互动讲练,画散点图并判断相关关系,考点一,考点突破,在现实生活中存在着大量的相关关系,如何判断和描述相关关系,统计学发挥着非常重要的作用由于变量间的相关关系带有不确定性,这就需要通过收集大量的数据,对数据进行统计分析,发现规律,从而作出科学的判断,下面是水稻产量与施化肥量的一组观测数据:,例,1,施化肥量,15,20,25,30,35,40,45,水稻产量,320,330,360,410,460,470,480,(1),将上表中的数据制成散点图;,(2),你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?,(3),若近似成线性关系,请画出一条直线来近似表示这种线性关系,【,思路点拨,】,以横轴表示施化肥量,纵轴表示水稻产量,作出散点图,若所有点分布在一条直线,(,或曲线,),附近,则水稻产量和施化肥量之间具有相关关系,【,解,】,(1),散点图如图所示:,(2),从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长,(3),如上图所示,【,名师点评,】,判断两个变量之间是否具有相关关系有两种方法:一种方法是直观感觉判断,这时要用到已有的知识和生活经验等;另一种方法是根据散点图判断常采用的是第二种方法一般来说判断两个变量之间是否具有相关关系时,若两个变量具有相关关系,需要进一步判断是线性相关,还是非线性相关,自我挑战,1,某灯泡生产厂家为了提高灯泡的使用寿命,研究灯丝的精细,x,(mm,),与灯泡的使用寿命,y,(,小时,),之间的关系,得到如下检测数据:,编号,i,1,2,3,4,5,6,7,8,9,10,x,i,(mm,),0.100,0.105,0.110,0.115,0.120,0.125,0.130,0.135,0.140,0.145,y,i,(h,),3170,3210,3350,3400,3300,3450,3370,3500,3510,3620,编号,i,11,12,13,14,15,16,17,18,19,20,x,i,(mm,),0.150,0.155,0.160,0.165,0.170,0.175,0.180,0.185,0.190,0.195,y,i,(h,),3490,3590,3680,3700,3575,3870,3620,3530,3680,3570,以横轴表示灯丝的精细,x,(mm,),,纵轴表示灯泡的使用寿命,y,(,小时,),,根据这些数据作出散点图,并研究它们是否具有一定的相关关系,解:,这组检测数据的散点图,如图所示:,显然,这些点分布在某条直线附近因此,这两个变量具有一定的相关性,求回归直线方程,考点二,据最小二乘法思想的公式,用待定系数法求出,a,,,b,,从而确定回归直线方程,某化工厂的原料中,有,A,和,B,两种有效成分,现随机抽取了,10,份原料样品进行抽样检测,测得,A,和,B,的含量如下表所示:,例,2,i,1,2,3,4,5,6,7,8,9,10,x,67,54,72,64,39,22,58,43,46,34,y,24,15,23,19,16,11,20,16,17,13,其中,x,表示成分,A,的百分含量,x,%,,,y,表示成分,B,的百分含量,y,%.,(1),作出两个变量,y,与,x,的散点图;,(2),两个变量,y,与,x,是否线性相关?若是线性相关,求出线性回归方程,【,解,】,(1),按照,y,从小到大的顺序调整表中数据,(,这样有利于描点,如用画图软件则不需要调整表格数据,),,,如下表所示:,x,22,34,54,43,39,46,64,58,72,67,y,11,13,15,16,16,17,19,20,23,24,散点图如图所示:,(2),观察散点图可知,,y,与,x,是线性相关关系;,下面求线性回归方程:,i,1,2,3,4,5,6,7,8,9,10,合计,x,i,22,34,54,43,39,46,64,58,72,67,499,y,i,11,13,15,16,16,17,19,20,23,24,174,x,i,y,i,242,442,810,688,624,782,1216,1160,1656,1608,9228,x,484,1156,2916,1849,1521,2116,4096,3364,5184,4489,27175,【,名师点评,】,用线性回归方程进行数据拟合的一般步骤是:,(1),把数据列成表格;,(2),作散点图;,(3),判断是否线性相关;,(4),若线性相关,求出系数,b,,,a,的值,(,一般也列成表格的形式,用计算器或计算机计算,),;,(5),写出回归直线方程,y,a,bx,.,利用回归直线,我们可以进行预测若回归直线方程为,y,a,bx,,则,x,x,0,处的估计值为,y,a,bx,0,.,下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量,x,(,吨,),与相应的生产能耗,y,(,吨标准煤,),的几组对照数据:,利用回归方程对总体进行估计,考点三,例,3,x,3,4,5,6,y,2.5,3,4,4.5,(1),请画出上表数据的散点图;,(2),请根据上表提供的数据,用最小二乘法求出,y,关于,x,的线性回归方程,y,a,bx,;,(3),已知该厂技改前,100,吨甲产品的生产能耗为,90,吨标准煤,试根据,(2),求出的线性回归方程,预测生产,100,吨甲产品的生产能耗比技改前降低了多少吨标准煤?,(,参考数值:,3,2.5,4,3,5,4,6,4.5,66.5),【,解,】,(1),由题设所给数据,可得散点图如图,因此,所求的线性回归方程为,y,0.35,0.7,x,.,(3),由,(2),的线性回归方程及技改前生产,100,吨甲产品的生产能耗,得降低的生产能耗约为:,90,(0.35,0.7,100),19.65(,吨标准煤,),【,名师点评,】,(1),求线性回归方程时,应注意只有在散点图大致呈线性相关时,求出的线性回归方程才有实际意义,因此,对数据作线性回归分析时,应先看其散点图是否呈线性相关关系,(2),求线性回归方程,关键在于正确地求出系数,a,、,b,,由于求,a,、,b,的计算量较大,计算时应仔细谨慎、分步进行,避免因计算产生失误,(3),得到的实验数据不同,则,a,、,b,的结果也不尽相同,自我挑战,2,要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽取,10,名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表:,学生编号,1,2,3,4,5,6,7,8,9,10,入学成绩,x,63,67,45,88,81,71,52,99,58,76,高一期末成绩,y,65,78,52,82,92,89,73,98,56,75,(1),计算入学成绩,x,与高一期末考试成绩,y,的相关关系;,(2),若某学生入学数学成绩为,80,分,试估计他高一期末数学考试成绩;,(3),若事实上该学生期末考试数学为,94,分,如何解释?,解:,(1),从入学成绩,x,与高一期末考试成绩,y,两组变量的散点图可以看出,这两组变量具有线性相关关系,,(2),若某学生入学数学成绩为,80,分,代入上式,y,0.76556,x,22.41067,可得:,y,84,,即这个学生高一期末数学考试成绩预测值为,84,分,(3),用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,方法感悟,1,判断两个变量之间的关系是否是相关关系,一方面可根据日常生活的知识和经验进行判断;另一方面是画出散点图,根据散点图观察它们的分布是否存在一定的规律,直观地进行判断,2,画散点图时,平面直角坐标系中两坐标轴的长度单位可以不同,3,作出散点图后,要观察分析散点图中各点的位置关系,若在一条直线附近波动,则这两个变量具有线性相关关系,否则没有,4,求线性回归方程的前提是先判定线性相关,这就用到散点图,在确认其具有线性相关关系后,再求其线性回归方程,进而由线性回归方程估计总体的性质,5,在求线性回归系数时,公式不要求记忆,但要明确公式各部分的含义,才能求出,a,,,b,.,
展开阅读全文