资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,新课标高中一轮总复习,第七单元,计算原理、概率与统计,第,55,讲,变量的相关性、回归分析、独立性检验,1.,会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系,.,2.,了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,.,3.,了解独立性检验的含义,知道什么是,22,列联表,.,4.,会运用独立性检验的方法判断事件,A,与,B,的关系,.,5.,会求回归方程模型,并能进行相关性检验,.,6.,掌握相关性检验的步骤,.,1.,下列两个变量之间的关系是相关关系的是,(),A,A.,人的年龄和身高,B.,正方形的边长和面积,C.,正,n,边形的边数与其内角和,D.,某角度与它的余弦值,人的年龄和身高是一种不确定的关系,其他三组两个变量之间都是确定的函数关系,故选,A.,2.,回归直线方程表示直线必定过点,(),D,A.(0,0)B.(,0),C.(0,)D.(,),回归直线必定经过样本中心点,(,).,3.,某装饰品的广告费投入,x,(,单位,:,万元,),与销售,y,(,单位,:,万元,),之间有如下表所示的对应数据:,则回归直线方程为,(),x,3,4,5,6,7,y,40,60,65,75,70,A,A.,=7.5,x,+24.5 B.,=7.5,x,-24.5,C.,=-7.5,x,+24.5 D.,=-7.5,x,-24.5,通过公式,b,=,a,=-,b,求之,.,4.,下列说法中正确的是,(),C,A.,K,2,在任何相互独立问题中都可以用于检验有关还是无关,B.,K,2,的值越大,两个事件的相关性就越大,C.,K,2,是用来判断两个分类变量是否有关系的随机变量,D.,K,2,的观测值,k,=,5.,用,A,和,B,两种药物各治疗,9,个病人,结果如下:,则这两种药物的疗效,显著差别,.(,答“有”,或“无”,),痊愈,未愈,合计,A,药,7,2,9,B,药,2,7,9,合计,9,9,18,由表中看出,使用,A,药痊愈的概率高于,B,药,故可以粗略估计两种药的疗效是有显著差别的,.,有,1.,两个变量间的相关关系,如果两个变量之间确实存在关系,但又没有函数关系所具有的确定性,它们的关系带有随机性,则称这两个变量具有,.,有相关关系的两个变量,若一个变量的值由小到大时,另一个变量的值也是由小到大,这种相关称为,;反之,一个变量的值由小到大,另一个变量的值由大到小,这种相关称为,.,相关关系,正相关,负相关,2.,散点图,在平面直角坐标系中描点,得到关于两个变量的一组数据的图形,这样的图形叫做,.,如果散点图中,相应于具有相关关系的两个变量所有观察值的数据点,分布在一条直线附近,则称这两个变量具有,这条直线叫做,方程为,=,bx,+,a,其中,b=,a,=-,b,.,散点图,线性相关关系,回归直线,3.,最小二乘法,使残差平方和,Q,=(,y,i,-,bx,i,-,a,),2,为最小的方法,叫做,.,4.,线性回归模型,(1),样本的相关系数,r,=,.,最小二乘法,当,r,0,时,表示两个变量正相关,当,r,2.706,,就认为,x,与,y,有关系,.,利用,K,2,来确定在多大程度可以认为“两个分类变量有关系”的方法称为独立性检验,.,题型一,变量的相关性,例,1,汽车的重量和汽车消耗一升汽油所行驶的路程成负相关,这说明,(),A.,汽车越重,每消耗,1,升汽油所行驶的路程越短,B.,汽车越轻,每消耗,1,升汽油所行驶的路程越短,C.,汽车越重,消耗汽油越多,D.,汽车越轻,消耗汽油越多,A,要透彻理解一些常见参概念的意义,.,题型二,回归分析,例,2,某车间为了规定工时定额,需要确定加工零件所花费的时间,为此做了四次试验,根据试验数据得到如下图所示的散点图,其中,x,表示零件的个数,y,表示加工时间,.,(1),求出,y,关于,x,的线性,回归方程,=,bx,+,a,;,(2),试预测加工,10,个零,件需多长时间?,(1),=3.5,=3.5,所以,b,=,=0.7,a,=-,b,=3.5-0.73.5=1.05,所以线性回归方程为,=0.7,x,+1.05.,(2),当,x,=10,时,,=0.710+1.05=8.05,故加工,10,个零件大约需,8.05,小时,.,求出回归直线方程后,往往用来作为现实生产中的变量之间相关关系的近似关系,从而可用来指导生产实践,.,为了研究某种细菌随时间,x,变化繁殖的个数,收集数据如下:,(1),以,x,为解释变量,,y,为预报变量作这些数据的散点图;,(2),求,y,关于,x,的回归方程,.,天数,(,x,),1,2,3,4,5,6,繁殖细菌个数,(,y,),6,12,25,49,95,190,用所学函数看变化趋势,.,(1),画散点图,(2),若建立线性模型,=,a,+,bx,则得到,=-56.467+34.086,x,若建立指数函数模型,=,me,nx,则得到,=3.0519,e,0.6902,x,.,回归方程不一定惟一,该题还可以用二次函数为模型,.,题型二,独立性检验,例,2,在对人群的休闲方式的一次调查中,共调查了,124,人,其中女性,70,人,女性中有,43,人主要的休闲方式是看电视,另外,27,人主要的休闲方式是运动;男性中,21,人主要的休闲方式是看电视,其余男性的主要休闲方式是运动,.,(1),根据以上数据建立一个,22,列联表,;,(2),判断性别与休闲方式是否有关系,并说明理由,.,是否有关系取决于,K,2,的大小,.,(1),22,列联表为,看电视,运动,总计,女,43,27,70,男,21,33,54,合计,64,60,124,(2),K,2,=,=6.2,设,H,1,:,性别与不同运动方式有关系,.,假设,H,0,:,性别与不同的运动方式没有关系,在,H,0,的前提下,,K,2,应该很小,而,P,(,K,2,5.024)0.025.,所以有,97.5,的把握认为性别与不同的运动方式之间有关系,.,对判断过程和计算方式要清楚,计算,K,2,时勿将,(,ad,-,bc,),2,中的平方运算漏掉,.,下面是两个变量间的一组数据:,x,1.0,4.0,6.0,10.0,14.0,y,19.0,44.0,40.0,52.0,53.0,(1),在同一直角坐标系中画出散点图、直线,=24+2.5,x,和曲线,=;,(2),比较所画直线与曲线,哪一条更能表现这组数据之间的关系?,(3),分别计算用直线方程与曲线方程得到在,5,个,x,点处的预测值与实际预测之间的误差,比较两个误差绝对值之和的大小,.,(,1,),所求作图型如下:,(2),从图形上看,曲线,=,比直线,=24+2.5,x,更能表现这组数据间的关系,.,(3),用直线,=24+2.5,x,近似数据时,误差绝对值的和为,27.5,,用曲线,=,时,误差绝对值的和为,12.5,,比前者小得多,.,由散点图可比较直观地看出更能表现所给数据的关系的曲线,再通过比较误差绝对值之和的大小,则显得更有说服力,.,1.,计算回归直线方程中的参数,a,、,b,时应分层进行,避免因计算错误而产生误差,.,2.,求线性回归方程之前,应对数据进行线性相关分析,.,3.,回归分析的关键是根据散点图选择函数模型,用相关系数判定哪种模型更好,.,4.,独立性检验不能用比例余数来判定,,a,、,b,、,c,、,d,成比例扩大,,K,2,的值是不同的,正确列出,22,列联表是解题的关键步骤,.,学例,1,(2009,辽宁卷,),某企业有两个分厂生产某种零件,按规定内径尺寸(单位:,mm,)的值落在,29.94,,,30.06,)的零件为优质品,.,从两个分厂生产的零件中各抽出了,500,件,量其内径尺寸,得结果如下表:,甲厂:乙厂:,分组,频数,29.86,29.90),12,29.90,29.94),63,29.94,29.98),86,29.98,30.02),182,30.02,30.06),92,30.06,30.10),61,30.10,30.14),4,分组,频数,29.86,29.90),29,29.90,29.94),71,29.94,29.98),85,29.98,30.02),159,30.02,30.06),76,30.06,30.10),62,30.10,30.14),18,(1),试分别估计两个分厂生产的零件的优质品率,;,(2),由以上统计数据填下面,22,列联表,并分析是否有,99%,的把握认为“两个分厂生产的零件的质量有差异”,.,甲厂,乙厂,合计,优质品,非优质品,合计,P,(,K,2,k,),0.05,0.01,k,3.841,6.635,附:,K,2,=,(,1,),甲厂抽查的产品中有,360,件优质品,从而甲厂生产的零件的优质品率估计为,=72%,;乙厂抽查的产品中有,320,件优质品,从而乙厂生产的零件的优质品率估计为,=64%.,(2),22,列联表如下:,K,2,=7.356.635,所以有,99%,的把握认为“两个分厂生产的零件的质量有差异”,.,甲厂,乙厂,合计,优质品,360,320,680,非优质品,140,180,320,合计,500,500,1000,本节完,谢谢聆听,高考资源网,您的高考专家,
展开阅读全文