资源描述
,总纲目录教材研读考点突破,栏目索引,总纲目录教材研读考点突破,栏目索引,*,*,总纲目录教材研读考点突破,栏目索引,总纲目录,总纲目录教材研读考点突破,栏目索引,教材研读,总纲目录教材研读考点突破,栏目索引,考点突破,*,*,总纲目录教材研读考点突破,栏目索引,*,*,总纲目录教材研读考点突破,栏目索引,*,*,第六节变量相关关系、统计案例,1/45,总纲目录,教材研读,1.,两个变量线性相关,考点突破,2.,回归分析,3.,独立性检验,考点二线性回归方程求解与应用,考点一相关关系判断,考点三相关系数意义,考点四独立性检验,2/45,1.两个变量线性相关,(1)正相关,在散点图中,点散布在从,左下角,到,右上角,区域,对于两,个变量这种相关关系,我们将它称为正相关.,(2)负相关,在散点图中,点散布在从,左上角,到,右下角,区域,对于两,个变量这种相关关系,我们将它称为负相关.,教材研读,3/45,(3)线性相关关系、回归直线,假如散点图中点分布从整体上看大致在,一条直线附近,就称这,两个变量之间含有线性相关关系,这条直线叫做回归直线.,(4)最小二乘法,求回归直线,使得样本数据点到它,距离平方和最小,方法,叫做最小二乘法.,(5)回归方程,方程,=,x,+,是两个含有线性相关关系变量一组数据(,x,1,y,1,),(,x,2,y,2,),(,x,n,y,n,)回归方程,其中,是待定参数.,4/45,5/45,2.回归分析,(1)回归分析是对含有,相关关系,两个变量进行统计分析一个,惯用方法.,(2)样本点中心,对于一组含有线性相关关系数据(,x,1,y,1,),(,x,2,y,2,),(,x,n,y,n,),我们知道,=,(,),称为样本点中心.,(3)相关系数:,.,当,r,0时,表明两个变量,正相关,;,当,r,0,0,0C.,0,0D.,0,D,答案,D由题图可知,回归直线斜率是正数,即,0;回归直线在,y,轴,上截距是负数,即,0时,y,与,x,正相关;当,0时,y,与,x,负相关.一定不正确.故选D.,12/45,4.已知,x,y,对应取值以下表,从散点图能够看出,y,与,x,线性相关,且回归方,程为,=0.95,x,+,则,=,(),A.3.25B.2.6,C.2.2D.0,x,0,1,3,4,y,2.2,4.3,4.8,6.7,B,答案,B由题意知,=2,=4.5,因为回归直线经过点(,),所以,=4.5-0.,95,2=2.6,故选B.,13/45,5.某校为了研究学生性别和对待某一活动态度(支持和不支持两种,态度)关系,利用2,2列联表进行独立性检验,经计算,K,2,=7.069,则所得,到统计学结论是有,把握认为“学生性别与支持该活动有,关系”.,(),附:,P,(,K,2,k,0,),0.100,0.050,0.025,0.010,0.001,k,0,2.706,3.841,5.024,6.635,10.828,A.0.1%B.1%C.99%D.99.9%,C,答案,C因为7.069与附表中6.635最靠近,所以得到统计学结论,是有1-0.010=0.99=99%把握认为“学生性别与支持该活动相关系”.,14/45,6.下面是一个2,2列联表,则表中,a,、,b,处值分别为,.,y,1,y,2,总计,x,1,a,21,73,x,2,2,25,27,总计,b,46,52、54,答案,52、54,解析,因为,a,+21=73,所以,a,=52.,又因为,a,+2=,b,所以,b,=54.,15/45,典例1,(1)(湖南长沙质检)以下四个散点图中,变量,x,与,y,之间含有,负线性相关关系是,(),考点一相关关系判断,考点突破,16/45,A.,r,2,r,4,0,r,3,r,1,B.,r,4,r,2,0,r,1,r,3,C.,r,4,r,2,0,r,3,r,1,D.,r,2,r,4,0,r,1,r,3,(2),对四组数据进行统计,取得以下散点图,关于其相关系数比较,正确,是,(,),17/45,答案,(1)D(2)A,解析,(1)观察散点图可知,只有D选项散点图表示是变量,x,与,y,之间,含有负线性相关关系.,(2)由相关系数意义,结合散点图可知,r,2,r,4,0,r,3,r,1,故选A.,18/45,1-1,在一组样本数据(,x,1,y,1,),(,x,2,y,2,),(,x,n,y,n,)(,n,2,x,1,x,2,x,n,不全相等),散点图中,若全部样本点(,x,i,y,i,)(,i,=1,2,n,)都在直线,y,=,x,+1上,则这组样,本数据样本相关系数为,(),A.-1B.0,C.,D.1,D,答案,D全部样本点均在同一条斜率为正数直线上,则样本相关系,数最大,为1,故选D.,19/45,1-2,变量,X,与,Y,对应一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);,变量,U,与,V,相对应一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).,r,1,表示变量,Y,与,X,之间线性相关系数,r,2,表示变量,V,与,U,之间线性相关,系数,则,(),A.,r,2,r,1,0B.0,r,2,r,1,C.,r,2,00;对于变量,V,与,U,而言,V,随,U,增大而减小,故,V,与,U,负相关,即,r,2,0),故,x,与,y,之间是正相关.,(3)将,x,=7代入回归方程能够预测该家庭月储蓄为,y,=0.3,7-0.4=1.7(千元).,26/45,典例3,(课标全国,19,12分)为了监控某种零件一条生产线,生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量,其尺寸(单位:cm).下面是检验员在一天内依次抽取16个零件尺寸:,考点三相关系数意义,抽取次序,1,2,3,4,5,6,7,8,零件尺寸,9.95,10.12,9.96,9.96,10.01,9.92,9.98,10.04,抽取次序,9,10,11,12,13,14,15,16,零件尺寸,10.26,9.91,10.13,10.02,9.22,10.04,10.05,9.95,27/45,经计算得,=,x,i,=9.97,s,=,=,0.212,18.439,(,x,i,-,)(,i,-8.5)=-2.78,其中,x,i,为抽取第,i,个零件尺寸,i,=1,2,16.,(1)求(,x,i,i,)(,i,=1,2,16)相关系数,r,并回答是否能够认为这一天生产,零件尺寸不随生产过程进行而系统地变大或变小(若|,r,|0.25,则能够,认为零件尺寸不随生产过程进行而系统地变大或变小);,(2)一天内抽检零件中,假如出现了尺寸在(,-3,s,+3,s,)之外零件,就认,为这条生产线在这一天生产过程可能出现了异常情况,需对当日生,产过程进行检验.,28/45,(i)从这一天抽检结果看,是否需对当日生产过程进行检验?,(ii)在(,-3,s,+3,s,)之外数据称为离群值,试剔除离群值,预计这条生产,线当日生产零件尺寸均值与标准差.(准确到0.01),附:样本(,x,i,y,i,)(,i,=1,2,n,)相关系数,r,=,;,0.09.,29/45,解析,(1)由样本数据得(,x,i,i,)(,i,=1,2,16)相关系数为,r,=,=,-0.18.,因为|,r,|0.25,所以能够认为这一天生产零件尺寸不随生产过程进,行而系统地变大或变小.,(2)(i)因为,=9.97,s,0.212,由样本数据能够看出抽取第13个零件尺,寸在(,-3,s,+3,s,)以外,所以需对当日生产过程进行检验.,(ii)剔除离群值,即第13个数据,剩下数据平均数为,(16,9.97-9.22)=,10.02,30/45,故这条生产线当日生产零件尺寸均值预计值为10.02.,=16,0.212,2,+16,9.97,2,1 591.134,剔除第13个数据,剩下数据样本方差为,(1 591.134-9.22,2,-15,10.02,2,),0.008,故这条生产线当日生产零件尺寸标准差预计值为,0.09.,31/45,2.线性相关系数是从数值上来判断变量间线性相关程度,若|,r,|值越,靠近于1,说明变量间线性相关程度越高;|,r,|值越靠近于0,说明变量,间线性相关程度越低.当两个变量间关系可用一次函数表示时,r,=,1,若斜率为正,r,=1,不然,r,=-1,r,为正时表示正相关,r,为负时表示负相关.,1.样本数据相关系数,r,r,=,规律总结,32/45,3-1,(课标全国,18,12分)下列图是我国至生活垃圾,无害化处理量(单位:亿吨)折线图.,(1)由折线图看出,可用线性回归模型拟合,y,与,t,关系,请用相关系数加,以说明;,33/45,(2)建立,y,关于,t,回归方程(系数准确到0.01),预测我国生活垃圾,无害化处理量.,附注:,参考数据:,y,i,=9.32,t,i,y,i,=40.17,=0.55,2.646.,参考公式:相关系数,r,=,回归方程,=,+,t,中斜率和截距最小二乘预计公式分别为,=,=,-,.,34/45,解析,(1)由折线图中数据和附注中参考数据得,=4,(,t,i,-,),2,=28,=0.55,(,t,i,-,)(,y,i,-,)=,t,i,y,i,-,y,i,=40.17-4,9.32=2.89,r,0.99.,因为,y,与,t,相关系数近似为0.99,说明,y,与,t,线性相关程度相当高,从而,能够用线性回归模型拟合,y,与,t,关系.,35/45,(2)由,=,1.331及(1)得,=,=,0.10,=,-,=1.331,-0.10,4,0.93.,所以,y,关于,t,回归方程为,=0.93+0.10,t,.,将对应,t,=9代入回归方程得:,=0.93+0.10,9=1.83.,所以预测我国生活垃圾无害化处理量将约为1.83亿吨.,36/45,典例4,(课标全国,19,12分)海水养殖场进行某水产品新、旧,网箱养殖方法产量对比,收获时各随机抽取了,100个网箱,测量各箱水产品产量(单位:kg),其频率分布直方图以下:,考点四独立性检验,37/45,(1)记,A,表示事件“旧养殖法箱产量低于50 kg”,预计,A,概率;,(2)填写下面列联表,并依据列联表判断是否有99%把握认为箱产量与,养殖方法相关;,箱产量50 kg,箱产量,50 kg,旧养殖法,新养殖法,38/45,(3)依据箱产量频率分布直方图,对这两种养殖方法优劣进行,比较.,附:,K,2,=,.,39/45,解析,(1)旧养殖法箱产量低于50 kg频率为,(0.012+0.014+0.024+0.034+0.040),5=0.62.,所以,事件,A,概率预计值为0.62.,(2)依据箱产量频率分布直方图得列联表:,箱产量6.635,故有99%把握认为箱产量与养殖方法相关.,(3)箱产量频率分布直方图表明:新养殖法箱产量平均值(或中位数),在50 kg到55 kg之间,旧养殖法箱产量平均值(或中位数)在45 kg到50,kg之间,且新养殖法箱产量分布集中程度较旧养殖法箱产量分布集,中程度高,所以,能够认为新养殖法箱产量较高且稳定,从而新养殖法,优于旧养殖法.,41/45,1.比较几个分类变量相关联可能性大小方法,(1)经过计算,K,2,大小判断:,K,2,越大,两变量相关联可能性越大.,(2)经过计算|,ad,-,bc,|大小判断:|,ad,-,bc,|越大,两变量相关联可能性越,大.,规律总结,2.独立性检验普通步骤,(1)依据样本数据制成2,2列联表.,(2)依据公式,K,2,=,计算,K,2,观察值,k,.,(3)比较,k,与临界值大小关系,作统计推断.,42/45,4-1,(广东惠州第三次调研)在某校举行航天知识竞赛中,参加竞,赛文科生与理科生人数之比为13,且成绩分布在40,100,分数在80,以上(含80)同学获奖.按文理科用分层抽样方法抽取200人成绩,作为样本,得到成绩频率分布直方图以下.,43/45,(1)求,a,值,并计算所抽取样本平均值,(同一组中数据用该组区间,中点值作代表);,(2)填写下面2,2列联表,是否有超出95%把握认为“获奖与学生,文理科相关”?,文科生,理科生,累计,获奖,5,不获奖,累计,200,附表及公式:,K,2,=,其中,n,=,a,+,b,+,c,+,d,.,P,(,K,2,k,),0.15,0.10,0.05,0.025,0.010,0.005,0.001,k,2.072,2.706,3.841,5.024,6.635,7.879,10.828,44/45,解析,(1)由频率分布直方图,可得,a,=1-(0.01+0.015+0.03+0.015+0.005),10,10=0.025,=45,0.1+55,0.15+65,0.25+75,0.3+85,0.15+95,0.05=69.,(2)填写2,2列联表以下:,文科生,理科生,累计,获奖,5,35,40,不获奖,45,115,160,累计,50,150,200,则,K,2,=,=,4.1673.841,有超出95%把握认为“获奖与学生文理科相关”.,45/45,
展开阅读全文