1、第第3讲讲 变量间的相关关系与统计案例变量间的相关关系与统计案例不同寻常的一本书,不可不读哟!1.会作两个相关变量的数据的散点图,会利用散点图认识变量间的相关关系2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3.了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用4.了解回归分析的基本思想、方法及其简单应用.2点重要区别1.函数关系是一种确定的关系,相关关系是一种非确定的关系2.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系2项必须防范1.求回归方程,关键在于正确求出系数a,b,由于a,b的计算量大,计算时应仔细谨慎,分层进行,避免因
2、计算而产生错误2.回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义课前自主导学1.两个变量的线性相关(1)正相关在散点图中,点散布在从_到_的区域对于两个变量的这种相关关系,我们将它称为正相关(2)负相关在散点图中,点散布在从_到_的区域,两个变量的这种相关关系称为负相关(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在_,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线如何利用散点图判断两变量间是否具有相关性?如图所示,有5组(x,y)数据,去掉_组数据后,剩下的4组数据具有
3、较强的线性相关关系工人月工资(元)依劳动产值(千元)变化的回归直线方程为6090 x,下列判断是否正确劳动产值为1000元时,工资为50元()劳动产值提高1000元时,工资提高150元()劳动产值提高1000元时,工资提高90元()劳动产值为1000元时,工资为90元()已知x,y之间的数据如表所示,则回归直线恒过定点的坐标为_.x12345y1.21.82.53.23.83.独立性检验(1)分类变量:变量的不同“值”表示个体所属的_,像这类变量称为分类变量(2)列联表:列出的两个分类变量的_,称为列联表假设有两个分类变量X和Y,它们的可能取值分别为x1,x2和y1,y2,其样本频数列联表(称
4、为22列联表)为22列联表y1y2总计x1ababx2cdcd总计acbdabcd(3)独立性检验利用随机变量K2来确定在多大程度上可以认为“_ _”的方法称为两个分类变量的独立性检验(1)下面是22列联表:则表中a,b的值分别为_(2)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算K2的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填“有关”或“无关”).y1y2合计x1a2173x2222547合计b461201.左下角右上角左上角右下角一条直线的附近想一想:提示:散点图呈带状且区域较窄,说明两变量具有相关性,否则不具有填一填:D2距离的平方和判一判
5、:填一填:(3,2.5)3.不同类别频数表abcd两个分类变量有关系填一填:(1)52,74(2)有关提示:k27.636.635,有99%以上的把握认为“打鼾与患心脏病有关”.核心要点研究审题视点所有样本点都在同一直线上,说明相关性很强,相关系数达到最大值解析因为所有点都分布在一条直线上,说明相关性很强,相关系数达到最大值,即为1.故选D.答案D(1)在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系;(2)如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系;(3)如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系变
6、式探究2013苏州模拟观察下列各图形:其中两个变量x、y具有相关关系的图是()A.B.C.D.答案:C解析:相关关系有两种情况:所有点看上去都在一条直线附近波动,是线性相关;若所有点看上去都在某条曲线(不是一条直线)附近波动,是非线性相关是不相关的,而是相关的故选C.例22012福建高考某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568审题视点应用最小二乘法求回归方程,结合方程进行回归分析变式探究2011广东高考为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小
7、李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:小李这5天的平均投篮命中率为_;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为_时间x12345命中率y0.40.50.60.60.4答案:0.50.53例32012辽宁高考电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性(1)根据已知条件完成下面的22列联表,并据此资料你是否认为“体育迷”与性
8、别有关?非体育迷体育迷合计男女合计解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”为25人,从而完成22列联表如下:非体育迷体育迷合计男301545女451055合计7525100利用统计量K2进行独立性检验的步骤:第一步根据数据列出22列联表;第二步根据公式计算K2的观测值k;第三步比较观测值k与临界值表中相应的检验水平,作出统计推断变式探究2012江苏徐州二模在研究色盲与性别的关系调查中,调查了男性480人,其中有38人患色盲,调查的520名女性中,有6人患色盲(1)根据以上数据建立一个22列联表;(2)若认为“性别与患色盲有关系”,则出错的概率会是多少?附临界值参考表:P(K
9、2x0)0.100.050.0250.100.0050.001x02.7063.8415.0246.6357.87910.828解析:(1)患色盲不患色盲总计男38442480女6514520总计449561000课课精彩无限规范解答本题考查线性回归方程的特征与性质,意在考查考生对线性回归方程的了解解题思路:A,B,C均正确,是回归方程的性质,D项是错误的,线性回归方程只能预测学生的体重选项D应改为“若该大学某女生身高为170 cm,则估计其体重大约为58.79 kg”答案D【备考角度说】No.1角度关键词:易错分析本题易错一:对线性回归方程不了解,无法得出答案;易错二:对回归系数b不了解,错
10、选C;易错三:线性回归方程有预测的作用,得出的结果不是准确结果,误以为D项是对的经典演练提能 1.对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图1;对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图2.由这两个散点图可以判断()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案:C解析:夹在带状区域内的点,总体呈上升趋势的属于正相关;反之,总体呈下降趋势的属于负相关显然选C.2.2012宁夏吴忠模拟某单位为了了解用电量y度与气温x之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:气温()1813101用电量(度)24343864答案:683.2013怀柔模拟某中学2013年共91人参加高考,统计数据如下:则考生的户口形式和高考录取的关系是_(填无关、多大把握有关)答案:无关城镇考生农村考生录取3124未录取1917解析:22列联表如下:城镇考生农村考生合计录取312455未录取191736合计5041914.2013长春模拟某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm.答案:185