1、此文档仅供收集于网络,如有侵权请联系网站删除变量间的相关关系_1.通过收集现实问题中两个有关联变量的数据认识变量间的相关关系.2.明确事物间的相互联系.认识现实生活中变量间除了存在确定的关系外,仍存在大量的非确定性的相关关系,并利用散点图直观体会这种相关关系.3.经历用不同估算方法描述两个变量线性相关的过程知道最小二乘法的思想,能根据给出的线性回归方程的系数公式建立线性回归方程1相关关系(1)定义:如果两个变量中一个变量的取值一定时,另一个变量的取值带有一定的_性,那么这两个变量之间的关系,叫做相关关系(2)两类特殊的相关关系:如果散点图中点的分布是从_角到_角的区域,那么这两个变量的相关关系
2、称为正相关,如果散点图中点的分布是从_角到_角的区域,那么这两个变量的相关关系称为负相关随机 左下 右上 左上 右下两个变量间的关系分为三类:一类是确定性的函数关系,如正方形的边长与面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的,这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩”之间的关系,我们称它们为相关关系;再一类是不相关,即两个变量间没有任何关系2线性相关(1)定义:如果两个变量散点图中点的分布从整体上看大致在一条_附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做_(2)最小二乘法:求线性回归直线方程x时,使得样
3、本数据的点到它的_最小的方法叫做最小二乘法,其中a,b的值由以下公式给出:直线 回归直线 距离的平方和其中,是回归方程的_,是回归方程在y轴上的_ 斜率 截距线性回归分析涉及大量的计算,形成操作上的一个难点,可以利用计算机非常方便地作散点图、回归直线,并能求出回归直线方程因此在学习过程中,要重视信息技术的应用类型一 变量之间的相关关系的判断例1:(1)下列变量之间的关系不是相关关系的是()A二次函数yax2bxc中,a,c是已知常数,取b为自变量,因变量是判别式b24acB光照时间和果树亩产量C降雪量和交通事故发生率D每亩田施肥量和粮食亩产量(2)现随机抽取某校10名学生在入学考试中的数学成绩
4、x与入学后的第一次数学成绩y,数据如下:学号12345678910x12010811710410311010410599108y84648468696869465771请利用散点图判断这10名学生的两次数学考试成绩是否具有相关关系解析(1)在A中,若b确定,则a,b,c都是常数,b24ac也就唯一确这了,因此,这两者之间是确定性的函数关系;一般来说,光照时间越长,果树亩产量越高;降雪量越大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所以B,C,D是相关关系故选A.(2)两次数学考试成绩散点图如图所示,由散点图可以看出两个变量的对应点集中在一条直线的周围,具有正相关关系因此,这10名学生的
5、两次数学考试成绩具有相关关系练习1:对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关答案C类型二 回归直线方程例2:随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x与所支出的总费用y(
6、万元)有如下的数据资料:使用年限x23456总费用y2.23.85.56.57.0若由资料,知y对x呈线性相关关系试求:(1)线性回归方程x的回归系数、;(2)估计使用年限为10年时,车的使用总费用是多少?解析第一步,列表xi,yi,xiyi;第二步,计算,iyi;第三步,代入公式计算b,a的值;第四步,写出回归直线方程(1)利用公式:来计算回归系数有时为了方便常列表,对应列出xiyi、x,以利于求和(2)获得线性回归方程后,取x10,即得所求答案(1)列表:i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0x491625364,5,90
7、,iyi112.3于是1.23;b51.2340.08.(2)线性回归直线方程是1.23x0.08,当x10(年)时,1.23100.0812.38(万元),即估计使用10年时,支出总费用是12.38万元练习1:(2015石家庄高二检测)已知回归直线的斜率的估计值是1.23,样本点中心(即(,)为(4,5),则回归直线的方程是()A.1.23x4 B.1.23x5C.1.23x0.08 D.0.08x1.23答案C练习2:某公司的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:x24568y3040605070资料显示y对x呈线性相关关系根据上表提供的数据得到回归方程x中
8、的6.5,预测销售额为115万元时约需_万元广告费答案15有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童年数量,如下表:人均GDP/万元1086431患白血病的儿童数/人351312207175132180(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的回归直线方程为23.25x102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?解析(1)根据表中数据画散点图,如图所示,从图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个
9、点大致分布在这条直线的附近,所以这两个变量具有线性相关关系(2)上述断言是错误的,将x12代入23.25x102.15得23.2512102.15381.15380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人练习1:某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程x,其中20.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大
10、利润,该产品的单价应定为多少元?(利润销售收入成本)答案(1)由于(x1x2x3x4x5x6)8.5,(y1y2y3y4y5y6)80.所以80208.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x100020(x8.25)2361.25.当且仅当x8.25时,L取得是大值,故当单价定为8.25元时,工厂可获得最大利润1下列两个变量之间的关系:角度和它的余弦值;正n边形的边数与内角和;家庭的支出与收入;某户家庭用电量与电价间的关系其中是相关关系的有()A1个B2个C3个D4个答案A2下列图形中两个变量具有相
11、关关系的是() 答案C3设一个回归方程为31.2x,则变量x增加一个单位时()Ay平均增加1.2个单位By平均增加3个单位Cy平均减少1.2个单位Dy平均减少3个单位答案A4现有5组数据A(1,3)、B(2,4)、C(4,5)、D(3,10)、E(10,12),去掉_组数据后,剩下的4组数据的线性相关性最大答案D5下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)已知该厂技改前100吨甲产品的生产能耗
12、为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?解析(1)散点图,如图所示(2)由题意,得iyi32.5435464.566.5,4.5,3.5,3242526286,0.7,3.50.74.50.35,故线性回归方程为0.7x0.35.(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.71000.3570.35,故耗能减少了9070.3519.65(吨标准煤)_基础巩固一、选择题1由一组样本数据(x1,y1),(x2,y2),(xn,yn)得到的回归直线方程bxa,那么下面说法不正确的是()A直线bxa必经过点(,)
13、B直线bxa至少经过点(x1,y1),(x2,y2),(xn,yn)中的一个点C直线bxa的斜率为D直线bxa和各点(x1,y1),(x2,y2),(xn,yn)的偏差yi(bxia)2是该坐标平面上所有直线与这些点的偏差中最小的直线答案B解析由ab 知b bx,必定过(,)点回归直线方程对应的直线是与样本数据距离最小的,但不一定过原始数据点,只须和这些点很接近即可2下列说法正确的是()A对于相关系数r来说,|r|1,|r|越接近0,相关程度越大;|r|越接近1,相关程度越小B对于相关系数r来说,|r|1,|r|越接近1,相关程度越大;|r|越大,相关程度越小C对于相关系数r来说,|r|1,|
14、r|越接近1,相关程度越大;|r|越接近0,相关程度越小D对于相关系数r来说,|r|1,|r|越接近1,相关程度越小;|r|越大,相关程度越大答案C3(2015辽宁鞍山调研)两个变量成负相关关系时,散点图的特征是()A点从左下角到右上角区域散布B点散布在某带形区域内C点散布在某圆形区域内D点从左上角到右下角区域散布答案D4(2014重庆)已知变量x与y正相关,且由观测数据算得样本的平均数2.5,3.5,则由观测的数据得线性回归方程可能为()A.0.4x2.3 B.2x2.4C.2x9.5 D.0.3x4.4答案A解析x,正相关则b0,排除C,D.过中点心(,)(3,3.5),选A.5某化工厂为
15、预测某产品的回收率y,需要研究它的原料有效成分含量x之间的相关关素,现取了8对观测值,计算得:i52,i228,478,iyi1849,则y对x的回归直线的方程是()A.11.472.62x B.11.472.62xC.2.6211.47x D.11.472.62x答案A解析由已知得i52,i228,所以2.62,2.6211.47,所以2.62x11.47.6为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别是s和t,那么下列说法中正确的是()
16、A直线l1、l2一定有公共点(s,t)B直线l1、l2相交,但交点不一定是(s,t)C必有直线l1l2Dl1、l2必定重合答案A解析线性回归直线方程为bxa,而,即atbs,tbsa,所以(s,t)在回归直线上,直线l1、l2一定有公共点(s,t)二、填空题7(2011辽宁高考)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:0.254x0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元答案0.254解析由于0.254x0.321知,当x增加1万元时,年
17、饮食支出y增加0.254万元8某单位为了解用电量y(度)与气温x()之间的关系,随机抽查了某4天的用电量与当天气温,并制作了对照表:气温()1813101用电量(度)24343864由表中数据得线性回归方程x中2,预测当气温为4时,用电量约为_度答案68解析10,40,因为回归方程一定过点(,),所以,则4021060.则2x60,当x4时,2(4)6068.三、解答题9某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元)x24568y3040605070(1)画出散点图;(2)从散点图中判断销售金额与广告费支出成什么样的关系?解析(1)以x对应的数据为横坐标,以y对应的数据为纵
18、坐标,所作的散点图如下图所示:(2)从图中可以发现广告费支出与销售金额之间具有相关关系,并且当广告费支出由小变大时,销售金额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系10一台机器由于使用时间较长,生产的零件有一些缺损按不同转速生产出来的零件有缺损的统计数据如下表所示:转速x(转/秒)1614128每小时生产有缺损零件数y(个)11985(1)作出散点图;(2)如果y与x线性相关,求出回归直线方程;(3)若实际生产中,允许每小时的产品中有缺损的零件最多为10个,那么,机器的运转速度应控制在什么范围内?解析先作出散点图,再根据散点图判断y与x呈线性相关,从而建立回归直
19、线方程求解解:(1)作散点图如图所示(2)由散点图可知y与x线性相关故可设回归直线方程为bxa.依题意,用计算器可算得:12.5,8.25,660,iyi438.b0.73,ab8.250.7312.50.875.所求回归直线方程为0.73x0.875.(3)令10,得0.73x0.87510,解得x15.即机器的运转速度应控制在15转/秒内能力提升一、选择题1(2014湖北)根据如下样本数据得到的回归方程为bxa,则()x345678y4.02.50.50.52.03.0A.a0,b0Ba0,b0Ca0,b0Da0,b0答案A解析由于x增大y减小知b0,又x3时y0,a0,故选A.2某产品的
20、广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程x中的为9.4,据此模型预报广告费用为6万元时销售额为()A63.6万元B65.5万元C67.7万元D72.0万元答案B探究由线性回归方程的图象过样本点的中心,可求得线性回归方程,然后结合该方程对x6时的销售额作出估计解析样本点的中心是(3.5,42),则429.43.59.1,所以线性回归方程是9.4x9.1,把x6代入得65.5.3已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为x.若某同学根据上表中的前两组数据(1,0)和(
21、2,2)求得的直线方程为ybxa,则以下结论正确的是()A.b,a B.b,aC.b,a D.b,a答案C探究先由已知条件分别求出b,a的值,再由,的计算公式分别求解,的值,即可作出比较解析由两组数据(1,0)和(2,2)可求得直线方程为y2x2,从而b2,a2.而利用线性回归方程的公式与已知表格中的数据,可求得,所以b,a.4某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:x1020304050y62758189由最小二乘法求得回归方程为0.67x54.9,现发现表中有一个数据模糊不清,请推断该数据的值为()A60B62C68D68.3答案C解析由题意可得30,代入回归方程得75.
22、设看不清处的数为a,则62a758189755,a68.点评表中所给的数据只反映x与y的线性关系,并非函数关系,因而不能直接代入线性方程求预报值,应根据线性回归方程性质,即线性回归方程经过中心点(,)求解二、填空题52010年4月初,广东部分地区流行手足口病,党和政府采取果断措施,防治结合,很快使病情得到控制下表是某同学记载的2010年4月1日到2010年4月12日每天广州手足口病治愈出院者数据,根据这些数据绘制散点图如图.日期123456人数100109115118121134日期789101112人数141152168175186203下列说法:根据此散点图,可以判断日期与人数具有线性相关
23、关系;根据此散点图,可以判断日期与人数且有一次函数关系;后三天治愈出院的人数占这12天治愈出院人数的30%多;后三天治愈出院的人数均超过这12天内北京市治愈出院人数的20%.其中正确的个数是_答案26改革开放30年以来,我国高等教育事业迅速发展,对某省19902000年考大学升学百分比按城市、县镇、农村进行统计,将19902000年依次编号为010,回归分析之后得到每年考入大学的百分比y与年份x的关系为:城市:2.84x9.50;县镇:2.32x6.67;农村:0.42x1.80.根据以上回归直线方程,城市、县镇、农村三个组中,_的大学入学率增长最快按同样的增长速度,可预测2010年,农村考入
24、大学的百分比为_%.答案城市10.2探究增长速度可根据回归直线的斜率来判断,斜率大的增长速度快,斜率小的增长速度慢解析通过题目中所提供的回归方程可判断,城市的大学入学率增长最快;2010年农村考入大学的百分比为0.42201.8010.2.三、解答题7(2014新课标全国高考)某地区2007年至2013年农村居民家庭人均纯收入y(单位:千元)的数据如下表年份2007200820092010201120122013年份代号1234567人均纯收入y2.93.33.64.44.85.25.9(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人
25、均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入,附:回归直线的斜率和截距的最小二乘估计公式分别为:,.解析(1)由所给数据计算得(1234567)4,(2.93.33.64.44.85.25.9)4.3,(ti)2941014928,(ti)(yi)(3)(1.4)(2)(1)(1)(0.7)00.110.520.931.614,0.5,4.30.542.3,所求回归方程为0.5t2.3.(2)由(1)知,b0.50,故2007年至2013年该地区农村居民家庭人均纯收入逐年增加,平均每年增加0.5千元,将2015年的年份代号t9代入(1)中的回归方程,得0.592.36.8,
26、故预测该地区2015年农村居民家庭人均纯收人为6.8千元8(2013重庆)从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得i80,i20,iyi184,720.(1)求家庭的月储蓄y对月收入x的线性回归方程x;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄附:线性回归方程x中,其中,为样本平均值探究(1)根据线性回归方程求相关的量后,代入公式即可求得回归方程;(2)观察线性回归方程的系数 可判断是正相关还是负相关;(3)将x7代入线性回归方程即可求得预报变量,即该家庭的月储蓄解析(1)由题意知n10,i8,i2,又n2720108280,iyin 184108224,由此得0.3,20.380.4,故所求回归方程为0.3x0.4.(2)由于变量y的值随x的值增加而增加(0.30),故x与y之间是正相关(3)将x7代入回归方程可以预测该家庭的月储蓄为0.370.41.7(千元)只供学习与交流