资源描述
变量间得相关关系讲义
一、基础知识梳理
知识点1:变量之间得相关关系
两个变量之间得关系可能就是确定得关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间得关系称为相关关系。相关关系就是一种非确定性关系,如长方体得高与体积之间得关系就就是确定得函数关系,而人得身高与体重得关系,学生得数学成绩好坏与物理成绩得关系等都就是相关关系。
注意:两个变量之间得相关关系又可分为线性相关与非线性相关,如果所有得样本点都落在某一函数曲线得附近,则变量之间具有相关关系(不确定性得关系),如果所有样本点都落在某一直线附近,那么变量之间具有线性相关关系,相关关系只说明两个变量在数量上得关系,不表明她们之间得因果关系,也可能就是一种伴随关系。
点睛:两个变量相关关系与函数关系得区别与联系
相同点:两者均就是两个变量之间得关系,不同点:函数关系就是一种确定得关系,如匀速直线运动中时间t与路程s得关系,相关关系就是一种非确定得关系,如一块农田得小麦产量与施肥量之间得关系,函数关系就是两个随机变量之间得关系,而相关关系就是非随机变量与随机变量之间得关系;函数关系式一种因果关系,而相关关系不一定就是因果关系,也可能就是伴随关系。
知识点2、散点图、
1、在考虑两个量得关系时,为了对变量之间得关系有一个大致得了解,人们常将变量所对应得点描出来,这些点就组成了变量之间得一个图,通常称这种图为变量之间得散点图。
2、从散点图可以瞧出如果变量之间存在着某种关系,这些点会有一个集中得大致趋势,这种趋势通常可以用一条光滑得曲线来近似,这种近似得过程称为曲线拟合。
3、对于相关关系得两个变量,如果一个变量得值由小变大时,另一个变量得得值也由小变大,这种相关称为正相关,正相关时散点图得点散布在从左下角到由上角得区域内。
如果一个变量得值由小变大时,另一个变量得值由大变小,这种相关称为负相关,负相关时散点图得点散步在从左上角到右下角得区域。
注意:画散点图得关键就是以成对得一组数据,分别为此点得横、纵坐标,在平面直角坐标系中把其找出来,其横纵坐标得单位长度得选取可以不同,应考虑数据分布得特征,散点图只就是形象得描述点得分布,如果点得分布大致呈一种集中趋势,则两个变量可以初步判断具有相关关系,如图中数据大致分布在一条直线附近,则表示得关系就是线性相关,如果两个变量统计数据得散点图呈现如下图所示得情况,则两个变量之间不具备相关关系,例如学生得身高与学生得英语成绩就没有相关关系。
点睛:散点图又称散点分布图,就是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)得分布形态反映变量统计关系得一种图形。特点就是能直观表现出影响因素与预测对象之间得总体关系趋势。优点就是能通过直观醒目得图形方式反映变量间关系得变化形态,以便决定用何种数学表达方式来模拟变量之间得关系。散点图不仅可传递变量间关系类型得信息,也能反映变量间关系得明确程度
知识点3:回归直线
(1)回归直线得定义
如果散点图中点得分布从整体上瞧大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。
(2)回归直线得特征
如果能够求出这条回归直线得方程(简称回归方程),那么我们就可以比较清楚得了解对应两个变量之间得相关性,就像平均数可以作为一个变量得数据得代表一样,这条直线也可以作为两个变量之间具有相关关系得代表。
(3)回归直线方程
一般地,设x与y就是具有相关关系得两个变量,且相应n组观测值得n个点(xi,yi)(i=1,2,…,n)大致分布在一条直线得附近,求在整体上与这n个点最接近得一条直线,设此直线方程为,这里得y在上方加上“”就是为了区分实际值y,表示当x取值xi,y相应得观察值yi而直线上对应于xi,得纵坐标就是
点睛:1)散点图中得点整体上分布在一条直线附近时,可以应用线性回归分析得方法分析数据;
2)回归直线就是反映:“从整体上瞧,各点与此直线得距离得与最小”得一条直线,它反映了具有线性相关关系得两个变量之间得规律;
3)我们可以通过回归直线方程,由一个变量得值来推测另一个变量得值,解决生活中得实际问题;这种方法称为回归方法
知识点4:回归系数公式及相关问题
1、最小二乘法:求回归直线得关键就是如何用数学得方法刻画从整体上瞧,各点与此直线得距离最小,假设我们已经得到两个具有线性相关关系得变量得一组数据:……。当自变量取(=1,2,……,n)时,可以得到(=1,2,……,n),它与实际收集到得之间得偏差就是(=1,2,……,n)这样用n个偏差得与来刻画“各点与此直线得整体偏差”就是比较合适得。总得偏差为,偏差有正有负,易抵消,所以采用绝对值,由于带绝对值计算不方便所以换成平方,①现在得问题就归结为:当,b取什么值时Q最小,即点到直线y=bx+a得整体距离最小
②(其中,) 这种通过求①式得最小值而得到回归直线得方法,即使得样本数据得点到回归直线得距离得平方与最小得方法叫最小二乘法。
2、回归直线方程得求法
①先判断变量就是否线性相关
②若线性相关,利用公式计算出a,b
③利用回归方程对生活实际问题进行分析与预测
注意:①线性回归直线方程中x得系数就是b,常数项就是a,与直线得斜截式不大一样,
②如果散点图中得点分布从整体上瞧不在任何一条直线附近,这时求出得线性回归方程实用价值不大。
点睛:线性回归方程:一般地,设有个观察数据如下:
…
…
当a,b使取得最小值时,就称为拟合这对数据得线性回归方程,该方程所表示得直线称为回归直线
知识点5:线性回归分析思想在实际中得应用
教材中利用回归直线对年龄与脂肪得关系做了上述分析,这种分析方法叫做线性回归分析。利用这种分析方法可以对生活中得很多问题进行分析与预测,
求线性回归方程得步骤:计算平均数;计算得积,求;计算;将结果代入公式求;用 求;写出回归方程
注意:对一组数据进行线性回归分析时,应先画出其散点图,瞧其就是否呈直线形,再依系数a,b得计算公式,算出.由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误。
知识点6:利用相关系数判断线性相关程度
最小二乘法求出回归直线得方程后,可以对上面两个变量得关系进行分析与预测,如图
前两个就是线性相关,可以求回归方程,后两个就是非线性相关,直线不能很好地反映图中两个变量之间得关系。显然求回归直线得方程就是没有意义得。有些变量线性相关,有些非线性相关,衡量变量得线性相关程度引入一个量:相关系数
注意它得符号:当时,x,y正相关,当时,x,y负相关,统计学认为:对于r,若那么负相关很强,若,那么正相关很强若,那么相关性一般, 若,那么相关性较弱,
点睛:相关系数得绝对值越大,线性相关关系就越强。
二、常考题型例解
易---------------------知识点1
例1:下列两个变量之间就是相关关系得就是( )
A、圆得面积与半径
B、球得体积与半径
C、角度与它得正弦值
D、一个考生得数学成绩与物理成绩
思路分析:由题意知A表示圆得面积与半径之间得关系S=πr2,B表示球得体积与半径之间得关系C表示角度与它得正弦值y=sinα,前面所说得都就是确定得函数关系,相关关系不就是确定得函数关系,故选D.
解:D
点拨:本题考查变量间得相关关系,判断两个变量间得关系还就是函数关系还就是相关关系得关键就是判断两个变量之间得关系就是否就是确定得,若确定得则就是函数关系;若不确定,则就是相关关系.
例2:名师出高徒可以解释为老师得水平越高,学生得水平也越高,那么教师与学生得水平之间有何种关系呢?您能举出更多得描述生活中两变量相关关系得成语与俗语吗?至少写两个。
思路分析:名师出高徒得意思就是有名得教师一定能教出高明得徒弟,高水平教师有很大趋势教出高水平得学生,实际学生成绩得好坏还与很多因素有关,如学生得天赋,学生得努力,学习得环境等,所以它们之间得关系带有不确定性即为相关关系。
解:教师得水平与学生得水平之间具有相关关系
生活中描述两个变量之间得相关关系得成语或俗语还有:老子英雄儿好汉,强将手下无弱兵,虎父无犬子
2009•宁夏高考中 知识点2
例3、对变量x、y有观测数据(xi,yi)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图2.由这两个散点图可以判断( )
A、变量x与y正相关,u与v正相关 B、变量x与y正相关,u与v负相关
C、变量x与y负相关,u与v正相关 D、变量x与y负相关,u与v负相关
思路分析:由题图1可知,y随x得增大而减小,各点整体呈递减趋势,x与y负相关,
由题图2可知,u随v得增大而增大,各点整体呈递增趋势,u与v正相关.
解:C
点拨:本题考查散点图,就是通过读图来解决问题,考查读图能力,就是一个基础题,本题可以粗略得反应两个变量之间得关系,就是不就是线性相关,就是正相关还就是负相关
易知识点3
例4:5个学生得数学与物理成绩如下表:
由散点图判断它们就是否相关,就是正相关还就是负相关?
思路分析:分别以数学与物理成绩作为横纵坐标建立直角坐标系,描点画出散点图,然后根据散点图判断。
解:以x轴表示数学成绩,y轴表示物理成绩可得到相应得散点图,如图所示
由散点图可知,两者之间具有相关关系,且为正相关.
例5:下表为某地近几年机动车辆数与交通事故数得统计资料,
请判断机动车辆数与交通事故数之间就是否有线性相关关系,如果具有线性相关关系,求出线性回归方程;如果不具有线性相关关系,说明理由.
思路分析:根据表中数据画出散点图,观察数据就是否集中,判断变量之间关系,再利用最小二乘法计算系数a,b写出线性回归方程
解:
在直角坐标系中画出数据得散点图,直观判断散点在一条直线附近,故具有线性相关关系.计算相应得数据之与:
,
将它们代入()式计算得,所以,所求线性回归方程为.
知识点4
例6:有一位同学家开了一个小卖部,她为了研究气温对热饮销售得影响,经过统计得到了一个热饮杯数与当天气温之间得线性关系,其回归方程为 y^=-2、35x+147、77.如果某天气温为-2℃时,则该小卖部大约能卖出热饮得杯数就是( )
A、140 B、143 C、152 D、156
思路分析:∵一个热饮杯数与当天气温之间得线性关系,其回归方程为 y^=-2、35x+147、77.
如果某天气温为-2℃时,即x=-2,
则该小卖部大约能卖出热饮得杯数y=-2、35×(-2)+147、77=152、47≈152
解:C.
例7:某县教研室要分析学生初中升学得数学成绩对高一年级数学成绩有什么影响,在高一年级学生中随机抽选10名学生,分析她们入学得数学成绩与高一年级期末数学考试成绩(如下表):
(1)对变量x与y进行相关性检验,如果x与y之间具有线性相关关系,求出线性回归方程;
(2)若某学生入学数学成绩就是80分,试估测她高一期末数学考试成绩
思路分析:(1)根据所给得数据利用最小二乘法.写出线性回归方程得系数与a得值,写出线性回归方程,注意运算过程中不要出错.
(2)将x=80代入所求出得线性回归方程中,得y=8分,即这个学生得高一期末数学考试成绩预测值为84分
解:(1)设所求得线性回归方程为y=ax+b
最小二乘法可以写出
因此所求得线性回归方程y=0、742x+23、108
(2)将x=80代入所求出得线性回归方程中,
得y=84分,即这个学生得高一期末数学考试成绩预测值为84分
点拨:利用回归方程可以对总体进行预测估计,回归方程将部分观测值所反映得规律进行延伸,使我们对有线性相关关系得两个变量进行分析与控制,依据自变量得取值估计与预报因变量得值,在现实生活中有广泛得应用
知识点5
例8:某种产品得广告费用支出x万元与销售额y万元之间有如下得对应数据:
(1)根据上表提供得数据,求出y关于x得线性回归方程;
(2)据此估计广告费用为10万元时,所得得销售收入
知识点6
例9:一台机器使用得时间较长,但还可以使用,它按不同得转速生产出来得某机械零件有一些会有缺点,每小时生产有缺点零件得多少,随机器得运转得速度而变化,下表为抽样试验得结果:
(1)利用散点图或相关系数r得大小判断变量y对x就是否线性相关?为什么?
(2)如果y对x有线性相关关系,求回归直线方程;
(3)若实际生产中,允许每小时得产品中有缺点得零件最多为10个,那么机器得运转速度应控制在什么范围内?(最后结果精确到0、001.参考数据: ,
16×11+14×9+12×8+8×5=438,162+142+122+82=660,112+92+82+52=291)
思路分析:(1)利用所给得数据做出两个变量得相关系数,得到相关系数趋近于1,得到两个变量具有线性相关关系.
(2)先做出横标与纵标得平均数,做出利用最小二乘法求线性回归方程得系数得量,做出系数,求出a,写出线性回归方程.
(3)根据上一问做出得线性回归方程,使得函数值小于或等于10,解出不等式.
三、典例方法详析
考点1:相关关系
方法:两个变量间得关系。相关关系就是一种非确定得关系,也不一定就是因果关系。如产品销售额与广告费得投入关系。
例10:下面哪些变量就是相关关系( )
A、出租车费与行驶得里程 B、房屋面积与房屋价格
C、人得身高与体重 D、铁块得大小与质量
思路分析:由出租车费与行驶得里程、房屋面积与房屋价格与铁块得大小与质量知它们都就是确定得函数关系,故A、B、C不对,根据经验知人得身高会影响体重但不就是唯一因素,故就是相关关系.从而得出正确答案.
解:A、由出租车费与行驶得里程得公式知,就是确定得函数关系,故A不对;
B、房屋面积与房屋价格,就是确定得函数关系,故B不对;
C、人得身高会影响体重,但不就是唯一因素,故C对;
D、铁块得大小与质量,就是确定得函数关系故D不对.
故选C.
考点2:散点图
方法:根据所给数据分别作为点得横纵坐标在直角坐标系内描点,画图。
例11:某研究小组在一项实验中获得一组数据,将其整理得到如图所示得散点图,下列函数中,最能近似刻画y与t之间关系得就是( )
A、y=2t B、y=2t2 C、y=t3 D、y=log2t
思路分析:根据所给得散点图,观察出图象在第一象限,单调递增,并且增长比较缓慢,一般用对数函数来模拟,
在选项中只有一个底数就是2得对数函数,
解:D.
综合技能提升
考点3:回归方程
方法:利用最小二乘法得思想,根据线性回归方程系数公式建立回归方程,估计与预测取值,从而获得对两个变量之间整体关系得了解。
例12、在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x得一组数据如表所示:
(1)画出数据得散点图;
(2)根据散点图,您能得出什么结论?
(3)求回归方程.
思路分析:(1)由图表可以知道有(5,6)(10,10)(15,11)(20,13)(30,16)(40,17)(50,19)(60,23)点得坐标,在坐标系中描出点得坐标,得到散点图.
(2)散点图呈带状分布,x与y就是具有相关关系得两个变量,且对应n组观测值得n个点大致分布在一条直线附近.
(3)计算得r=0、979307992>0、75.x与y有很强得线性相关关系,做出横标与纵标得平均数,利用最小二乘法做出回归直线方程得系数,得到回归直线方程.
解:(1)由图表可以知道有(5,6)(10,10)(15,11)(20,13)
(30,16)(40,17)(50,19)(60,23),
在坐标系中得到散点图如图所示
(2)结论:x与y就是具有相关关系得两个变量,且对应n组观测值得n个点大致分布在一条直线附近,
其中整体上与这n个点最接近得一条直线最能代表变量x与y之间得关系.
(3)计算得r=0、979307992>0、75.
x与y有很强得线性相关关系,
x¯=5+10+15+20+30+40+50+60 8=28、75
y¯=6+10+11+13+16+17+19+23 8=14、25
由计算器计算得 a^=6、616438≈6、62,
b^=0、269863≈0、27,
∴ y^=6、62+0、27x.
四、学法对应题练
1、下列选项中,两个变量具有相关关系得就是( )
A、正方形得面积与周长 B、匀速行驶车辆得行驶路程与时间
C、人得身高与体重 D、人得身高与视力
分析:由正方形得面积与周长得公式与匀速直线运动得路程公式知它们都就是确定得函数关系,故A、B不对,根据经验知人得身高会影响体重但不就是唯一因素,故就是相关关系;人得身高与视力无任何关系,故选C.
2、下列变量关系就是相关关系得就是( )
①家庭得经济条件与学生得学习成绩之间得关系
②教师得执教水平与学生得学习成绩之间得关系;
③学生得身高与学生得学习成绩之间得关系;
④学生得学习态度与学习成绩之间得关系.
A、 ①② B、①③ C、②③ D、②④
分析:对于①,家庭得经济条件与学生得学习成绩之间得关系没有关系,所以①不就是;对于②,教师得执教水平与学生得学习成绩之间得有关系,但不确定;就是相关关系,所以②就是;对于③,学生得身高与学生得学习成绩之间没有关系;所以③不就是;对于④,学生得学习态度与学习成绩之间有关系,但关系不确定;所以就是相关关系,所以④就是.故选D.
学法指导
考查了两个变量之间具有相关关系得定义,根据学过公式与经验进行逐项验证,一定要与函数关系区别出来.
3、在画两个变量得散点图时,下面哪个叙述就是正确得( )
A、预报变量x轴上,解释变量y轴上 B、解释变量x轴上,预报变量y轴上
C、可以选择两个变量中任意一个变量x轴上 D、可以选择两个变量中任意一个变量y轴上
分析:∵通常把自变量称为解析变量,因变量称为预报变量,∴故解释变量为自变量,预报变量为因变量.故选B
4、 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录得产量x(吨)与相应得生产能耗y(吨标准煤)得几组对照数据.
(1)请画出上表数据得散点图;
(2)请根据上表提供得数据,用最小二乘法求出y关于x得线性回归方程 y=b^x+a^;
(3)已知该厂技改前100吨甲产品得生产能耗为90吨标准煤.试根据(2)求出得线性回归方程,预测生产100吨甲产品得生产能耗比技改前降低多少吨标准煤?(参考数值:3×2、5+4×3+5×4+6×4、5=66、5)
学法指导
本题考查散点图,就是通过读图来解决问题,考查读图能力,就是一个基础题,本题可以粗略得反应两个变量之间得关系,就是不就是线性相关,就是正相关还就是负相关.
5(2010•临颍县)已知回归直线斜率得估计值就是1、23,样本平均数 x¯=4,y¯=5,则该回归直线方程为( )
A、y^=1、23x+4 B、 y^=1、23x+0、08 C、 y^=0、08x+1、23 D、 y^=1、23x+5
思路分析:根据回归直线斜率得估计值就是1、23,得到线性回归方程就是y=1、23x+b,根据横标与纵标得值得到样本中心点,把中心点代入方程求出b得值.
解答:解:∵回归直线斜率得估计值就是1、23,∴线性回归方程就是y=1、23x+b
∵样本平均数 x¯=4,y¯=5,∴样本中心点就是(4,5)∴5=1、23×4+a∴a=0、08,
∴线性回归方程就是y=1、23x+0、08,故选B.
点评:本题考查线性回归方程得写法,解题得关键就是知道线性回归直线一定过样本中心点,把样本中心点代入求出b得值,注意数字得运算.
6、 某种产品得广告费支出x与销售额y(单位:万元)之间有如下对应数据:
(Ⅰ)画出散点图;
(Ⅱ)求回归直线方程;
(Ⅲ)试预测广告费支出为10万元时,销售额多大?
思路分析:本题考察得知识点就是散点图及回归直线方程得求法,
(1)根据表中数据描点即可得到散点图.
(2)由表中数据,我们不难求出x,y得平均数,及xi2得累加值,及xiyi得累加值,代入回归直线系数计算公式,即可求出回归直线方程.
(3)将预报值10万元代入回归直线方程,解方程即可求出相应得销售额.
解:(Ⅰ)根据表中所列数据可得散点图如下:
(Ⅱ) x¯=2+4+5+6+8 5=5,
y¯=30+40+50+60+70 5=50
又已知 ∑i=15xi2=145, ∑i=15xiyi=1380.
于就是可得: b^=i=1∑5xiyi-x¯y¯i=1∑5xi2-5x-2= 1380-5×5×50 145-5×5×5=6、5
a^=y¯-b^x¯=50-6、5×6=17、5
因此,所求回归直线方程为: ŷ=6、5x+17、5
(Ⅲ)根据上面求得得回归直线方程,当广告费支出为10万元时,
ŷ=6、5×10+17、5=82、5(万元)
即这种产品得销售收入大约为82、5万元
点拨:用二分法求回归直线方程得步骤与公式要求大家熟练掌握,线性回归方程必过样本中心点(x¯,y¯).就是两个系数之间得纽带,希望大学注意.
学法指导
本题考查散点图,考查从散点图观察两个变量之间得相关关系,考查线性回归直线方程得写法,就是一个综合题,运算量比较大,注意像这种考运算得问题不要出错.
展开阅读全文