资源描述
2020-2021学年高中数学 第一章 统计 1.7 相关性 8 最小二乘估计学案北师大版必修3
2020-2021学年高中数学 第一章 统计 1.7 相关性 8 最小二乘估计学案北师大版必修3
年级:
姓名:
7 相关性 8 最小二乘估计
考 纲 定 位
重 难 突 破
1.会作散点图,并利用散点图直观认识变量间的相关关系.
2.知道最小二乘法的思想,能够根据给出的线性回归系数公式建立线性回归方程.
重点:作散点图,会建立线性回归方程.
难点:准确理解变量的相关关系并求线性回归方程.
授课提示:对应学生用书第16页
[自主梳理]
1.散点图
在考虑两个量的关系时,为了对变量之间的关系有一个大致的了解,人们通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.
2.变量之间的相关关系
从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.若两个变量x和y的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关的,而若所有点看上去都在某条曲线(不是一条直线)附近波动,则称此相关为非线性相关.如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的.
3.最小二乘法与线性回归方程
如果有n个点(x1,y1),(x2,y2),…,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:
[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2使得上式达到最小值的直线y=a+bx就是我们所要求的直线,这种方法称为最小二乘法.
说明:
线性回归方程y=a+bx中,
b=(其中=,
=);
a=-b__.
[双基自测]
1.下列两个变量之间的关系是相关关系的是( )
A.正方体的棱长与体积
B.单位圆中圆心角的度数与所对弧长
C.单位面积的产量为常数时,土地面积与总产量
D.日照时间与水稻的亩产量
解析:选项A,B,C均为函数关系,日照时间与水稻的亩产量有一定的关系,日照时间长,水稻的亩产量就高,但这种情况也不是绝对的,二者是相关关系.
答案:D
2.已知x,y之间的一组数据如下:
x
0
1
2
3
4
5
y
1
3
5
5
7
9
则y关于x的回归直线必经过点( )
A.(2,2) B.(1,3)
C.(2.5,5) D.(4,6)
解析:因为==2.5,==5,所以y关于x的回归直线必经过样本点的中心(2.5,5).故选C.
答案:C
3.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:由y=0.254x+0.321知,当x增加1万元时,年饮食支出y增加0.254万元.
答案:0.254
授课提示:对应学生用书第16页
探究一 变量之间的相关关系的判断
[典例1] 下面是随机抽取的9位15岁男生的身高、体重表:
编号
1
2
3
4
5
6
7
8
9
身高/cm
165
157
155
175
168
157
178
160
163
体重/kg
52
44
45
55
54
47
62
50
53
判断所给的两个变量是否存在相关关系.
[解析] 法一:根据经验可知,人的身高和体重之间存在相关关系.
法二:观察表格数据可知,人的体重随着身高的增高而增加,因此人的身高和体重之间存在相关关系.
法三:以x轴表示身高,以y轴表示体重,得到相应的散点图如图所示.
我们会发现,随着身高的增高,体重基本上呈增加的趋势.所以体重与身高之间存在相关关系.
两个变量x和y相关关系的确定方法
(1)散点图法:通过散点图,观察它们的分布是否存在一定规律,直观地判断.
(2)如果发现点的分布从整体上看大致在一条线附近,那么这两个变量就是线性相关的,注意不要受个别点的位置的影响.
1.某化妆品公司2013~2018年的年利润x(单位:百万元)与年广告支出y(单位:百万元)的统计资料如下表所示:
年份
2013
2014
2015
2016
2017
2018
利润x
12.2
14.6
16.2
18.4
20.4
22.3
支出y
0.62
0.74
0.81
0.89
1.00
1.11
根据统计资料,可知( )
A.利润的中位数是16.2,x与y有正相关关系
B.利润的中位数是17.3,x与y有正相关关系
C.利润的中位数是17.3,x与y有负相关关系
D.利润的中位数是18.4,x与y有负相关关系
解析:年利润的6个数据的中间两个为16.2,18.4,则中位数为17.3;又x增加时,y也随之增加,因此x与y成正相关.故选B.
答案:B
探究二 求线性回归方程
[典例2] 关于人体的脂肪含量(百分比)和年龄关系的研究中,得到如下一组数:
年龄x
23
27
39
41
45
49
50
53
脂肪y
9.5
17.8
21.2
25.9
27.5
26.3
28.2
29.6
(1)判断它们是否有相关关系,若有相关关系,请作一条拟合直线;
(2)用最小二乘法求出年龄关于脂肪的线性回归方程.
[解析] (1)以x轴表示年龄,y轴表示脂肪含量(百分比)画出散点图,如图.
进一步观察,发现上图中的点分布在一条直线附近,这说明这一正相关可以用这一直线来逼近,根据图中分析,人体的脂肪含量(百分比)和年龄具有相关关系.
(2)设回归直线为y=bx+a,
那么结合题中数据,可得
=40.875,=23.25,
xiyi=8 092.8,x=14 195,
则b=,
=≈0.591 2,
a=-b=23.25-0.591 2×40.875=-0.915 3,
所以所求的线性回归方程是y=0.591 2x-0.915 3.
(1)最小二乘法的适用条件:两个变量必须具有线性相关性,若题目没有说明相关性,必须对两个变量进行相关性检验.
(2)注意事项:
①利用求回归方程的步骤求线性回归方程的方法实质是一种待定系数法.
②计算a,b的值时,用列表法理清计算思路,减少计算失误.同时,计算时,尽量使用计算机或科学计算器.
2.某研究机构对中学生记忆能力x和识图能力y进行统计分析,得到如下数据:
记忆能力x
4
6
8
10
识图能力y
3
*
6
8
由于某些原因,识图能力的一个数据丢失,但已知识图能力样本的平均值是5.5.
(1)经过分析,知道记忆能力x和识图能力y之间具有线性相关关系,请用最小二乘法求出y关于x的线性回归方程y=bx+a;
(2)已知某一学生记忆能力值为12,请预测他的识图能力值.
解析:(1)设丢失的数据为m,依题意,得=5.5,解得m=5,即丢失的数据值是5.
由表中的数据,得==7,=5.5,
xiyi=4×3+6×5+8×6+10×8=170,
x=42+62+82+102=216,
b===0.8,
a=-b=5.5-0.8×7=-0.1,
所以所求线性回归方程为y=0.8x-0.1.
(2)由(1),得当x=12时,y=0.8×12-0.1=9.5,
即预测他的识图能力值是9.5.
探究三 线性回归方程的应用
[典例3] 某5名学生的总成绩和数学成绩(单位:分)如下表所示:
学生
A
B
C
D
E
总成绩(x)
482
383
421
364
362
数学成绩(y)
78
65
71
64
61
(1)作出散点图;
(2)求数学成绩y对总成绩x的线性回归方程;
(3)如果一个学生的总成绩为450分,试预测这个学生的数学成绩.
[解析] (1)散点图如图所示:
(2)列表如下:
i
1
2
3
4
5
xi
482
383
421
364
362
yi
78
65
71
64
61
xiyi
37 596
24 895
29 891
23 296
22 082
=,=,
x=819 794,xiyi=137 760.
b=
=≈0.132,
a=-b≈-0.132×≈14.683.
所以线性回归方程为y=0.132x+14.683.
(3)当x=450时,y≈74,
即当一个学生的总成绩为450分时,他的数学成绩约为74分.
回归方程的应用体现在以下几个方面:
(1)描述两变量之间的依赖关系:利用线性回归方程可定量地描述两个变量间的依赖关系.
(2)利用回归方程可以进行预测,把预报因子(相当于随机变量x)代入回归方程对预报量(相当于因变量y)进行估计,即可得到个体y值的允许区间.
(3)利用回归方程进行统计控制,规定y值的变化,通过控制x的范围来实现统计控制的目标.
3.下表是某地收集到的新房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:
x
115
110
80
135
105
y
44.8
41.6
38.4
49.2
42
(1)画出散点图;
(2)求线性回归方程;
(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.
解析:(1)散点图如图所示.
(2)由散点图可以看出,这些点大致分布在一条直线的附近,可求线性回归方程.由表中的数据,得=109,=43.2,x=60 975,xiyi=23 852.
则b===≈0.196,
a=-b≈43.2-0.196×109=21.836.
故所求线性回归方程为y=0.196x+21.836.
(3)根据上面求得的回归方程知,当房屋面积为150 m2时,销售价格的估计值为0.196×150+21.836=51.236(万元).
利用线性回归方程对总体进行预测
[典例] (本题满分12分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
[规范解答] (1)散点图,如图所示.①
………………………………………………………………………………………2分
(2)由题意,得xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
==4.5,==3.5,
x=32+42+52+62=86,………………………………………………………6分
所以b===0.7,②
………………………………………………………………………………………8分
a=-b=3.5-0.7×4.5=0.35,…………………………………………………9分
故线性回归方程为y=0.7x+0.35. ………………………………………………10分
(3)根据回归方程预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35,………………………………………………………………………11分
故耗能约降低了90-70.35=19.65(吨标准煤).③
……………………………………………………………………………………12分
[规范与警示] ①处散点图的画法中,纵、横坐标的刻度选取要适当.
②处计算量较大易出错,失分点.
③处由回归方程计算的该值只是一个预测值,是实际问题的一个估计值,因此最后应进行回答.
用线性回归方程预测的一般步骤为:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求a、b并写出线性回归方程;(3)根据线性回归方程对总体进行预测.
[随堂训练] 对应学生用书第18页
1.根据如下样本数据
x
3
4
5
6
7
8
y
4.0
2.5
-0.5
0.5
-2.0
-3.0
得到的回归方程为y=bx+a,则( )
A.a>0,b>0 B.a>0,b<0
C.a<0,b>0 D.a<0,b<0
解析:画出散点图,知a>0,b<0.
答案:B
2.下图各选项中的两个变量具有相关关系的是( )
解析:选项A、C中变量x与变量y之间是确定的函数关系,选项D中,点不在某条直线附近波动,因此两变量非线性相关,而点也不在某条曲线附近波动,故两变量不具有相关关系.选项B中所有点都在某条直线附近波动,故选B.
答案:B
3.已知高三学生高考成绩y(单位:分)与高三期间有效复习时间x(单位:天)正相关,且回归直线方程是y=3x+50.若期望甲同学高考成绩不低于500分,那么他的有效复习时间应不低于________天.
解析:由3x+50≥500,得x≥150.
答案:150
4.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
60
50
70
(1)画出散点图;
(2)如果x与y具有线性相关关系,求线性回归方程,并说明b的意义.
解析:(1)散点图如图所示.
(2)由散点图知x与y具有线性相关关系.
=5,=50,xiyi=1 380,x=145,
所以b===6.5,
a=-b=50-6.5×5=17.5.
所求线性回归方程为y=6.5x+17.5.
b表示广告费每增加100万元,销售额平均增加650万元.
展开阅读全文