资源描述
铸就梦想,提高成绩,改变人生的高端教育机构
18、统计
18.4 线性回归方程及应用
【知识网络】
1. 能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
2. 了解线性回归的方法;了解用最小二乘法研究两个变量的线性相关问题的思想方法;会根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式)。
【典型例题】
[例1](1)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1、l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值为s与t,那么下列说法正确的是
( )
A.直线l1和l2一定有公共点(s,t) B.直线l1和l2相交,但交点不一定是(s,t)
C.必有直线l1∥l2 D.直线l1和l2必定重合
(2)工人工资(元)依劳动生产率(千元)变化的回归方程为=50+80x,下列判断正确的是 ( )
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资提高80元
C.劳动生产率提高1000元时,工资提高130元
D.当月工资250元时,劳动生产率为2000元
(3)下列命题:
①任何两个变量都具有相关关系;
②圆的周长与该圆的半径具有相关关系;
③某商品的需求与该商品的价格是一种非确定性关系;
④根据散点图求得的回归直线方程可能是没有意义的;
⑤两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究。
其中正确的命题为 ( )
A.①③④ B。②④⑤ C。③④⑤ D。②③⑤
(4)一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是___________。
825
215
1070
550
480
920
1350
325
670
1215
3.5
1.0
4.0
2.0
1.0
3.0
4.5
1.5
3.0
5.0
(5)上题中,若该公司预计下周签发新保单1000张,则需要加班的时间是 。
[例2] 已知10只狗的血球体积及红血球的测量值如下:
x
45
42
46
48
42
35
58
40
39
50
y
6.53
6.30
9.25
7.50
6.99
5.90
9.49
6.20
6.55
7.72
其中x(血球体积,mm),y(血红球数,百万).
①画出上表的散点图;
②求出回归直线并且画出图形。
[例3]要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表):
学生编号
1
2
3
4
5
6
7
8
9
10
入学成绩x
63
67
45
88
81
71
52
99
58
76
高一期末
成绩y
65
78
52
82
92
89
73
98
56
75
(1)计算入学成绩(x)与高一期末考试成绩(y)的相关关系;
(2)若某学生入学数学成绩80分,试估计他高一期末数学考试成绩.
[例4]下表是采集的商品零售额(万元)与商品流通费率的一组数据:
商品零售额
9.5
11.5
13.5
15.5
17.5
19.5
21.5
23.5
25.5
27.5
商品流通费率
6.0
4.6
4.0
3.2
2.8
2.5
2.4
2.3
2.2
2.1
(1)将商品零售额作为横坐标,商品流通费率作为纵坐标,在平面直角坐标系内作出散点图;
(2)商品零售额与商品流通费率具有线性相关关系吗?如果商品零售额是20万元,那么能否预测此时流通费率是多少呢?
【课内练习】
1. 下列两个变量之间的关系哪个不是函数关系 ( )
A.角度和它的余弦值 B。正方形边长和面积
C.正n边形的边数和它的内角和 D。人的年龄和身高
2. 下列变量之间的关系是函数关系的是 ( )
A.已知二次函数,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式
B.光照时间和果树的亩产量
C.降雪量和交通事故发生率
D.每亩用肥料量和粮食亩产量
3. 下列命题叙述正确的是 ( )
A.任何两个变量都可以用一元线性回归关系进行合理的描述
B.只能采用最小二乘法对一元线性回归模型进行参数估计
C.对于一个样本,用最小二乘法估计得到的一元线性回归方程参数估计值是唯一的
D.任何两个相关关系的变量经过变换后都可以化为一元线性回归关系
4. 设线性回归直线方程,现将y的单位由cm变为m,x的单位由ms变为s,则在新的线性回归直线方程中, ( )
A. B. C. D.
5. 若施肥量x与水稻产量y的线性回归直线方程,当施肥量为80Kg时,预计水稻产量为___________.
6. 某保险公司收集了10周中工作的加班时间y与签订新保单数目x,用最小二乘法求出线性回归方程为.若公司预签订新保单1000张,估计需加班 _________小时.
7. 如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作为x轴的变量应为 。
8. 给出施化肥量对水稻产量影响的试验数据:
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
试求出回归直线方程
9.在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
5
10
15
20
30
40
50
60
70
90
120
6
10
10
13
16
17
19
23
25
29
467
求腐蚀深度y对腐蚀时间x的回归直线方程,并解释回归系数的意义.
10.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病的人数如下表所示:
年份
该年新发病的人数
1996年
2400
1997年
2491
1998年
2586
1999年
2684
如果不加控制,仍按这个趋势发展下去,请预测从2000年初到2003年底的四年里,该地区这种病的新发病人数总共多少?
18、统计
18.4 线性回归方程及应用
A组
1. 设有一个直线回归方程为 ,则变量x 增加一个单位时 ( )
A.y 平均增加 2个单位 B。y 平均增加 3 个单位
C.y 平均减少 2 个单位 D。y 平均减少 3个单位
2. 回归直线方程的系数a,b的最小二乘法估计使函数Q(a,b)最小,Q函数指 ( )
A. B。
C. D。
3. 对于给定的两个变量的统计数据,下列说法正确的是 ( )
A.都可以分析出两个变量的关系
B.都可以用一条直线近似表示两者关系来估计总体的均值
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
4. 某种机器购置后运营年限x与当年增加利润y的统计分析知具备线性相关关系,回归方种为,估计这种机器使用 年最合算。
5. 给出下列关系:
①正方体的体积与棱长
②角的度数和它的正弦值
③单产为常数时,土地面积和总产量
④日照时间与棉花亩产量
⑤体重与身高
其中属于函数关系的有 。
速度(转/秒)
每小时生产有问题物件数
8
5
12
8
14
9
16
11
6. 一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,左面表格中的数据是几次试验的结果.那么当速度为10(转/秒)时,是否可以预知每小时生产有问题物件数呢?若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?
7. 假设儿子身长与父亲身长适合一元线性回归模型,观察了10对英国父子身长(英寸)如下:
父亲身长()
60
62
64
65
66
67
68
70
72
74
儿子身长()
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
试建立关于的回归方程.
8. 我们知道营业税税收总额y与社会消费品零售总额x有关.为能从社会消费品零售总额去预测营业税税收总额,需要了解两者的关系.现收集如下11组全国相关数据(单位:亿元)
年份
社会消费品零售总额x
社会消费品零售总额x
1994
16264.7
680.2
1995
20620.0
869.4
1996
24774.1
1065.4
1997
27298.9
1353.4
1998
29152.5
1608.0
1999
31134.7
1696.5
2000
34152.6
1885.7
2001
37595.2
2084.7
2002
42027.1
2467.6
2003
47602.1
2868.9
2004
53950.1
3583.5
(1)画出营业税税收总额y与社会消费品零售总额x间散点图;
(2用最小二乘法求营业税税收总额y与社会消费品零售总额x之间线性回归直线方程.
(3)试估计2005年社会消费品零售总额增长在12%~14%,营业税税收总额y大致会增长多少?
18、统计
18.4 线性回归方程及应用
B组
1. 回归直线方程的系数a,b的最小二乘法估计使函数Q(a,b)最小,则下列正确答案是 ( )
A. B。
C. D。
2. 两个变量成负相关关系时,散点图的特征是 ( )
A.点散布特征为从左下角到右上角区域
B.点散布在某带形区域内
C.点散布在某圆形区域内
D.点散布特征为从左上角到右下角区域内
3. 某考察团对全国10大声调进行职工人均平均工资x与居民人均消费y进行统计调查,y与x具有相关关系,回归方程为(单位:千元)。若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为 ( )
A.66% B。72.3% C。67.3% D。83%
4. 下列关系中:
①吸烟有害健康
②粮食产量与施肥量
③乌鸦叫,没好兆
④名师出高徒
不具有相关关系的是 。
5. 现有一个身高预测体重的回归方程;体重预测值=4(磅/英寸)Í身高-130磅.期中体重和身高分别以磅和英寸为单位。如果将它们分别以kg、cm的单位(1英寸≈2.5cm,1磅≈0.45kg) .回归方程应该是____________________________________.
6. 一个工厂在某年某月产品的总成本y(万元)与该月产量(万件)之间有如下数据:
X
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
Y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
(1)画出散点图;
(2)最小二乘法求月产品的总成本y(万元)与该月产量x(万件)之间线性回归直线方程.
7. 试证明:①;
②。
8. 下栏的表格是某省20个县城2007年的一份统计资料,其中表示第个县城在2007年建成的新住宅面积(单位:103m2),表示第个县城在2007年的家具销售量(万元) 。
县城编号
县城编号
1
2
3
4
5
6
7
8
9
10
121
118
271
190
75
263
334
368
305
210
360
260
440
400
360
500
580
560
505
480
11
12
13
14
15
16
17
18
19
20
387
270
218
342
173
370
170
205
339
283
602
540
414
590
492
660
360
410
680
594
若此县城在2008年预计新建成的住宅面积为350×103m2,则可以大体估计出此县城当年可销售家具多少万元?
参考答案
18.4 线性回归方程及应用
【典型例题】
[例1](1)A.提示:线性回归直线方程为=a+bx,而a=,即a=t-bs,t=a+bs.∴(s,t)在回归直线上,即直线l1和l2必有公共点(s,t)。
(2)B.提示:回归直线斜率为80,所以x每增加1,增加80,即劳动生产率提高1千元时,工资提高80元。
(3)C.
(4)。提示:,。
(5)3.7小时。提示:将x=1000代入上面公式即可。
[例2]①
②,
,,所以所求回归直线的方程为 .图形如下:
[例3](1)从入学成绩(x)与高一期末考试成绩(y)两组变量的散点图看,这两组变量尚具有线性关系.
通过计算知, ,所以,因此所求的线性回归方程是=22.410 67+0.765 56x;
(2)若某学生入学数学成绩为分,代入上式可求得,分,即这个学生高一期末数学成绩预测值为分.
2
3
4
5
6
7
9
15
21
27
零售额
流通费率
[例4] (1)散点图如图所示.
(2)散点图显示出商品流通费率和商品零售额的变化关系并不是直线型,而是一条递减的双曲线型.两者之间不具有线性相关关系.
但经济理论和实际经验都可说明,流通费率决定于商品零售额,体现着经营的规模效益,因此可以拟合一个以商品销售额为自变量(X),流通费率为因变量(Y)的双曲线回归模型:,为了求模型中的a和b两个参数,令,是上述模型转换为线性模型:,这样我们就可以运用线性回归的知识加以解决了.
将转化后的有关数据列表如下:
商品零售额X(万元)
商品流通费率Y
9.5
6.0
0.105
11.5
4.6
0.087
13.5
4.0
0.074
15.5
3.2
0.065
17.5
2.8
0.057
19.5
2.5
0.051
21.5
2.4
0.047
23.5
2.3
0.043
25.5
2.2
0.039
27.5
2.1
0.036
合计
32.1
0.604
代入公式得:,从而线性回归方程为.将回代得.
于是当X=20(万元)时,(%).
【课内练习】
1. D。
2. A。提示:依据函数的定义即可。
3. C。提示:只要样本数据确定,那么所求的参数就是唯一的。
4. D。
5. 5. 650Kg.
6. 3.73.
7. 播放次数。
8. 表中的数据进行具体计算,列成以下表格
i
1
2
3
4
5
6
7
xi
15
20
25
30
35
40
45
yi
330
345
365
405
445
450
455
xiyi
4950
6900
9125
12150
15575
18000
20475
,
故可得到
从而得回归直线方程是.
9.由表中数据经计算可得,由线性回归公式得:,故y对x的回归直线方程为。
回归系数b=0.304的意义是:腐蚀时间x每增加一个单位,深度y平均增加0.304个单位.
10.思路一、从新发病的增长率入手
1996年到1997年新发病的增长率为 (2491-2400)/2400≈3.792%;
1997年到1998年新发病的增长率为 (2586-2491)/2491≈3.814%;
1998年到1999年新发病的增长率为 (2684-2586)/2586≈3.790%.
由此可见,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预测,即2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4,不难算得约等于11795(人).
思路二、从数据处理来考察
因为2491/2400≈1.038、2586/2491≈1.038、2684/2586≈1.038,可见连续两年新发病人数的比值近似于一个常数1.038,以此作为以后的预测,即
2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4≈11795(人).
思路三、利用回归分析
x轴上表示年份,y轴上表示新发病的人数,将表格中的四组数据描点(图略).观察这些点的位置,它们的分布大致在一条直线附近,所以尝试用直线进行拟合.
设回归直线方程为,则由相关数据计算得:,,,,
所以回归直线方程为,从而
(人),即为所求.
18、统计
18.4 线性回归方程及应用
A组
1. C。
2. A。
3. C。
4. 8。
5. ①②③。
6. 用x表示机器速度,y表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则.于是回归直线的斜率为,,所以所求的回归直线方程为。根据公式,要使,则就需要,,即机器的旋转速度不能超过转/秒.
7. 。
8. 营业税税收总额y与社会消费品零售总额x间散点图
(2) 利用计算器可以计算算出:
于是.
所以所求的线性回归直线方程是。
(3)社会消费品零售总额增长在12%~14%,即社会消费品零售总额在60424~61503,估计2005年营业税税收总额大致在3992~4005亿元,增长9.5%~11.8%。
B组
1. A。
2. D。
3. D。
4. ③
5. 体重预测值=0.72(kg/cm)Í身高-58.5kg。
6. 画出散点图:
利用计算器,可以计算得:
于是。
所以所求的线性回归直线方程是。
7. ①。
②
。
·
100
200
300
400
300
400
500
600
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
·
x
y
8. 首先以横坐标表示新建成的住宅面积,纵坐标表示对应县城的家具销售量,作散点图。散点图如下:
由于家具销售量与新住宅落成的面积间呈现出明显的线性趋势,所以我们可以用回归直线去描述它 .由已知数据可以算出:
,,
所以,,因此即为所求回归直线。
故当此县城在2008年预计新建成的住宅面积为350×103m2,则可以大体估计出此县城当年可销售家具万元。
展开阅读全文