资源描述
高三数学第一轮复习:统计(二)(理)人教实验版(B)
【本讲教育信息】
一. 教学内容:
高三复习专题:统计(二)
二. 考纲要求
(1)变量的相关性
①会作两个有关联变量数据的散点图,会利用散点图认识变量间的相关关系.
②了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.
(2)统计案例:了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.
①独立检验:了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.
②回归分析:了解回归的基本思想、方法及其简单应用.
三. 知识分析
【知识梳理】
(一)变量的相关性
1、变量与变量之间的关系常见的有两类:一类是确定的函数关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.
2、如果一个变量的值由小变大,另一个变量的值也由小变大,这种相关称为正相关,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关。
3、在平面直角坐标系中,用描点的方法得到具有相关关系的两个变量的图形叫散点图.
4、回归直线方程,其中。
(二)统计案例
1、当时,有95%的把握说事件A与B有关;
当时,有99%的把握说事件A与B有关;
当时,认为事件A与B是无关的。
2、,其中,则直线就成为此直线的线性回归方程,其中分别为a,b的估计值。
3、相关系数,用它来衡量两个变量之间的线性相关程度。
r具有如下性质:
(1);
(2)越接近于1,的线性相关程度越强;
(3)越接近于0,的线性相关程度越弱.
对r进行显著性检验的步骤:
(1)提出统计假设:变量x,y不具有线性相关关系;
(2)如果有95%的把握作出推断,那么可以根据1-0.95 = 0.05与n-2在《数学2-3(选修)》附录2中查出一个r的临界值(其中1-0.95=0.05称为检验水平);
(3)计算样本相关系数r;
(4)作出统计推断:若,则否定,表明有95%的把握认为x与y之间具有线性相关关系;若,则没有理由拒绝原来的假设,即就自前数据而言,没有充分理由认为y与x之间有线性相关关系.
【要点解析】
(一)变量的相关性
1、对相关关系的理解应当注意以下两点:
(1)相关关系是非随机变量与随机变量之间的关系.而函数关系可以看成是两个非随机变量之间的关系.因此,不能把相关关系等同于函数关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.例如,有人发现,对于在校儿童,鞋的大小与阅读能力有很强的相关关系.然而,学会新词并不能使脚变大,而是涉及到第三个因素――年龄.当儿童长大一些,他们的阅读能力会提高,而且由于长大,脚也变大.
2、在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.
3、求线性回归方程的关键是求回归系数a和b,其中回归系数b可借助于计算器完成,因为,即,所以点()一定满足线性回归方程,即回归直线一定过点().
4、求线性回归方程的步骤
(1)先把数据制成表,从表中计算出,,的值:
(2)计算回归系数;
(3)写出线性回归方程。
(二)统计案例
1、分析两个变量相关关系的常用方法
(1)利用散点图进行判断:把样本数据表示的点在平面直角坐标系中作出,从而得到散点图,如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系.
(2)利用相关系数r来判断:而且越接近于1,相关程度越大;越接近于0,相关程度越小.
2、对具有相关关系的两个变量进行统计分析时,首先进行相关性检验,在确认具有线性相关关系后,再求回归直线方程.
3、独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)根据公式,计算的值
(3)比较与临界值的大小关系作统计推断.
【典型例题】
例1. 下列关系中,带有随机性相关关系的是( )
①正方形的边长与面积之间的关系;
②水稻产量与施肥之间的关系;
③人的身高与年龄之间的关系;
④降雪量与交通事故的发生率之间的关系.
解析:两变量之间的关系有两种:函数关系与带有随机性的相关关系.
①正方形的边长与面积之间的关系是函数关系.
②水稻产量与施肥之间不是严格的函数关系,但是具有相关性,因而是相关关系.
③人的身高与年龄之间的关系既不是函数关系,也不是相关关系,因为人的年龄达到一定时期身高就不发生明显变化了,因而它们不具有相关关系.
④降雪量与交通事故的发生率之间具有相关关系.
答案:②④
例2. 假设关于某设备的使用年限x和所支出的维修费用y(万元)有如下的统计资料:
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知y对x呈线性相关关系。
试求:(1)线性回归方程的回归系数;
(2)估计使用年限为10年时,维修费用是多少?
解析:(1)制表如下:
1
2
3
4
5
合计
2
3
4
5
6
20
2.2
3.8
5.5
6.5
7.0
25
4.4
11.4
22.0
32.5
42.0
112.3
4
9
16
25
36
90
;
于是有;
。
(2)回归直线方程为,
当年时,
(万元)。
即估计使用10年时,维修费用是12.38万元。
例3. 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
x(s)
5
10
15
20
30
40
50
60
70
90
120
y()
6
10
10
13
16
17
19
23
25
29
46
(1)画出表中数据的散点图;
(2)求y对x的回归直线方程;
(3)试预测腐蚀时间为100s时腐蚀深度是多少?
分析:(1)将表中的各对数据在平面直角坐标系中描点,便得到具有相关关系的两个变量的一组数据的图形,即得散点图;(2)按求线性回归方程的步骤和公式,写出线性回归方程;(3)利用回归方程分析。
解析:(1)散点图如图:
(2)根据公式求腐蚀深度y对腐蚀时间x的回归直线方程的步骤如下:
先把数据列成表:
1
5
6
25
36
30
2
10
10
100
100
100
3
15
10
225
100
150
4
20
13
400
169
260
5
30
16
900
256
480
6
40
17
1600
289
680
7
50
19
2500
361
950
8
60
23
3600
529
1380
9
70
25
4900
625
1750
10
90
29
8100
841
2610
11
120
46
14400
2116
5520
合计
510
214
36750
5422
13910
计算的值。
由上表分别计算平均数得,
代入公式
得(注意:不必把化为小数,以减小误差。)
写出回归直线方程。
腐蚀深度y对腐蚀时间x的回归直线方程为
,
这里的回归系数,它的意义是:腐蚀时间x每增加一个单位(s),深度y增加0.304个单位()。
(3)根据上面求得的回归直线方程,当腐蚀时间为100s时,,
即腐蚀深度大约是。
例4. 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:
又发作过心脏病
未发作心脏病
合计
心脏搭桥手术
39
157
196
血管清障手术
29
167
196
合计
68
324
392
试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。
解析:假设做过心脏搭桥手术与又发作心脏病没有关系。
由于,
,
由公式可得的观测值为
因为,
例5. 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验.测得的数据如下:
(1)y与x是否具有相关关系?
(2)如果y与x具有相关关系,求回归直线方程。
(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?
解析:(1)列出下表
1
2
3
4
5
6
7
8
9
10
10
20
30
40
50
60
70
80
90
100
62
68
75
81
89
95
102
108
115
122
620
1360
2250
3240
4450
5700
7140
8640
10350
12200
,
由于,因此x与y之间有很强的线性相关关系,因而可求回归直线方程。
(2)设所求的回归直线方程为,
则有,
,
【模拟试题】
1. 为了考察两个变量x和y之间的线性相关性,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为、,已知两人所得的试验数据中,变量x和y的数据的平均值都相等,且分别都是。那么下列说法正确的是( )
A. 直线和一定有公共点()
B. 直线和相交,但交点不一定是
C. 必有
D. 必定重合
2. 由一组样本数据得到的回归直线方程为,那么下面说法不正确的是( )
A. 直线一定过点
B. 直线至少经过点中的一点
C. 直线的斜率为
D. 直线和各点的偏差是该坐标平面上所有直线与这些点的偏差中最小的直线
3. 在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是( )
A. 100个吸烟者中至少有99人患有肺癌
B. 1个人吸烟,那么这个人有99 % 的概率患有肺癌
C. 在100个吸烟者中一定有患肺癌的人
D. 在100个吸烟者中可能一个患肺癌的人也没有
4. 经过对的统计量的研究,得到了若干个临界值,当≤2. 706时,我们认为事件A与B( )
A. 有95%的把握认为A与B有关
B. 有99%的把握认为A与B有关系
C. 没有充分理由说明事件A与B有关系
D. 不能确定
5. 考察黄烟经过培养液处理与否跟发生青花病的关系。调查了457株黄烟,得到下表中数据。
培养液处理
未处理
合计
青花病
25
210
235
无青花病
80
142
222
合计
105
352
457
根据表中数据可知( )
A. 40.682 B. 31.64 C. 45.331 D. 41.61
6. 在研究某种新药对鸡瘟的防治效果问题时,得到了以下数据:
活鸡数
死亡数
合计
新措施
132
18
150
对照
115
35
150
合计
247
53
300
以下结论正确的是( )
A. 我们有95%的把握认为新措施防治鸡瘟有效
B. 我们没有充足的理由认为新措施防治鸡瘟有效
C. 我们有99%的把握认为新措施防治鸡瘟有效
D. 我们有95%的把握认为新措施防治鸡瘟无效
7. 观察两个相关变量的如下数据:
5
4
3
2
1
5
4.1
2.9
2.1
0.9
则两个变量间的回归直线方程为( )
A. B.
C. D.
8. 调查某医院某段时间内婴儿出生的时间与性别的关系,得出下面的数据表
A. 密切相关 B. 没有必然的关系
C. 有关系的概率为50% D. 有关系的概率为95%
9. 某地区某种病的发病人数呈上升趋势.统计近四年这种病的新发病人数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从2007年初到2010年底的四年时间里,该地区这种病的新发病人数约为 ____________。
年份()
该年新发病人数()
2003
2400
2004
2491
2005
2586
2006
2684
,
10. 下表是某地区的一种传染病与饮用水的调查表:
据表中数据我们可得出的统计分析推断是________。
11. 下面是两个变量的一组数据:
1
2
3
4
5
6
7
8
1
4
9
16
25
36
49
64
则x与y两个变量之间的回归直线方程为____________。
12. 每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度(单位:)之间的关系有如下数据:
150
160
170
180
190
200
210
220
230
240
250
260
56.9
58.3
61.6
64.6
68.1
71.3
74.1
77.4
80.2
82.6
86.4
89.7
(1)画出散点图;
(2)如果y与x之间具有线性相关关系,求回归直线方程;
(3)如果两种用量下的抗压强度相差12.5,则水泥用量相差多少?
13. 关于两个变量x和y的一组数据如下表所示:
21
23
25
27
29
32
35
7
11
21
24
66
115
325
试判断x与y之间是否有线性相关关系?
14. 假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料如下表所示。
使用年限x
2
3
4
5
6
维修费用y
2.2
3.8
5.5
6.5
7.0
若由资料知,y对x呈线性相关关系,试求:
(1)线性回归方程的回归系数、;
(2)求残差平方和;
(3)求相关指数;
(4)估计使用年限时,维修费用是多少?
【试题答案】
1. 解析:由线性回归方程得直线经过定点(x,y),故选A。
答案:A
2. 解析:回归直线方程的得出与此直线是否过中的点无关,故选B。
答案:B
3. 解析:本题主要考查对独立性检验的结果与实际问题的差异的理解,独立性检验的结论是一个数学统计量,它与实际问题中的问题的确定性是存在差异的。故选择D。
答案:D
4. 答案:C
5. 解析:根据公式。
答案:D
6. 解析:。
因为,所以有95%的把握认为新措施对防治鸡瘟有效。
答案:A
7. 解析:本题主要考查回归直线方程经过样本点的中心(),因此只需求即可。
答案:B
8. 解析:由公式得
。
因为,
所以婴儿的性别与出生时间没有关系。
答案:B
9. 答案:11676
10. 解析:由已知
。
由于,
说明该地区的传染病与饮用不干净水是有关的。
答案:该地区的传染病与饮用不干净水是有关的。
11. 解析:根据表中的数据,可以计算出有关数据,列成下表:
序号
1
1
1
1
1
2
2
4
4
8
3
3
9
9
27
4
4
16
16
64
5
5
25
25
125
6
6
36
36
216
7
7
49
49
343
8
8
64
64
512
36
204
204
1296
,
于是回归直线方程为。
答案:
12. 解析:(1)散点如图所示:
则,
。
所以所求的线性回归方程为。
(3)设两种水泥用量为,则对应抗压强度为
由题意,
所以。
即当两种水泥用量下的抗压强度相差12.5时,水泥用量相差41.12kg。
13. 解析:,
具有线性相关关系。
14. 解析:(1)由已知数据制成下表。
1
2
3
4
5
合计
2
3
4
5
6
20
2.2
3.8
5.5
6.5
7.0
25
4.4
11.4
22.0
32.5
42.0
112.3
4
9
16
25
36
90
;
于是有,
。
(2)由公式,
残差平方和为。
(3)
(4)回归直线方程为,当年时,(万元),
即估计使用10年时维修费用是12.38万元。
展开阅读全文