资源描述
第2讲 变量间的相关关系与统计案例
一、选择题
1.有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成果;
③某人每日吸烟量和身体健康状况;
④圆的半径与面积;
⑤汽车的重量和每千米耗油量.
其中两个变量成正相关的是( )
A.①③ B.②④ C.②⑤ D.④⑤
解析 由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,故选C.
答案 C
2.已知x,y取值如下表:
x
0
1
4
5
6
8
y
1.3
1.8
5.6
6.1
7.4
9.3
从所得的散点图分析可知:y与x线性相关,且=0.95x+a,则a=( ).
A.1.30 B.1.45 C.1.65 D.1.80
解析 依题意得,=×(0+1+4+5+6+8)=4,=×(1.3+1.8+5.6+6.1+7.4+9.3)=5.25.又直线=0.95x+a必过样本中心点(,),即点(4,5.25),于是有5.25=0.95×4+a,由此解得a=1.45,选B.
答案 B
3.在争辩吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ).
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这人有99%的概率患有肺癌
C.在100个吸烟者中确定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
解析 统计的结果只是说明大事发生可能性的大小,具体到一个个体不愿定发生.
答案 D
4.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
依据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为 ( ).
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析 ==3.5(万元),
==42(万元),
∴=-=42-9.4×3.5=9.1,
∴回归方程为=9.4x+9.1,
∴当x=6(万元)时,=9.4×6+9.1=65.5(万元).
答案 B
5.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
父亲身高x/cm
174
176
176
176
178
儿子身高y/cm
175
175
176
177
177
则y对x的线性回归方程为 ( ).
A.y=x-1 B.y=x+1
C.y=88+x D.y=176
解析 由题意得==176(cm),
==176(cm),由于(,)确定满足线性回归方程,阅历证知选C.
答案 C
6.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=bx+a,则“(x0,y0)满足线性回归方程=bx+a”是“x0=,y0=”的( ).
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
解析 x0,y0为这10组数据的平均值,又由于线性回归方程=bx+a必过样本中心(,),因此(,)确定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点.
答案 B
二、填空题
7.已知施化肥量x与水稻产量y的试验数据如下表,则变量x与变量y是________相关(填“正”或“负”).
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
解析 由于散点图能直观地反映两个变量是否具有相关关系,所以画出散点图如图所示:
通过观看图象可知变量x与变量y是正相关.
答案 正
8.考古学家通过始祖鸟化石标本发觉:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为=1.197x-3.660,由此估量,当股骨长度为50 cm时,肱骨长度的估量值为________ cm.
解析 依据线性回归方程=1.197x-3.660,将x=50代入得y=56.19,则肱骨长度的估量值为56.19 cm.
答案 56.19
9.某医疗争辩所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析 K2≈3.918>3.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.
答案 ①
10.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法猜想他孙子的身高为________ cm.
解析 由题意父亲身高x cm与儿子身高y cm对应关系如下表:
x
173
170
176
y
170
176
182
则==173,==176,
(xi-)(yi-)=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)(182-176)=18,
(xi-)2=(173-173)2+(170-173)2+(176-173)2=18.∴==1.∴=- =176-173=3.
∴线性回归直线方程=x+=x+3.
∴可估量孙子身高为182+3=185(cm).
答案 185
三、解答题
7.某班主任对全班50名同学进行了作业量多少的调查.数据如下表:
认为作业多
认为作业不多
合计
宠爱玩玩耍
18
9
不宠爱玩玩耍
8
15
合计
(1)请完善上表中所缺的有关数据;
(2)试通过计算说明在犯错误的概率不超过多少的前提下认为宠爱玩玩耍与作业量的多少有关系?
附:
P(K2≥k0)
0.05
0.025
0.010
0.005
0.001
k0
3.841
5.024
6.635
7.879
10.828
K2=
解 (1)
认为作业多
认为作业不多
合计
宠爱玩玩耍
18
9
27
不宠爱玩玩耍
8
15
23
合计
26
24
50
(2)将表中的数据代入公式K2=得到K2的观测值k=≈5.059>5.024,
查表知P(K2≥5.024)=0.025,即说明在犯错误的概率不超过0.025的前提下认为宠爱玩玩耍与作业量的多少有关系.
8.下表供应了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对比数据.
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
(2)请依据上表供应的数据,用最小二乘法求出y关于x的线性回归方程=x+;
(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤.试依据(2)求出的线性回归方程,猜想生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
解 (1)由题设所给数据,可得散点图如图所示.
(2)由对比数据,计算得:=86,
==4.5(吨),==3.5(吨).
已知iyi=66.5,
所以,由最小二乘法确定的回归方程的系数为:
===0.7,
=-=3.5-0.7×4.5=0.35.
因此,所求的线性回归方程为=0.7x+0.35.
(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:
90-(0.7×100+0.35)=19.65(吨标准煤).
5.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析争辩,他们分别记录了12月1日至12月5日的每天昼夜温差与试验室每天每100颗种子中的发芽数,得到如下资料:
日期
12月1日
12月2日
12月3日
12月4日
12月5日
温差x/℃
10
11
13
12
8
发芽数y/颗
23
25
30
26
16
该农科所确定的争辩方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请依据12月2日至12月4日的数据,求出y关于x的线性回归方程=x+.
解 (1)设抽到不相邻两组数据为大事A,由于从5组数据中选取2组数据共有10种状况,每种状况都是等可能毁灭的,其中抽到相邻两组数据的状况有4种,所以P(A)=1-=.
(2)由数据,求得=12,=27.
11×25+13×30+12×26=977,112+132+122=434,
由公式,求得=,=- =-3.
所以y关于x的线性回归方程为=x-3.
6.有甲、乙两个班级进行数学考试,依据大于等于85分为优秀,85分以下为非优秀统计成果后,得到如下的列联表.
优秀
非优秀
总计
甲班
10
乙班
30
合计105
已知从全部105人中随机抽取1人为优秀的概率为.
(1)请完成上面的列联表;
(2)依据列联表的数据,若按95%的牢靠性要求,能否认为“成果与班级有关系”;
(3)若按下面的方法从甲班优秀的同学中抽取一人:把甲班优秀的10名同学从2到11进行编号,先后两次抛掷一枚均匀的骰子,毁灭的点数之和为被抽取人的序号.试求抽到6号或10号的概率.
附 K2=,
P(K2≥k)
0.05
0.01
k
3.841
6.635
解 (1)
优秀
非优秀
总计
甲班
10
45
55
乙班
20
30
50
合计
30
75
105
(2)依据列联表中的数据,得到
k=≈6.109>3.841,
因此有95%的把握认为“成果与班级有关系”.
(3)设“抽到6号或10号”为大事A,先后两次抛掷一枚均匀的骰子,毁灭的点数为(x,y),则全部的基本大事有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.
大事A包含的基本大事有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,
∴P(A)==.
展开阅读全文