资源描述
变量间的相关关系、统计案例
一、选择题
1.有五组变量:
①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;
②平均日学习时间和平均学习成果;
③某人每日吸烟量和身体健康状况;
④圆的半径与面积;
⑤汽车的重量和每千米耗油量.
其中两个变量成正相关的是( )
A.①③ B.②④ C.②⑤ D.④⑤
解析 由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,
故选C.
答案 C
2.通过随机询问110名不同的高校生是否爱好某项运动,得到如下的列联表:
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由
附表:
0.050
0.010
0.001
3.841
6.635
10.828
参照附表,得到的正确结论是( )
A. 有99%以上的把握认为“爱好该项运动与性别有关”
B. 有99%以上的把握认为“爱好该项运动与性别无关”
C. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”
D. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”
解析 由,而,
故由独立性检验的意义可知选A.
答案 A
3.在争辩吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( ).
A.100个吸烟者中至少有99人患有肺癌
B.1个人吸烟,那么这人有99%的概率患有肺癌
C.在100个吸烟者中确定有患肺癌的人
D.在100个吸烟者中可能一个患肺癌的人也没有
解析 统计的结果只是说明大事发生可能性的大小,具体到一个个体不愿定发生.
答案 D
4.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是( ).
A.直线l过点(,)
B.x和y的相关系数为直线l的斜率
C.x和y的相关系数在0到1之间
D.当n为偶数时,分布在l两侧的样本点的个数确定相同
解析 由样本的中心(,)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不确定平均,即无论样本点个数是奇数还是偶数,故D错.
答案 A
5.某产品的广告费用x与销售额y的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
依据上表可得回归方程=x+中的为9.4,据此模型预报广告费用为6万元时销售额为( ).
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析 ==3.5(万元),
==42(万元),
∴=-=42-9.4×3.5=9.1,
∴回归方程为=9.4x+9.1,
∴当x=6(万元)时,=9.4×6+9.1=65.5(万元).
答案 B
6.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程=bx+a,则“(x0,y0)满足线性回归方程=bx+a”是“x0=,y0=”的( ).
A.充分不必要条件 B.必要不充分条件
C.充要条件 D.既不充分也不必要条件
解析 x0,y0为这10组数据的平均值,又由于线性回归方程=bx+a必过样本中心(,),因此(,)确定满足线性回归方程,但满足线性回归方程的除了(,)外,可能还有其他样本点.
答案 B
7.在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成果,稳居世界金牌榜榜首,由此很多人认为中国进入了世界体育强国之列,也有很多人持反对意见.有网友为此进行了调查,在参与调查的2 548名男性公民中有1 560名持反对意见,2 452名女性公民中有1 200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力
( ).
A.平均数与方差 B.回归直线方程
C.独立性检验 D.概率
解析 由于参与争辩的公民按性别被分成了两组,而且每一组又被分成了两种状况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,故用独立性检验最有说服力.
答案 C
二、填空题
8. 在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若全部样本点(xi,yi)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为________.
解析 依据样子相关系数的定义可知,当全部样本点都在直线上时,相关系数
为1.
答案 18
9.某医疗争辩所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析 K2≈3.918>3.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.
答案 ①
10.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析 由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.
答案 0.254
11.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对比表:
气温(℃)
18
13
10
-1
杯数
24
34
38
64
由表中数据算得线性回归方程=bx+a中的b≈-2,猜想当气温为-5 ℃时,热茶销售量为________杯(已知回归系数
解析 依据表格中的数据可求得=×(18+13+10-1)=10,=×(24+34+38+64)=40(杯).
∴a=-b=40-(-2)×10=60,
∴=-2x+60,当x=-5时,
=-2×(-5)+60=70(杯).
答案 70
12.某医疗争辩所为了了解某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.
①有95%的把握认为“这种血清能起到预防感冒的作用”;
②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;
③这种血清预防感冒的有效率为95%;
④这种血清预防感冒的有效率为5%.
解析 由于K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要留意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.
答案 ①
三、解答题
13.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:
身高(cm)
143
156
159
172
165
171
177
161
164
160
体重(kg)
41
49
61
79
68
69
74
69
68
54
依据上述数据,画出散点图并推断居民的身高和体重之间是否有相关关系.
解析 以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:
由散点图可知,两者之间具有相关关系,且为正相关.
14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:
年份
2002
2004
2006
2008
2010
需求量(万吨)
236
246
257
276
286
(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程;
(Ⅱ)利用(Ⅰ)中所求出的直线方程猜想该地2022年的粮食需求量。
15.有甲、乙两个班级进行数学考试,依据大于等于85分为优秀,85分以下为非优秀统计成果后,得到如下的列联表.
优秀
非优秀
总计
甲班
10
乙班
30
合计
105
已知从全部105人中随机抽取1人为优秀的概率为.
(1)请完成上面的列联表;
(2)依据列联表的数据,若按95%的牢靠性要求,能否认为“成果与班级有关系”;
(3)若按下面的方法从甲班优秀的同学中抽取一人:把甲班优秀的10名同学从2到11进行编号,先后两次抛掷一枚均匀的骰子,毁灭的点数之和为被抽取人的序号.试求抽到6号或10号的概率.
附 K2=,
解析 (1)
优秀
非优秀
总计
甲班
10
45
55
乙班
20
30
50
合计
30
75
105
(2)依据列联表中的数据,得到
k=≈6.109>3.841,
因此有95%的把握认为“成果与班级有关系”.
(3)设“抽到6号或10号”为大事A,先后两次抛掷一枚均匀的骰子,毁灭的点数为(x,y),则全部的基本大事有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.
大事A包含的基本大事有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P(A)==.
16.地震、海啸、洪水、森林大火等自然灾难频繁毁灭,紧急避险常识越来越引起人们的重视.某校为了了解同学对紧急避险常识的了解状况,从七班级和八班级各选取100名同学进行紧急避险常识学问竞赛.图K55-2(1)和图K55-2(2)分别是对七班级和八班级参与竞赛的同学成果按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.
图K55-2
(1)分别计算参与这次学问竞赛的两个班级同学的平均成果;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)
(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个班级同学对紧急避险常识的了解有差异”?
成果小于60分人数
成果不小于60分人数
合计
七班级
八班级
合计
附:K2=.临界值表:
P(K2≥k)
0.10
0.05
0.010
k
2.706
3.841
6.635
解析 (1)七班级同学竞赛平均成果为
(45×30+55×40+65×20+75×10)÷100=56(分),
八班级同学竞赛平均成果为
(45×15+55×35+65×35+75×15)÷100=60(分).
(2)2×2列联表如下:
成果小于60分人数
成果不小于60分人数
合计
七班级
70
30
100
八班级
50
50
100
合计
120
80
200
∴K2=≈8.333>6.635,
∴有99%的把握认为“两个班级同学对紧急避险常识的了解有差异”.
展开阅读全文