资源描述
阶段性测试题十(统计、统计案例)
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分.考试时间120分钟.
第Ⅰ卷(选择题 共50分)
一、选择题(本大题共10个小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2021·潍坊联考)某学校从高二甲、乙两个班中各选6名同学参与数学竞赛,他们取得的成果(满分100分)的茎叶图如图,其中甲班同学成果的众数是85,乙班同学成果的平均分为81,则x+y的值为( )
甲
乙
9 7
7
8 y
5 0 x
8
1 1 0
1
9
2
A.6 B.7
C.8 D.9
[答案] D
[解析] 由众数的定义知x=5,由乙班的平均分为81得=81,解得y=4,故x+y=9.
2.(文)若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是( )
A. B.
C. D.
[答案] C
[解析] 该题考查平均数的概念及运算.共有M+N个数,这M+N个数的和为(MX+NY),故这M+N个数的平均数为 .
(理)期中考试后,班长算出了全班40名同学的数学成果的平均分为M.假如把M当成一个同学的分数,与原来的40个分数加在一起,算出这41个分数的平均值为N,那么MN为( )
A.4041 B.11
C.4140 D.21
[答案] B
[解析] 设40个人的成果依次为a1,a2,…,a40,则
M=.
当把该平均分M当成一个人的分数时,41个分数的平均值为N===M,
故MN=11.
3.某班78名同学已编号1,2,…,78,为了了解该班同学的作业状况,老师收取了编号能被5整除的15名同学的作业,这里运用的抽样方法是( )
A.简洁随机抽样 B.系统抽样
C.分层抽样 D.抽签法
[答案] B
[解析] 由抽样方法知,应选B.
4.一个社会调查机构就某地居民的月收入调查了20000人,并依据所得数据画出了样本频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,按月收入用分层抽样方法抽样,若从月收入[3000,3500)(元)段中抽取了30人,则这20000人中共抽取的人数为( )
A.200 B.100
C.20000 D.40
[答案] A
[解析] 由题意得,月收入在[3000,3500)(元)段中的频率是0.0003×500=0.15,该收入段的人数是20000×0.15=3000(人),从中抽取了30人,说明从每100人中抽取1个,故共抽取=200(人).
5.四名同学依据各自的样本数据争辩变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578
其中确定不正确的结论的序号是( )
A.①② B.②③
C.③④ D.①④
[答案] D
[解析] 若y与x负相关,则=bx+a中b<0,故①不正确,②正确;
若y与x正相关,则=bx+a中b>0,故③正确,④不正确;故选D.
6.(2022·广东高考)为了解1000名同学的学习状况,接受系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )
A.50 B.40
C.25 D.20
[答案] C
[解析] 本题考查系统抽样.
从1000名同学中抽取40名,分成40组,每组25人,间隔为25.选C.系统抽样又叫等距抽样.
7.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.依据收集到的数据(如下表),由最小二乘法求得回归直线方程=0.67x+54.9.表中一个数据模糊不清,请你推断出该数据的值为( )
零件数x(个)
10
20
30
40
50
加工时间y(min)
62
75
81
89
A.75 B.62
C.68 D.81
[答案] C
[解析] 设表中模糊看不清的数据为m,由表中数据得:
=30,=,
由于由最小二乘法求得回归方程y=0.67x+54.9,
将=30,=代入回归直线方程,
得m=68,故选C.
8.(2022·安徽示范高中联考)给出下列五个命题:
①将A、B、C三种个体按312的比例分层抽样调查,假如抽取的A个体为9个,则样本容量为30;
②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;
③甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲;
④已知具有相关关系的两个变量满足的回归直线方程为y=1-2x,则x每增加1个单位,y平均削减2个单位;
⑤统计的10个样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为0.4.
其中真命题为( )
A.①②④ B.②④⑤
C.②③④ D.③④⑤
[答案] B
[解析] ①样本容量为9÷=18,①是假命题;②数据1,2,3,34,5的平均数为(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③乙==7,s=[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=×(4+1+4+9+4)=4.4,∵s>s,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求概率为=0.4,⑤是真命题.
9.(文)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图如图,后来有1个数据模糊,无法辨认,在图中以x表示:
8
7 7
9
4 0 1 0 x 9 1
则7个剩余分数的方差为( )
A. B.
C.36 D.
[答案] B
[解析] 去掉最高最低分后的数据为87,90,90,91,91,94,90+x,
由=91=得x=4,则方差s2=[(87-91)2+(90-91)2+(90-91)2+(91-91)2+(94-91)2+(91-91)2+(94-91)2]=.
(理)某班有48名同学,在一次考试中统计出平均分数为70,方差为75,后来发觉有2名同学的成果有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是( )
A.70,25 B.70,50
C.70,1.04 D.65, 25
[答案] B
[解析] 易得没有转变,=70,
而s2=[(x+x+…+502+1002+…+x)-482]=75,
s′2=[(x+x+…802+702+…+x)-482]
=[(75×48+482-12500+11300)-482]
=75-=75-25=50.
10.一个频率分布表(样本容量为30)不当心被损坏了一部分(如图),只记得样本中数据在[20,60)上的频率为0.8,则估量样本在[40,60)上的数据个数可能是( )
A.7和6 B.6和9
C.8和9 D.9和10
[答案] B
[解析] 因样本中数据在[20,60)上的频率为0.8,则样本中数据在[20,60)上的频数为30×0.8=24.又由于样本中数据在[20,40)上的频数为4+5=9,
所以样本在[40,60)上的数据的个数为30×0.5=15.
第Ⅱ卷(非选择题 共100分)
二、填空题(本大题共5个小题,每小题5分,共25分,把正确答案填在题中横线上)
11.(文)(2022·湖北高考)甲、乙两套设备生产的同类型产品共4800件,接受分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.
[答案] 1800
[解析] 本题考查分层抽样.
设乙厂生产的总数为n件,则=,
解得n=1800.
(理)(2022·天津高考)某高校为了解在校本科生对参与某项社会实践活动的意向,拟接受分层抽样的方法,从该校四个班级的本科生中抽取一个容量为300的样本进行调查.已知该校一班级、二班级、三班级、四班级的本科生人数之比为4556,则应从一班级本科生中抽取________名同学.
[答案] 60
[解析] 本题考查分层抽样.
∵人数比4556,设每份为x,
则4x+5x+5x+6x=20x=300,∴x=15,
∴一班级抽15×4=60人.
12.今年3月份,某报社做了一次关于“什么是新时代的雷锋精神?”的调查,在A、B、C、D四个单位回收的问卷数依次成等差数列,共回收1000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B单位抽30份,则在D单位抽取的问卷是________份.
[答案] 60
[解析] 由于在A、B、C、D四个单位回收的问卷数依次成等差数列,所以从A、B、C、D按单位分层抽取的容量也成等差数列,设公差为d,则(30-d)+30+(30+d)+(30+2d)=150,所以d=15,所以在D单位抽取的问卷是30+2d=60份.
13.我校高三(4)班共有56人,同学编号依次为1,2,3,…,56,现用系统抽样的方法抽取一个简洁为4的样本,已知编号为6,34,48的同学在样本中,那么还有一位同学的编号应为________.
[答案] 20
[解析] 系统抽样也是等距抽样,由于第三、第四两段中抽取的编号之差为14,
所以其次段中抽取的编号与第一段中抽取的编号之差也为14,
所以还有一位同学的编号应为20.
14. (2021·银川第一次质检)如图是甲、乙两名篮球运动员2022年赛季每场竞赛得分的茎叶图,则甲、乙两人竞赛得分的中位数之和是________.
甲
乙
7
1
2 6
2 8
2
3 1 9
6 4 5
3
1 2
[答案] 54
[解析] 甲得分为:17,22,28,34,35,26,其中位数为=31;乙得分为:12,16,21,23,29,31,32,其中位数为23,故甲、乙两人竞赛得分的中位数之和是54.
15.某高中共有同学2000名,已知在全校同学中随机抽取1名,抽到高三班级男生的概率是0.1,现用分层抽样的方法在全校抽取若干名同学参与社区服务,相关信息如下表:
班级
高一
高二
高三
男生(人数)
a
310
b
女生(人数)
c
d
200
抽样人数
x
15
10
则x=________.
[答案] 25
[解析] 由抽到高三班级男生的概率是0.1,可得b=200,设在全样抽取n名同学参与社区服务,
则有=,解得n=50,
∴x=50-15-10=25.
三、解答题(本大题共6个小题,共75分,解答应写出文字说明,证明过程或演算步骤)
16.(本小题满分12分)某校从参与高三模拟考试的同学中随机抽取60名同学,将其数学成果(均为整数)分成六段[90,100),[100,110),…,[140,150]后得到如下部分频率分布直方图.观看图形的信息,回答下列问题:
(1)求分数在[120,130)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估量本次考试的平均分.
[解析] (1)分数在[120,130)内的频率为:
1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3.
==0.03,补全后的直方图如下:
(2)平均分为:
=95×0.1+105×0.15+115×0.15+125×0.3+135×0.25+145×0.05=121.
17.(本小题满分12分)对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表.
甲
27
38
30
37
35
31
乙
33
29
38
34
28
36
(1)画出茎叶图,由茎叶图你能获得哪些信息?
(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并推断选谁参与竞赛更合适.
[解析] (1)画茎叶图,中间数为数据的十位数
甲
乙
7
2
8 9
8 7 5 1 0
3
3 4 6 8
从这个茎叶图上可以看出,甲、乙的得分状况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙发挥比较稳定,总体得分状况比甲好.
(2)依据公式得:甲=33,乙=33;s甲=3.96,s乙=3.35;甲的中位数是33,乙的中位数是33.5.综合比较,选乙参与竞赛较为合适.
18.(本小题满分12分)(2022·北京高考)从某校随机抽取100名同学,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18)
2
合计
100
(1)从该校随机选取一名同学,试估量这名同学该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估量样本中的100名同学该周课外阅读时间的平均数在第几组.(只需写出结论)
[解析] 思路分析:(1)从频率分布表中读出阅读时间不少于12小时人数求概率.
(2)利用频率比组距为小矩形的高求解.
(3)由图作出估量应为第4组.
(1)依据频数分布表,100名同学中课外阅读时间不少于12小时的同学共有6+2+2=10名,所以样本中的同学课外阅读时间少于12小时的频率是1-=0.9.
从该校随机选取一名同学,估量其课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在组[4,6)的有17人,频率为0.17,
所以a===0.085.
课外阅读时间落在组[8,10)的有25人,频率为0.25,
所以b===0.125.
(3)样本中的100名同学课外阅读时间的平均数为
=7.68
在第4组.
19.(本小题满分12分)地震、海啸、洪水、森林大火等自然灾难频繁毁灭,紧急避险常识越来越引起人们的重视.某校为了了解同学对紧急避险常识的了解状况,从七班级和八班级各选取100名同学进行紧急避险常识学问竞赛.图(1)和图(2)分别是对七班级和八班级参与竞赛的同学成果按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.
(1)分别计算参与这次学问竞赛的两个班级同学的平均成果;(注:统计方法中, 同一组数据常用该组区间的中点值作为代表)
(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个班级同学对紧急避险常识的了解有差异”?
成果小于60分人数
成果不小于60分人数
合计
七班级
八班级
合计
附:K2=.临界值表:
P(K2≥k)
0.10
0.05
0.010
k
2.706
3.841
6.635
[解析] (1)七班级同学竞赛平均成果为
(45×30+55×40+65×20+75×10)÷100=56(分),
八班级同学竞赛平均成果为
(45×15+55×35+65×35+75×15)÷100=60(分).
(2)2×2列联表如下:
成果小于60分人数
成果不小于60分人数
合计
七班级
70
30
100
八班级
50
50
100
合计
120
80
200
∴K2=≈8.333>6.635,
∴有99%的把握认为“两个班级同学对紧急避险常识的了解有差异”.
20.(本小题满分13分)某种产品的广告费支出x与销售额(单位:百万元)之间有如下对应数据:
x
2
4
5
6
8
y
30
40
50
60
70
假如y与x之间具有线性相关关系.
(1)作出这些数据的散点图;
(2)求这些数据的线性回归方程;
(3)猜想当广告费支出为9百万元时的销售额.
[解析] (1)
(2)=5,=50,iyi=1 390,=145,
b==7,a=-b=15,
∴线性回归方程为y=7x+15.
(3)当x=9时,y=78.
即当广告费支出为9百万元时,销售额为78百万元.
21.(本小题满分14分)(文)某单位N名员工参与“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],由统计的数据得到的频率分布直方图如图所示,下表是年龄的频率分布表.
区间
[25,30)
[30,35)
[35,40)
[40,45)
[45,50]
人数
25
a
b
(1)求正整数a,b,N的值;
(2)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组中抽取的人数分别是多少?
(3)在(2)的条件下,从这6人中随机抽取2人参与社区宣扬沟通活动,求恰有1人在第3组的概率.
[解析] (1)由频率分布直方图可知,[25,30)与[30,35)两组的人数相同,
所以a=25人.
且b=25×=100人.
总人数N==250人.
(2)由于第1,2,3组共有25+25+100=150人,利用分层抽样在150名员工中抽取6人,每组抽取的人数分别为:
第1组的人数为6×=1,
第2组的人数为6×=1,
第3组的人数为6×=4,
所以第1,2,3组分别抽取1人,1人,4人.
(3)由(2)可设第1组的1人为A,第2组的1人为B,第3组的4人分别为C1,C2,C3,C4,则从6人中抽取2人的全部可能结果为:(A,B),(A,C1),(A,C2),(A,C3),(A,C4),(B,C1),(B,C2),(B,C3),(B,C4),(C1,C2),(C1,C3),(C1,C4),(C2,C3),(C2,C4),(C3,C4),共有15种.
其中恰有1人年龄在第3组的全部结果为:(A,C1),(A,C2),(A,C3),(A,C4),(B,C1),(B,C2),(B,C3),(B,C4),共有8种.
所以恰有1人年龄在第3组的概率为.
(理)已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号挨次平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.
8
1
7
0 3 6 8 9
6
2 5 7
5
9
(1)若第5组抽出的号码为22,写出全部被抽出职工的号码;
(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差;
(3)在(2) 的条件下,从这10名职工中随机抽取两名体重不轻于73公斤(≥73公斤)的职工,求体重为76公斤的职工被抽取到的概率.
[解析] (1)由题意,第5组抽出的号码为22.
由于2+5×(5-1)=22,所以第1组抽出的号码应当为2,
抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.
(2)由于10名职工的平均体重为
=(81+70+73+76+78+79+62+65+67+59)=71,
所以样本方差为s2=(102+(-1)2+22+52+72+82+(-9)2+(-6)2+(-4)2+(-12)2)=52.
(3)从10名职工中随机抽取两名体重不轻于73公斤的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,99),(76,81),(78,79),(78,81),(79,81).
记“体重为76公斤的职工被抽取”为大事A,故所求概率为P(A)==.
展开阅读全文