资源描述
第三节 用样本估量总体
时间:45分钟 分值:100分
一、选择题
1.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )
A.0.2 B.0.4
C.0.5 D.0.6
解析 由茎叶图可知数据落在区间[22,30)内的频数为4,所以数据落在区间[22,30)内的频率为=0.4,故选B.
答案 B
2.对一批产品的长度(单位:毫米)进行抽样检测, 如图为检测结果的频率分布直方图. 依据标准, 产品长度在区间[20,25)上为一等品, 在区间[15,20)和[25,30)上为二等品, 在区间[10,15)和[30,35)上为三等品. 用频率估量概率, 现从该批产品中随机抽取1件, 则其为二等品的概率是( )
A.0.09 B.0.20
C.0.25 D.0.45
解析 由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-5×(0.02+0.04+0.06+0.03)=0.25,则二等品的频率为0.25+0.04×5=0.45,故任取1件为二等品的概率为0.45.
答案 D
3.某学校随机抽取20个班,调查各班中有网上购物经受的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )
解析 由茎叶图知,各组频数统计如下表:
分组
区间
[0,5)
[5,10)
[10,
15)
[15,
20)
[20,
25)
[25,
30)
[30,
35)
[35,
40)
频数
统计
1
1
4
2
4
3
3
2
上表对应的频率分布直方图为A,故选A.
答案 A
4.为了普及环保学问,增加环保意识,某高校随机抽取30名同学参与环保学问测试,得分(格外制)如图所示,假设得分值的中位数为me,众数为mo,平均值为,则( )
A.me=mo= B.me=mo<
C.me<mo< D.mo<me<
解析 30个数中第15个数是5,第16个数是6,所以中位数me==5.5,众数mo=5,平均值==.
答案 D
5.若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为,方差为s2,则( )
A.=5,s2<2 B.=5,s2>2
C.>5,s2<2 D.>5,s2>2
解析 考查样本数据的平均数及方差.
∵(x1+x2+…+x8)=5,∴(x1+x2+…+x8+5)=5,
∴=5,由方差定义及意义可知加入新数据5后,样本数据取值的稳定性比原来强,
∴s2<2,故选A.
答案 A
6.甲、乙、丙、丁四人参与某运动会射击项目选拔赛,四人的平均成果和方差如表所示:
甲
乙
丙
丁
平均环数
8.3
8.8
8.8
8.7
方差s2
3.5
3.6
2.2
5.4
从这四个人中选择一人参与该运动会射击项目竞赛,最佳人选是( )
A.甲 B.乙
C.丙 D.丁
解析 由题目表格中数据可知,丙平均环数最高,且方差最小,说明丙技术稳定,且成果好,选C.
答案 C
二、填空题
7.某校进行2022年元旦汇演,九位评委为某班的节目打出的分数(百分制)如茎叶统计图所示,去掉一个最高分和一个最低分后,所剩数据的中位数为________.
解析 依据茎叶图,去掉一个最高分和一个最低分后,得到的数据为七个,中位数为85.
答案 85
8.(2021·武汉调研)
某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100].则
(1)图中的x=________;
(2)若上学所需时间不少于1小时的同学可申请在学校住宿,则该校600名新生中估量有________名同学可以申请住宿.
解析 由频率分布直方图知20x=1-20×(0.025+0.006 5+0.003+0.003),解得x=0.012 5.上学时间不少于1小时的同学频率为0.12,因此估量有0.12×600=72人可以申请住宿.
答案 0.012 5 72
9.(2022·安徽联考)已知x是1,2,3,x,5,6,7这七个数据的中位数,且1,3,x,-y这四个数据的平均数为1,则+y的最小值为__________.
解析 由已知得3≤x≤5,=1,∴y=x,
∴+y=+x,又函数y=+x在[3,5]上单调递增,∴当x=3时取最小值.
答案
三、解答题
10.已知某单位有50名职工,现在从中抽取10名职工,将全体职工随机按1~50编号,并按编号挨次平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.
(1)若第5组抽出的号码为22,写出全部被抽出职工的号码;
(2)分别统计这10名职工的体重(单位:kg),获得体重数据的茎叶图如图所示,求该样本的方差;
(3)在(2)的条件下,从这10名职工中随机抽取两名体重不轻于73 kg(≥73 kg)的职工,求体重为76 kg的职工被抽取到的概率.
解 (1)由题意知第5组抽出的号码为22.
∵2+5×(5-1)=22,∴第1组抽出的号码应当为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.
(2)∵10名职工的平均体重为=(81+70+73+76+78+79+62+65+67+59)=71,
∴样本方差为s2=(81-71)2+(70-71)2+(73-71)2+(76-71)2+(78-71)2+(79-71)2+(62-71)2+(65-71)2+(67-71)2+(59-71)2=52.
(3)从10名职工中随机抽取两名体重不轻于73 kg的职工,共有10种不同的取法:(73,76),(73,78),(73,79),(73,81),(76,78),(76,79),(76,81),(78,79),(78,81),(79,81).
∴体重为76 kg的职工被抽取到的概率为=.
11.为了增加同学的环保意识,某中学随机抽取了50名同学进行了一次环保学问竞赛,并将本次竞赛的成果(得分均为整数,满分100分)整理,制成下表:
成果
[40,
50)
[50,
60)
[60,
70)
[70,
80)
[80,
90)
[90,
100]
频数
2
3
14
15
12
4
(1)作出被抽查同学成果的频率分布直方图;
(2)若从成果在[40,50)中选一名同学,从成果在[90,100]中选2名同学,共3名同学召开座谈会,求[40,50)组中同学A1和[90,100]组中同学B1同时被选中的概率.
解 (1)由题意可知,各组频率分别为0.04,0.06,0.28,0.30,0.24,0.08,
所以图中各组的纵坐标分别为:0.004,0.006,0.028,0.030,0.024,0.008,则被抽查同学成果的频率分布直方图如图所示:
(2)记[40,50)组中的同学为A1,A2,[90,100]组中的同学为B1,B2,B3,B4,A1和B1同时被选中记为大事M.
由题意可得,全部的基本大事为:A1B1B2,A1B1B3,A1B1B4,A1B2B3,A1B2B4,A1B3B4,A2B1B2,A2B1B3,A2B1B4,A2B2B3,A2B2B4,A2B3B4,共12个,
大事M包含的基本大事为:A1B1B2,A1B1B3,A1B1B4,共3个,所以同学A1和B1同时被选中的概率P(M)==.
1.如图是依据某城市年龄在20岁到45岁在居民上网状况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民消灭的频率为( )
A.0.04 B.0.06
C.0.2 D.0.3
解析 由频率分布直方图可知,年龄在[20,25)的频率为0.01×5=0.05,[25,30)的频率为0.07×5=0.35,又年龄在[30,35),[35,40),[40,45]的频率成等差数列分布,所以年龄在[35,40)的网民消灭的频率为0.2.
答案 C
2.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{an},若a3=8,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是( )
A.13,12 B.13,13
C.12,13 D.13,14
解析 设等差数列{an}的公差为d(d≠0),a3=8,a1a7=(a3)2=64,(8-2d)(8+4d)=64,(4-d)(2+d)=8,2d-d2=0,又d≠0,故d=2,故样本数据为:4、6、8、10、12、14、16、18、20、22,平均数为==13,中位数为=13.
答案 B
3.关于统计数据的分析,有以下5种说法:
①一组数不行能有两个众数;
②将一组数据中的每个数据都减去同一个数后,方差没有变化;
③调查影剧院中观众观看感受时,从50排(每排人数相同)中任意取一个排的人参与调查,属于分层抽样;
④一组数据的方差肯定是正数;
⑤如图是随机抽取的200辆汽车通过某一段大路时的时速分布直方图,依据这个直方图,可以得到时速在[50,60)的汽车大约是60辆.
这5种说法中错误的是________.(填序号)
解析 ①一组数不行能有两个众数,这个说法是错误的,比如1,1,2,2,3这组数据的众数有两个;②将一组数据中的每个数据都减去同一个数后,方差没有变化,说法正确,∵方差反映一组数据的波动大小,整体变化不转变波动大小;③调查观众观看某部电影的感受时,从50排(每排人数相同)中任意抽取一排的观众进行调查,属于简洁随机抽样,故③错误;④一组数据的方差肯定是正数是错误的,还有可能是0;⑤时速在[50,60)的频率为0.3,∴时速在[50,60)的汽车大约有200×0.3=60(辆),∴⑤正确,∴这5种说法中错误的是①③④.
答案 ①③④
4.(理)(2022·辽宁五校摸底)某市为预备参与省中同学运动会,对本市甲、乙两个田径队的全部跳高运动员进行了测试,用茎叶图表示出甲、乙两队运动员本次测试的跳高成果(单位:cm,且均为整数),同时对全体运动员的成果绘制了频率分布直方图.跳高成果在185 cm以上(包括185 cm)定义为“优秀”,由于某些缘由,茎叶图中乙队的部分数据丢失,但已知全部运动员中成果在190 cm以上(包括190 cm)的只有两个人,且均在甲队.
(1)求甲、乙两队运动员的总人数a及乙队中成果在[160,170)(单位:cm)内的运动员人数b;
(2)在甲、乙两队全部成果在180 cm以上的运动员中随机选取2人,已知至少有1人成果为“优秀”,求两人成果均“优秀”的概率;
(3)在甲、乙两队中全部的成果为“优秀”的运动员中随机选取2人参与省中同学运动会正式竞赛,求所选取运动员中来自甲队的人数X的分布列及期望.
解 (1)由频率分布直方图可知,成果在190 cm以上的运动员频率为0.05,∴运动员总人数为a==40(人).
乙队中成果在[160,170)内的运动员人数b=40×0.3-3=9(人).
(2)由频率分布直方图可知,乙队成果在180 cm以上的有3人,全体队员成果在180 cm以上的共有10人,其中成果优秀的有6人.
设至少有1人成果“优秀”为大事A,两人成果“优秀”为大事B,
则P(B|A)===.
(3)成果“优秀”的运动员共6人,甲队4人,乙队2人.
随机变量X全部可能取值为0,1,2.
P(X=0)==,P(X=1)==,P(X=2)===,∴X的分布列为
X
0
1
2
P
数学期望E(X)=+==.
(文)(2022·北京卷)从某校随机抽取100名同学,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图.
组号
分组
频数
1
[0,2)
6
2
[2,4)
8
3
[4,6)
17
4
[6,8)
22
5
[8,10)
25
续表
6
[10,12)
12
7
[12,14)
6
8
[14,16)
2
9
[16,18)
2
合计
100
(1)从该校随机选取一名同学,试估量这名同学该周课外阅读时间少于12小时的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估量样本中的100名同学该周课外阅读时间的平均数在第几组.(只需写出结论)
解 (1)依据频数分布表,100名同学中课外阅读时间不少于12小时的同学共有6+2+2=10名,所以样本中的同学课外阅读时间少于12小时的频率是1-=0.9.
从该校随机选取一名同学,估量其课外阅读时间少于12小时的概率为0.9.
(2)课外阅读时间落在组[4,6)的有17人,频率为0.17, 所以a===0.085.
课外阅读时间落在组[8,10)的有25人,频率为0.25,所以b===0.125.
(3)样本中的100名同学课外阅读时间的平均数在第4组.
展开阅读全文