资源描述
专题限时集训(六) 统计与统计案例
[专题通关练]
(建议用时:30分钟)
1.(2023·新余模拟)一支田径队共有运发动98人,其中女运发动42人,用分层抽样的方法抽取一个样本,每名运发动被抽到的概率都是,那么男运发动应抽取 ( )
A.18人 B.16人 C.14人 D.12人
B [∵田径队共有运发动98人,其中女运发动有42人,∴男运发动有56人,
∵每名运发动被抽到的概率都是,
∴男运发动应抽取56×=16(人),应选B.]
2.(2023·承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如下图),其中阴影局部表示倾向选择生育二胎的对应比例,那么以下表达中错误的选项是( )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
C [由题图,可得是否倾向选择生育二胎与户籍有关、性别无关,
倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,
倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.应选C.]
3.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )
A.56 B.60 C.120 D.140
D [由频率分布直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,那么每周自习时间不少于22.5小时的人数为0.7×200=140.应选D.]
4.某城市收集并整理了该市2023年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.
该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误的选项是 ( )
A.最低气温与最高气温为正相关
B.10月的最高气温不低于5月的最高气温
C.月温差(最高气温减最低气温)的最大值出现在1月
D.最低气温低于0 ℃的月份有4个
D [在A中,最低气温与最高气温为正相关,故A正确;
在B中,10月的最高气温不低于5月的最高气温,故B正确;
在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;
在D中,最低气温低于0 ℃的月份有3个,故D错误.应选D.]
5.(2023·石家庄模拟)某学校A,B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比拟两个班兴趣小组成绩的平均值及标准差.
①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;
②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;
③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;
④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.
其中正确结论的编号为( )
A.①④ B.②③ C.②④ D.①③
A [A班兴趣小组的平均成绩为
=78,
其方差为×[(53-78)2+(62-78)2+…+(95-78)2]=121.6,
那么其标准差为≈11.03;
B班兴趣小组的平均成绩为
=66,
其方差为×[(45-66)2+(48-66)2+…+(91-66)2]=169.2,
那么其标准差为≈13.01.应选A.]
6.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入[1,450]的人做问卷A,编号落入[451,750]的人做问卷B,其余的人做问卷C,那么抽到的人中,做问卷B的人数为________.
10 [由题意得系统抽样的抽样间隔为=30,又因为第一组内抽取的号码为9,那么由451≤9+30k≤750(k∈N*)得14.7≤k≤24.7,所以做问卷B的人数为10.]
7.一组数据x1,x2,…,xn的方差为2,假设数据ax1+b,ax2+b,…,axn+b(a>0)的方差为8,那么a的值为________.
2 [根据方差的性质可知,a2×2=8,故a=2.]
8.某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:
单价x/元
3.0
3.2
3.4
3.6
3.8
4.0
销量y/瓶
50
44
43
40
35
28
x,y的关系符合回归方程=x+,其中=-20.假设该品牌饮料的进价为2元,为使利润最大,零售价应定为________元.
3.75 [依题意得:=3.5,=40,
所以=40-(-20)×3.5=110,
所以回归直线方程为:=-20x+110,
利润L=(x-2)(-20x+110)=-20x2+150x-220,
所以x==3.75元时,利润最大.]
[能力提升练]
(建议用时:15分钟)
9.在2023年女子世界杯期间,法国局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:
等级代码数值x
38
48
58
68
78
88
销售单价y/元
16.8
18.8
20.8
22.8
24
25.8
(1)销售单价y与等级代码数值x之间存在线性相关关系,求y关于x的线性回归方程(系数精确到0.1);
(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?
参考公式:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘法估计分别为=,=-.
参考数据:xiyi=8 440,x=25 564.
[解] (1)由题意,得==63,
==21.5,
==≈0.2,
=-=21.5-0.2×63=8.9.
故所求线性回归方程为=0.2x+8.9.
(2)由(1),知当x=98时,y=0.2×98+8.9=28.5.
∴估计该等级的中国小龙虾销售单价为28.5元.
10.某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).
(1)求图中a的值;
(2)估计该次考试的平均分(同一组中的数据用该组的区间中点值代表);
(3)根据条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.
晋级成功
晋级失败
合计
男
16
女
50
合计
参考公式:K2=,其中n=a+b+c+d
P(K2≥k)
0.40
0.25
0.15
0.10
0.05
0.025
k
0.708
1.323
2.072
2.706
3.841
5.024
[解] (1)由频率分布直方图中各小长方形面积总和为1,得(2a+0.020+0.030+0.040)×10=1,解得a=0.005.
(2)由频率分布直方图知各小组的中点值依次是
55,65,75,85,95,
对应的频率分别为0.05,0.30,0.40,0.20,0.05,
那么估计该次考试的平均分为=55×0.05+65×0.3+75×0.4+85×0.2+95×0.05=74(分).
(3)由频率分布直方图知,晋级成功的频率为0.2+0.05=0.25,
故晋级成功的人数为100×0.25=25,
填写2×2列联表如下:
晋级成功
晋级失败
合计
男
16
34
50
女
9
41
50
合计
25
75
100
K2=
=≈2.613>2.072,
所以有85%的把握认为“晋级成功〞与性别有关.
题号
内容
押题依据
1
饼状图、分布图
以统计图表为背景的统计考题是近几年高考中的高频考点,此题考查利用饼状图、分布图进行信息分析,意在考查学生的逻辑推理、数据分析、数学运算核心素养,符合全国卷命题特点
2
茎叶图、平均数、方差
从茎叶图中提取数字特征(如平均数、众数、中位数、方差等)与统计案例综合考查的试题,但它是高考的重要考点,此题考查对茎叶图中的样本数据进行分析,再运用独立性检验方法得出相关数据解决生产中的实际问题,考查学生的逻辑推理、数据分析和数学运算的核心素养
【押题1】 为了了解现在互联网行业的就业情况,某高校教授组织学生对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图(如图1)和90后从事互联网行业者岗位分布图(如图2),那么以下结论中不一定正确的选项是(注:80后是指在1980~1989年(包含1980年与1989年)之间出生,90后是指在1990~1999年(包含1990年与1999年)之间出生,80前是指1979年及以前出生)( )
A.互联网行业从业人员中80后的人数不超过一半
B.互联网行业中90后从事技术岗位的人数超过所有年龄从业者总人数的20%
C.互联网行业中90后从事市场岗位的人数缺乏所有年龄从业者总人数的10%
D.互联网行业中从事职能岗位的人数90后比80后多
D [对于A选项,由饼状图可知80后人数占了41%,故A正确;对于B选项,90后从事技术岗位的人数所占比例为39.6%,由饼状图知90后人数占了56%,56%×39.6%=22.176%>20%,故B正确;对于C选项,由饼状图知90后人数占了56%,56%×13.2%=7.392%<10%,故C正确;对于D选项,因为80后从事职能岗位的人数所占比例不清楚,所以无法判断,故D错误.应选D.]
【押题2】 某工厂有两台不同的机器A和B,生产同一种产品各10万件,现从各自生产的产品中分别随机抽取20件,进行质量鉴定,鉴定成绩的茎叶图如下图.
该产品的质量评价标准规定:鉴定成绩在[90,100)内的产品,质量等级为优秀;鉴定成绩在[80,90)内的产品,质量等级为良好;鉴定成绩在[60,80)内的产品,质量等级为合格.将频率视为概率.
(1)完成下面2×2列联表,以产品质量等级是否到达良好以上(含良好)为判断依据,判断能不能在误差不超过0.05的情况下,认为产品等级是否到达良好以上(含良好)与生产产品的机器有关;
A机器生产的产品
B机器生产的产品
合计
良好以上
(含良好)
合格
合计
(2)质量等级为优秀的产品的售价为12元/件,质量等级为良好的产品的售价为10元/件,质量等级为合格的产品的售价为5元/件,A机器每生产10万件的本钱为20万元,B机器每生产10万件的本钱为30万元.该工厂决定,按样本数据测算,两种机器分别生产10万件产品,假设收益之差到达5万元以上,那么淘汰收益低的机器,假设收益之差不超过5万元,那么保存原来的两台机器.你认为该工厂会怎么做?
附:K2=,
P(K2≥k)
0.25
0.15
0.10
0.05
0.010
k
1.323
2.072
2.706
3.841
6.635
[解] (1)完成2×2列联表如下.
A机器生产的产品
B机器生产的产品
合计
良好以上(含良好)
6
12
18
合格
14
8
22
合计
20
20
40
结合列联表中的数据,可得K2的观测值k==≈3.636<3.841.
故在误差不超过0.05的情况下,不能认为产品等级是否到达良好以上(含良好)与生产产品的机器有关.
(2)由题意得,A机器每生产10万件产品的利润为10×(12×0.1+10×0.2+5×0.7)-20=47(万元),
B机器每生产10万件产品的利润为10×(12×0.15+10×0.45+5×0.4)-30=53(万元),
因为53-47=6(万元),6>5,
所以该工厂应该会卖掉A机器,同时购置一台B机器.
- 7 -
展开阅读全文