资源描述
第3节 用样本估计总体
考纲要求 1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样本的频率分布估计总体的频率分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
知识梳理
1.频率分布直方图
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
2.茎叶图
统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s=,
s2=[(x1-)2+(x2-)2+…+(xn-)2].
1.频率分布直方图与众数、中位数、平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
诊断自测
1.判断下列结论正误(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )
(2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )
答案 (1)√ (2)× (3)√ (4)×
解析 (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.
(2)错误.方差越大,这组数据越离散.
(3)正确.小矩形的面积=组距×=频率.
(4)错误.茎相同的数据,相同的数据叶要重复记录,故(4)错误.
2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4 B.8 C.12 D.16
答案 B
解析 设频数为n,则=0.25,∴n=32×=8.
3.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
答案 A
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96,
∴中位数是=91.5,
平均数==91.5.
4.(2020·全国Ⅱ卷)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1 600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( )
A.10名 B.18名 C.24名 D.32名
答案 B
解析 由题意,第二天完成积压订单及当日订单的配货的概率不小于0.95,即第二天确保完成新订单1 600份,减去超市每天能完成的1 200份,再加上积压的500份,共有1 600-1 200+500=900(份),至少需要志愿者900÷50=18(名).
5.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
答案 C
解析 10x1,10x2,…,10xn的方差为102×0.01=1.故选C.
6.(2020·新高考海南卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( )
A.62% B.56% C.46% D.42%
答案 C
解析 如图,用Venn图表示该中学喜欢足球和游泳的学生所占的比例之间的关系,设既喜欢足球又喜欢游泳的学生占该中学学生总数的比例为x,则(60%-x)+(82%-x)+x=96%,解得x=46%.故选C.
考点一 频率分布直方图
【例1】 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90].并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.
所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4.
(2)根据题意,样本中分数不小于50的频率为
(0.01+0.02+0.04+0.02)×10=0.9,
故样本中分数小于50的频率为0.1,
故分数在区间[40,50)内的人数为100×0.1-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60.
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
感悟升华 1.频率分布直方图的性质.
(1)小长方形的面积=组距×=频率;
(2)各小长方形的面积之和等于1;
(3)小长方形的高=.
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
【训练1】 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频率分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频率分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户和满意度分为三个等级:
满意度评分
低于70分
70分到89分
不低于90分
满意度等级
不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 (1)作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记CA表示事件:“A地区用户的满意度等级为不满意”;
CB表示事件:“B地区用户的满意度等级为不满意”.
由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6,
P(CB)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
考点二 统计图表及应用
角度1 扇形图
【例2】 某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
答案 A
解析 法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.
法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.
角度2 折线图
【例3】 (2021·银川模拟)某运动健康App可以记录跑步(里程数)或行走情况(步数),用户通过该App可查看自己某时间段的运动情况.某人根据2020年1月至2020年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论不正确的是( )
A.月跑步里程逐月增加
B.月跑步里程最大值出现在10月
C.月跑步里程的中位数为5月份对应的里程数
D.相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳
答案 A
解析 由折线图可知,月跑步里程并不是逐月增加,A错误;月跑步里程最大值出现在10月,B正确;月跑步里程的中位数为5月份对应的里程数,C正确;相对6月至11月,1月至5月的月跑步里程波动性更小、变化比较平稳,D正确.
角度3 茎叶图
【例4】 (2021·石家庄综合训练)从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图数据如图.根据茎叶图,下列描述正确的是( )
A.甲种树苗的中位数大于乙种树苗的中位数,且甲种树苗比乙种树苗长得整齐
B.甲种树苗的中位数大于乙种树苗的中位数,但乙种树苗比甲种树苗长得整齐
C.乙种树苗的中位数大于甲种树苗的中位数,且乙种树苗比甲种树苗长得整齐
D.乙种树苗的中位数大于甲种树苗的中位数,但甲种树苗比乙种树苗长得整齐
答案 B
解析 甲种树苗的中位数为=27.5,乙种树苗的中位数为=25,所以甲种树苗的中位数大于乙种树苗的中位数.从茎叶图上看,乙种树苗的高度基本上分布在2和3两个茎上,而甲种树苗的高度分布比较分散,所以乙种树苗比甲种树苗长得整齐,故选B.
感悟升华 1.通过扇形统计图可以很清楚的表示出各部分数量同总数之间的关系.
2.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
3.茎叶图的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.
【训练2】 (1)(2021·洛阳模拟)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A.200,20 B.100,20
C.200,10 D.100,10
(2)(2021·昆明诊断)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高.如图是2019年9月到2020年2月这半年来某个关键词的搜索指数变化的统计图.
根据该统计图判断,下列结论正确的是( )
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化
B.这半年来,网民对该关键词相关的信息关注度不断减弱
C.从该关键词的搜索指数来看,2019年10月的方差小于11月的方差
D.从该关键词的搜索指数来看,2019年12月的平均值大于2020年1月的平均值
答案 (1)A (2)D
解析 (1)由图①得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,
抽取的高中生人数为2 000×2%=40(人),
则近视人数为40×0.5=20(人),故选A.
(2)由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显著,排除A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋势不显著,排除B;由统计图可知,2019年10月该关键词的搜索指数波动较大,11月的波动较小,所以2019年10月的方差大于11月的方差,排除C;由统计图可知,2019年12月该关键词的搜索指数大多高于10 000,该月平均值大于10 000,2020年1月该关键词的搜索指数大多低于10 000,该月平均值小于10 000,选D.
考点三 样本的数字特征
【例5】 (1)(2019·全国Ⅱ卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
(2)(2021·贵阳诊断)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的统计表如下表所示,
甲
乙
环数
4
5
6
7
8
5
6
9
频数
1
1
1
1
1
3
1
1
有以下四种说法:①甲成绩的平均数小于乙成绩的平均数;②甲成绩的中位数等于乙成绩的中位数;③甲成绩的方差小于乙成绩的方差;④甲成绩的极差小于乙成绩的极差.其中正确命题的个数是( )
A.1 B.2 C.3 D.4
答案 (1)A (2)A
解析 (1)中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.
(2)由表中数据,得甲=×(4+5+6+7+8)=6,
乙=×(5×3+6+9)=6,
所以甲=乙,①错误;
甲成绩的中位数是6,乙成绩的中位数是5,
所以甲成绩的中位数大于乙成绩的中位数,②错误;
s=×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,
s=×[3×(5-6)2+(6-6)2+(9-6)2]=2.4,
所以s<s,③正确;
甲成绩的极差为8-4=4,乙成绩的极差为9-5=4,
所以甲成绩的极差等于乙成绩的极差,④错误.
综上知,正确命题的个数是1.
感悟升华 1.平均数反映了数据取值的平均水平,而方差、标准差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【训练3】 (1)(2021·济南高三针对训练)“平均增长量”是指一段时间内某一数据指标增长量的平均值,其计算方法是将每一期增长量相加后,除以期数,即.国内生产总值(GDP)被公认为是衡量国家经济状况的最佳指标,下表是我国2015—2019年GDP数据:
年份
2015
2016
2017
2018
2019
国内生产总值/万元
68.89
74.64
83.20
91.93
99.09
根据表中数据,2015—2019年我国GDP的平均增长量为( )
A.5.03万亿元 B.6.04万亿元
C.7.55万亿元 D.10.07万亿元
(2)甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):
甲
10
8
9
9
9
乙
10
10
7
9
9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.
答案 (1)C (2)甲
解析 (1)由题意知,2015—2019年我国GDP增长量之和为99.09-68.89=30.2(万亿元),所以2015—2019年我国GDP的平均增长量为=7.55(万亿元),故选C.
(2)由题意可得甲=乙=9,
又∵s=×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=,
s=×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=>s,∴甲更稳定,故最佳人选应是甲.
A级 基础巩固
一、选择题
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )
A.45 B.50 C.55 D.60
答案 B
解析 由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.
∴该班学生人数n==50.
2.(2021·甘肃、青海、宁夏联考)从某小学随机抽取100名学生,将他们的身高(单位:厘米)分布情况汇总如下:
身高
[100,110]
(110,120]
(120,130]
(130,140]
(140,150]
频数
5
35
30
20
10
由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)( )
A.119.3 B.119.7 C.123.3 D.126.7
答案 C
解析 由题意知身高在[100,110],(110,120],(120,130]的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×=0.1,解得x≈123.3.故选C.
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )
A.10 B.18 C.20 D.36
答案 B
解析 因为直径落在区间[5.43,5.47)内的频率为0.02×(6.25+5.00)=0.225,所以个数为0.225×80=18.故选B.
4.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为( )
A.1 B.2 C.3 D.4
答案 B
解析 由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,设污染数字为x,则=33,x=2,则被污染的数字为2.
5.(2021·全国大联考)近年来,随着4G网络的普及和智能手机的更新换代,各种方便的App相继出世,其功能也是五花八门.某大学为了调查在校大学生使用App的主要用途,随机抽取了56 290名大学生进行调查,各主要用途与对应的人数的结果统计如图所示.
现有如下说法:
①可以估计使用App主要听音乐的大学生人数多于主要看社区、新闻、资讯的大学生人数;
②可以估计不足10%的大学生使用App主要玩游戏;
③可以估计使用App主要找人聊天的大学生超过总数的.
其中正确的个数为( )
A.0 B.1 C.2 D.3
答案 C
解析 使用App主要听音乐的人数为5 380,使用App主要看社区、新闻、资讯的人数为
4 450,所以①正确;使用App主要玩游戏的人数为8 130,而调查的总人数为56 290,≈0.14,故超过10%的大学生使用App主要玩游戏,所以②错误;使用App主要找人聊天的大学生人数为16 540,因为>,所以③正确.故选C.
6.(2020·成都诊断)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是( )
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
答案 C
解析 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.
二、填空题
7.(2019·全国Ⅱ卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.
答案 0.98
解析 经停该站高铁列车所有车次的平均正点率的估计值为==0.98.
8.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
答案 16
解析 依题意,x1,x2,x3,…,x10的方差s2=64.则数据2x1-1,2x2-1,…,2x10-1的方差为22s2=22×64,所以其标准差为=2×8=16.
9.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s1,s2,s3,则它们的大小关系为________________(用“>”连接).
答案 s1>s2>s3
解析 根据频率分布直方图知,甲的数据绝大部分都处在两端,离平均值较远,表现的最分散,标准差最大,乙的数据分布均匀,不如甲组中偏离平均值大,标准差比甲的小;丙的数据大部分数都在平均值左右,数据表现的最集中,方差最小,故s1>s2>s3.
三、解答题
10.(2021·福州一模)为了解某知名品牌两个不同型号手机M9,M10的待机时间(单位:小时),淮北某手机卖场从仓库中随机抽取M9,M10两种型号的手机各6台,在相同的条件下进行测试,统计结果如图:
(1)根据茎叶图计算M9,M10两种型号手机的平均待机时间;
(2)根据茎叶图判断M9,M10两种型号被测试手机待机时间方差的大小,并说明理由.
解 (1)根据茎叶图中的数据,计算M9型号手机的平均待机时间为M9=×(56+69+65+70+76+84)=70(小时),
M10型号手机的平均待机时间为M10=×(79+72+70+80+81+80)=77(小时).
(2)M9手机待机时间方差大于M10手机待机时间方差.
理由:M9的数据分布比较分散,波动较大;M10的数据分布比较集中,波动较小.
11.某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:
(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?
(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.
解 (1)如题图所示,用水量在[0.5,2)的频率的和为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.
∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w为整数,
∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.
(2)当w=3时,该市居民该月的人均水费估计为
(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).
即当w=3时,该市居民该月的人均水费估计为10.5元.
B级 能力提升
12.(2020·郑州调研)区域经济变化影响着人口的流动,下图为过去某连续5年各省、自治区及直辖市(不含港澳台)人口增长统计图.
某连续5年各省、自治区及直辖市(不含港澳台)人口增长统计图
根据图中的信息,下面结论中不正确的是( )
A.广东人口增量最多,天津增幅最高
B.黑龙江无论是增量还是增幅均居末尾
C.天津、北京、重庆和上海四大直辖市增幅均超过5%
D.人口增量超过200万的省、自治区或直辖市共有7个
答案 C
解析 对于A,由图知广东5年人口增加超过400万,增量最多,天津增幅达到了19.2%,增幅最高,A正确;对于B,由图易知正确;对于C,上海的人口增幅为4.9%,未超过5%,不正确;对于D,人口增量超过200万的省或直辖市有天津、北京、重庆、广东、河北、湖南和山东,正确.综上,选C.
13.若数据x1,x2,x3,…,xn的平均数=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数和方差分别为________.
答案 16,18
解析 ∵x1,x2,x3,…,xn的平均数为5,
∴=5,
∴+1
=3×5+1=16,
∵x1,x2,x3,…,xn的方差为2,
∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
14.(2021·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴=0.05,∴x=120.
(2)设中位数为a,则0.01×5+0.07×5+(a-30)×0.06=0.5,
∴a=≈32,则中位数为32.
(3)①5个年龄组成绩的平均数为1=×(93+96+97+94+90)=94,方差为s=×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为2=×(93+98+94+95+90)=94,方差为s=×[(-1)2+42+02+12+(-4)2]=6.8.
②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).
展开阅读全文