资源描述
§11.2 统计图表、数据的数字特征、用样本估计总体
2014高考会这样考 1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主;2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).
复习备考要这样做 1.理解统计中的常用术语:总体、个体、样本、平均数、方差、中位数、众数;2.会利用频率分布直方图、茎叶图对总体进行估计,尤其是频率分布直方图的应用更是高考考查的热点.
1.统计图表
统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.
2.数据的数字特征
(1)众数、中位数、平均数
众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.
中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.
平均数:样本数据的算术平均数,即=(x1+x2+…+xn).
在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(2)样本方差、标准差
标准差s= ,
其中xn是样本数据的第n项,n是样本容量,是平均数.
标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.
3.用样本估计总体
(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.
(2)在频率分布直方图中,纵轴表示,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.
(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.
(4)当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有信息,而且可以随时记录,给数据的记录和表示都带来方便.
[难点正本 疑点清源]
1.作频率分布直方图的步骤
(1)求极差;(2)确定组距和组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直
方图.
频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.
2.众数、中位数与平均数的异同
(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.
(2)由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.
(3)众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.
(4)某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.
3.利用频率分布直方图估计样本的数字特征
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.
(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.
(3)众数:最高的矩形的中点的横坐标.
1.(2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=________.
答案 3.2
解析 ==7,
∴s2=[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]==3.2.
2.(2011·浙江)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是____.
答案 600
解析 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600.
3.(2012·湖南)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.
(注:方差s2=[(x1-)2+(x2-)2+…+(xn-)2],其中为x1,x2,…,xn的平
均数)
答案 6.8
解析 依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为=11.
由方差公式得s2=[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=(9+4+1+4+16)=6.8.
4.一个容量为20的样本,数据的分组及各组的频数如下:
[10,20),2;[20,30),3;[30,40),x;[40,50),5;[50,60),4;[60,70),2;则x=________;根据样本的频率分布估计,数据落在[10,50)的概率约为________.
答案 4 0.7
解析 x=20-(2+3+5+4+2)=4,
P==0.7或P=1-==0.7.
5.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有 ( )
A.30辆 B.40辆 C.60辆 D.80辆
答案 B
解析 由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).
题型一 频率分布直方图的绘制与应用
例1 某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:
(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;
(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.
思维启迪:利用各小长方形的面积和等于1求分数在[70,80)内的频率,再补齐频率分布直方图.
解 (1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.
(2)平均分为x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
探究提高 频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.
某种袋装产品的标准质量为每袋100克,但工人在包装过程中一般有误差,规定误差在2克以内的产品均合格.由于操作熟练,某工人在包装过程中不称重直接包装,现对其包装的产品进行随机抽查,抽查30袋产品获得的数据如下:
质量(单位:克)
数量(单位:袋)
[90,94)
2
[94,98)
6
[98,102)
12
[102,106)
8
[106,110]
2
(1)根据表格中的数据绘制产品质量的频率分布直方图;
(2)估计该工人包装的产品的平均质量的估计值是多少.
解 (1)频率分布直方图如下:
(2)×92+×96+×100+×104+×108≈100.27(克).
题型二 茎叶图的应用
例2 某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:
品种A:
357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,44
5,445,451,454
品种B:
363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,41
5,416,422,430
(1)作出数据的茎叶图;
(2)用茎叶图处理现有的数据,有什么优点?
(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.
思维启迪:作茎叶图时,将高位(十位与百位)作为茎,低位(个位)作为叶,逐个统计;根
据茎叶图分析两组数据的特点,可以得出结论.
解 (1)如下图
(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.
(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.
探究提高 (1)茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.
(2)茎叶图不能直接反映总体的分布情况,这就需要通过茎叶图给出的数据求出数据的数字特征,进一步估计总体情况.
(1)如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人比赛得分的中位数之和是________.
答案 64
解析 ∵甲的中位数为28,乙的中位数为36,
∴甲、乙得分中位数之和为28+36=64.
(2)甲、乙两个体能康复训练小组各有10名组员,经过一段时间训练后,某项体能测试结果的茎叶图如图所示,则这两个小组中体能测试平均成绩较高的是________组.
答案 甲
解析 ∵甲==75.5,
乙==75.4,
∴甲>乙.
题型三 用样本的数字特征估计总体的数字特征
例3 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
(1)分别计算两组数据的平均数;
(2)分别计算两组数据的方差;
(3)根据计算结果,估计一下两名战士的射击水平谁更好一些.
思维启迪:根据公式计算平均数和方差,然后利用平均数和方差的意义进行估计.
解 (1)甲=(8+6+7+8+6+5+9+10+4+7)=7(环),
乙=(6+7+7+8+6+7+8+7+9+5)=7(环).
(2)由方差公式s2=[(x1-)2+(x2-)2+…+(xn-)2]可求得s=3.0(环2),s=1.2(环2).
(3)由甲=乙,说明甲、乙两战士的平均水平相当;
又∵s>s,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.
探究提高 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(1)如右图是某电视台综艺节目举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为 ( )
A.84,4.84 B.84,1.6 C.85,4 D.85,1.6
答案 D
解析 由茎叶图可知评委打出的最低分为79,最高分为93,其余得分为84,84,86,84,87,故平均分为=85,
方差为[3×(84-85)2+(86-85)2+(87-85)2]=1.6.
(2)(2012·山东)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是
( )
A.众数 B.平均数 C.中位数 D.标准差
答案 D
解析 对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.
统计图表识图不准致误
典例:(5分)从某校高三年级随机抽取一个班,对该班50名学生的高校招生体检表中的视力情况进行统计,其频率分布直方图如图所示:
若某高校A专业对视力的要求在0.9以上,则该班学生中能报A专业的人数为________.
易错分析 解题中易出现审题不仔细,又对所给图形没有真正理解清楚,将矩形的高误认为频率或者对“0.9以上”的含义理解有误.
解析 该班学生视力在0.9以上的频率为(1.00+0.75+0.25)×0.2=0.4,故能报A专业的人数为0.4×50=20.
答案 20
温馨提醒 频率分布条形图的纵轴(矩形的高)表示频率;频率分布直方图的纵轴(矩形的高)表示频率与组距的比值,其各小组的频率等于该小组上的矩形的面积.
方法与技巧
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均值为x1p1+x2p2+…+xnpn;若x1,x2,…,xn的平均数为,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a+b,方差为a2s2.
失误与防范
频率分布直方图的纵坐标为频率/组距,每一个小矩形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
A组 专项基础训练
(时间:35分钟,满分:57分)
一、选择题(每小题5分,共20分)
1.(2011·四川)有一个容量为66的样本,数据的分组及各组的频数如下:
[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9
[23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12
[35.5,39.5) 7 [39.5,43.5) 3
根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是 ( )
A. B. C. D.
答案 B
解析 由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为=.
2.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如图),已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在(80,100)之间的学生人数是 ( )
A.32 B.27 C.24 D.33
答案 D
解析 80~100之间两个长方形高占总体的比例为
=,即为频数之比,
∴=,∴x=33.
3.在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为 ( )
A.92,2 B.92,2.8 C.93,2 D.93,2.8
答案 B
解析 去掉最高分95和最低分89后,剩余数据的平均数为==92,方差为s2=[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=(4+4+1+4+1)=2.8.
4.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则 ( )
A.A>B,sA>sB B.A<B,sA>sB
C.A>B,sA<sB D.A<B,sA<sB
答案 B
解析 A中的数据都不大于B中的数据,所以A<B,但A中的数据比B中的数据波动幅度大,所以sA>sB.
二、填空题(每小题5分,共15分)
5.(2012·广东)由正整数组成的一组数据x1,x2,x3,x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)
答案 1,1,3,3
解析 假设这组数据按从小到大的顺序排列为x1,x2,x3,x4,
则 ∴
又s=
=
==1,
∴(x1-2)2+(x2-2)2=2.
同理可求得(x3-2)2+(x4-2)2=2.
由x1,x2,x3,x4均为正整数,且(x1,x2),(x3,x4)均为圆(x-2)2+(y-2)2=2上的点,分析知x1,x2,x3,x4应为1,1,3,3.
6.(2012·山东)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.
答案 9
解析 最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9.
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
答案 60
解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数和为·n=27,故n=60.
三、解答题(共22分)
8.(10分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价.
解 (1)由图像可得甲、乙两人五次测试的成绩分别为
甲:10分,13分,12分,14分,16分;
乙:13分,14分,12分,12分,14分.
甲==13,
乙==13,
s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
9.(12分)(2012·广东)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成 绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].
(1)求图中a的值;
(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;
(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.
分数段
[50,60)
[60,70)
[70,80)
[80,90)
x∶y
1∶1
2∶1
3∶4
4∶5
解 (1)由频率分布直方图知(2a+0.02+0.03+0.04)×10=1,解得a=0.005.
(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).
(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.
由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×=20,30×=40,20×=25.
故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.
B组 专项能力提升
(时间:25分钟,满分:43分)
一、选择题(每小题5分,共15分)
1.(2011·重庆)从一堆苹果中任取10只,称得它们的质量如下(单位:克):125 120 122 105 130 114 116 95 120 134
则样本数据落在[114.5,124.5]内的频率为 ( )
A.0.2 B.0.3 C.0.4 D.0.5
答案 C
解析 落在[114.5,124.5]内的样本数据为120,122,116,120,共4个,故所求频率为=0.4.
2.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为 ( )
A.0.27,78 B.0.27,83 C.2.7,7 8 D.2.7,83
答案 A
解析 由题意,4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d,则有6×0.27+15d=1-0.01-0.03-0.09,解得d然后可求得各组频率(也可用排除法).
3.一个样本a,3,5,7的平均数是b,且a、b是方程x2-5x+4=0的两根,则这个样本的方差是 ( )
A.3 B.4 C.5 D.6
答案 C
解析 x2-5x+4=0的两根是1,4.
当a=1时,a,3,5,7的平均数是4,
当a=4时,a,3,5,7的平均数不是1.
∴a=1,b=4.则方差s2=×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5,故选C.
二、填空题(每小题5分,共15分)
4.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知
a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________________________________________.
答案 0.030 3
解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a==0.030.由题意知,身高在[120,130),[130,140),[140,150]的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为=,
∴在[140,150]中选取的学生应为3人.
5.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.
答案 4
解析 由题意可得:x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,|x-y|=2|t|=4.
6.已知总体的各个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且总体的中位数为10.5,若要使该总体的方差最小,则a、b的取值分别是________、________.
答案 10.5 10.5
解析 ∵中位数为10.5,∴=10.5,a+b=21,
∵==10,
∴s2=[(2-10)2+(3-10)2+(3-10)2+(7-10)2+(a-10)2+(b-10)2+(12-10)2+(13.7-10)2+(18.3-10)2+(20-10)2].
令y=(10-a)2+(10-b)2=2a2-42a+221
=22+,
当a=10.5时,y取最小值,方差s2也取最小值.
∴a=10.5,b=10.5.
三、解答题
7.(13分)某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:
[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.
(1)列出样本的频率分布表;
(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;
(3)当地政府制定了人均月用水量为3 t的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?
解 (1)频率分布表:
分组
频数
频率
[0,0.5)
4
0.04
[0.5,1)
8
0.08
[1,1.5)
15
0.15
[1.5,2)
22
0.22
[2,2.5)
25
0.25
[2.5,3)
14
0.14
[3,3.5)
6
0.06
[3.5,4)
4
0.04
[4,4.5)
2
0.02
合计
100
1
(2)频率分布直方图如图:
众数:2.25,中位数:2.02,平均数:2.02.
(3)人均月用水量在3 t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3 t以上,88%的居民月用水量在3 t以下,因此政府的解释是正确的.
高考资源网版权所有!投稿可联系QQ:1084591801
展开阅读全文