资源描述
2.2 总体分布的估量
课时目标 1.理解用样本的频率分布估量总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.
1.频率分布表:反映______________的表格叫频率分布表.
2.编制频率分布表的步骤
(1)求________,打算组数和组距,组距=________.
(2)______,通常对组内数值所在区间取__________,最终一组取闭区间;
(3)登记________,计算________,列出频率分布表.
3.在频率分布直方图中,每个矩形的高等于该组的____________,每个矩形的________恰好是该组的频率.
4.频率分布折线图:将频率分布直方图中各相邻的矩形的____________顺次连结起来,就得到频率分布折线图.
5.茎叶图刻画数据有两个优点:一是__________都可以从茎叶图中得到,二是茎叶图便于__________.
一、填空题
1.下列说法不正确的是________.
①频率分布直方图中每个小矩形的高就是该组的频率;
②频率分布直方图中各个小矩形的面积之和等于1;
③频率分布直方图中各个小矩形的宽一样大;
④频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的.
2.一个容量为100的样本,其数据的分组与各组的频数如下:
组别
(0,10]
(10,20]
(20,30]
(30,40]
(40,50]
(50,60]
(60,70]
频数
12
13
24
15
16
13
7
则样本数据落在(10,40]上的频率为________.
3.100辆汽车通过某一段大路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有________辆.
4.如图是总体密度曲线,下列说法正确的是________.
①组距越大,频率分布折线图越接近于它;
②样本容量越小,频率分布折线图越接近于它;
③阴影部分的面积代表总体在(a,b)内取值的百分比;
④阴影部分的平均高度代表总体在(a,b)内取值的百分比.
5.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.
则样本在区间[20,+∞)上的频率为________.
6.某工厂对一批产品进行了抽样检测.下图是依据抽样检测后的产品净重(单位:克)数
据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是________.
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.
9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.
二、解答题
10.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间挨次(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.
(2)用自己的语言描述一下历届美国总统就任时年龄的分布状况.
11.抽查100袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508
511 495 494 483 485 511 493 505 488
501 491 493 509 509 512 484 509 510
495 497 498 504 498 483 510 503 497
502 511 497 500 493 509 510 493 491
497 515 503 515 518 510 514 509 499
493 499 509 492 505 489 494 501 509
498 502 500 508 491 509 509 499 495
493 509 496 509 505 499 486 491 492
496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501
496
(1)列出样本的频率分布表:
(2)画出频率分布直方图,频率分布折线图;
(3)估量重量在[494.5,506.5]g的频率以及重量不足500 g的频率.
力气提升
12.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
绘制频率分布直方图的具体步骤:①求极差:找出一组数据中的最大值和最小值,最大值与最小值的差是极差(正值).②确定组距与组数:组数与样本容量有关,当样本容量不超过100时,依据数据的多少,常分成5~12组;组距的选择力求“取整”,组数=.③将数据分组:将数据分成互不相交的组,通常对组内数值所在区间取左闭右开区间,最终一组取闭区间.④列频率分布表:一般分“分组”、“频数累计”、“频数”、“频率”四列,最终一行是合计.留意频数的合计是样本容量,频率的合计是1.⑤绘制频率分布直方图:依据频率分布表绘制频率分布直方图,其中纵轴表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积,即每个矩形的面积=组距×=频率.这样频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各小矩形的面积的总和等于1.
第2章 统 计
2.2 总体分布的估量
学问梳理
1.总体频率分布 2.(1)全距 (2)分组 左闭右开区间 (3)频数 频率 3. 面积 4.上底边的中点 5.全部的信息 记录和表示
作业设计
1.①
2.0.52
解析 样本数据落在(10,40]上的频数为13+24+15=52,故其频率为=0.52.
3.40
解析 时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,
又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).
4.③
5.31%
解析 由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为≈0.31.
6.90
解析 ∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,
∴样本总数为=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.
7.60
解析 ∵n·=27,∴n=60.
8.45,46
解析 由中位数的概念可知x甲中=45,x乙中=46.
9.
解析 =h,故|a-b|=组距==.
10.解 (1)以4为组距,列表如下:
分组
频数累计
频数
频率
[41.5,45.5)
[45.5,49.5)
[49.5,53.5)
[53.5,57.5)
[57.5,61.5)
正
正
正正正
正
2
7
8
16
5
0.045 5
0.159 1
0.181 8
0.363 6
0.113 6
[61.5,65.5)
[65.5,69.5]
4
2
0.090 9
0.045 5
合计
44
1.00
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.
11.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于=8,要分9组,组数合适,于是打算取组距为4 g,分9组,使分点比数据多一位小数,且把第一组起点略微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5).
列出频率分布表:
(2)频率分布直方图与频率分布折线图如图.
(3)重量在[494.5,506.5]g的频率为:0.21+0.14+0.09=0.44.
设重量不足500 g的频率为b,依据频率分布表,
≈,故b≈0.55.因此重量不足500 g的频率约为0.55.
12.解 (1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明.
展开阅读全文