收藏 分销(赏)

用样本频率分布估计总体分布PPT.ppt

上传人:快乐****生活 文档编号:2292154 上传时间:2024-05-25 格式:PPT 页数:32 大小:492.50KB
下载 相关 举报
用样本频率分布估计总体分布PPT.ppt_第1页
第1页 / 共32页
用样本频率分布估计总体分布PPT.ppt_第2页
第2页 / 共32页
用样本频率分布估计总体分布PPT.ppt_第3页
第3页 / 共32页
用样本频率分布估计总体分布PPT.ppt_第4页
第4页 / 共32页
用样本频率分布估计总体分布PPT.ppt_第5页
第5页 / 共32页
点击查看更多>>
资源描述

1、2.2.1 2.2.1 用样本的频率分用样本的频率分布估计总体分布布估计总体分布 我们用简单随机抽样、系统抽样、分层我们用简单随机抽样、系统抽样、分层抽样的方法收集样本数据后,就可以通过样抽样的方法收集样本数据后,就可以通过样本研究总体。本研究总体。用样本估计总体的两种情况:用样本估计总体的两种情况:用样本的频率分布估计总体分布用样本的频率分布估计总体分布用样本的数字特征(平均数、标准差等)用样本的数字特征(平均数、标准差等)估计总体的数字特征估计总体的数字特征 复习回顾复习回顾频数:频数:不分组时,数据中某个数据出现的次数不分组时,数据中某个数据出现的次数 分组时,一个组内的数据的个数分组时

2、,一个组内的数据的个数频率:频率:极差:极差:最大数最大数-最小数最小数分组分组频数频数频率频率频率频率/组距组距频率分布表:频率分布表:知识探究(一):频率分布表知识探究(一):频率分布表 某某市政府为了节约生活用水,计划在市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确本市试行居民生活用水定额管理,即确定一个居民月用水量标准定一个居民月用水量标准a a,用水量不,用水量不超过超过a a的部分按平价收费,超出的部分按平价收费,超出a a的部分的部分按议价收费按议价收费.问题问题1 1:如果希望大部分居民的日常生活如果希望大部分居民的日常生活 不受影响,那么标准不受影响,那么标

3、准a a定为多少比较合理?定为多少比较合理?问题问题2 2:为了较为合理的确定标准:为了较为合理的确定标准a a,需要做,需要做 哪些工作?哪些工作?通过抽样调查,获得通过抽样调查,获得100100位居民位居民20072007年的月年的月均用水量如下表(单位:均用水量如下表(单位:t t):):3.1 2.5 2.0 2.03.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.23.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 1.5 1.2 0.2 0.4 0.3

4、 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.83.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.33.0 2.9 2.4 2.43.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 1.9 1.3

5、 1.4 1.8 0.7 2.02.5 2.8 2.3 2.3 1.8 1.3 1.32.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.02.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 1.7 0.8 2.42.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5 2.2

6、 2.0 1.5 1.0 1.2 1.8 0.6 2.2问题问题3:这些数字告诉了我们什么信息?这些数字告诉了我们什么信息?我们可以看出,样本数据中的最大值我们可以看出,样本数据中的最大值4.34.3和最小值,其他数据在和最小值,其他数据在0.20.24.34.3之间之间分析数据的基本方法:分析数据的基本方法:用图画出来用图画出来 用表格重新排列用表格重新排列1、借助于图:、借助于图:频率分布直方图、频率分布折线图、频率分布直方图、频率分布折线图、茎叶图茎叶图两个目的两个目的从数据中提取信息从数据中提取信息 利用图形传递信息利用图形传递信息2、借助于表格:、借助于表格:频率分布表频率分布表两个

7、目的两个目的 改变数据的排列方式改变数据的排列方式提供解释数据的新方式提供解释数据的新方式第二步:确定组距,第二步:确定组距,组数组数组距组距=每个小组两个每个小组两个端点的差端点的差.组数组数=极差极差组距组距 (取整数)(取整数)探究一探究一 频率分布表频率分布表(4.4.1 10.5=8.20.5=8.2将将8.28.2取整,组数取整,组数=9=9,组距组距=0.5=0.5思考思考1:上述:上述100个数据的个数据的最小值和最大值分别是多最小值和最大值分别是多少?少?第一步:求极差第一步:求极差思考思考2:分成多少组:分成多少组合适?合适?如果将上述如果将上述100100个数据按组个数据

8、按组距为距为0.50.5进行分组,那么这进行分组,那么这些数据共分为多少组?些数据共分为多少组?极差:极差:4.3-0.2=4.1512组组第四步:列频率第四步:列频率 分布表分布表探究一探究一 频率分布表频率分布表思考思考3:各组数据的取值范:各组数据的取值范围如何设定?围如何设定?第三步:确定端第三步:确定端点,将数据分组点,将数据分组 各组均为左开右闭各组均为左开右闭区间,最后一个闭区间,最后一个闭区间区间思考思考4:如何统计各:如何统计各族中的频数、频率?族中的频数、频率?00,0.50.5),),0.50.5,1 1),),11,1.51.5),),44,4.5.4.5.分分 组组

9、频数频数 频率频率 频率频率/组距组距 0 0,0.50.5)4 0.04 0.08 4 0.04 0.08 0.5 0.5,1 1)8 0.08 0.168 0.08 0.16 1 1,1.51.5)15 0.15 0.3015 0.15 0.30 1.5 1.5,2 2)22 0.22 0.4422 0.22 0.44 2 2,2.52.5)25 0.25 0.5025 0.25 0.50 2.5 2.5,3 3)14 0.14 0.2814 0.14 0.28 3 3,3.53.5)6 0.06 0.126 0.06 0.12 3.5 3.5,4 4)4 0.04 0.084 0.04

10、0.08 4 4,4.5 2 0.02 0.044.5 2 0.02 0.04 合计合计 100 1.00 2100 1.00 2探究(二):画频率分布直方图探究(二):画频率分布直方图 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O第一步:画直角坐标系:第一步:画直角坐标系:x轴为数据单位,轴为数据单位,y轴为频率轴为频率/组距组距第二步:在第二步:在x轴上均匀标出各组分点,轴上均匀标出各组分点,在在y轴上标出单位长度轴上标出

11、单位长度第三步:以组距为宽,各组的频率第三步:以组距为宽,各组的频率/组距为高,组距为高,分别画出各组对应的长方形分别画出各组对应的长方形 问题问题1 1:频率分布直方图中各小长方形:频率分布直方图中各小长方形的宽度和高度在数量上有何特点?的宽度和高度在数量上有何特点?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距宽度:组距高度:高度:频率频率组距组距2 频率分布直方图频率分布直方图的意义的意义 问题问题2 2:频率分布直方图中各小长方形的:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和

12、面积表示什么?各小长方形的面积之和为多少?为多少?各小长方形的面积各小长方形的面积=各小组的各小组的频率频率各小长方形的面积之和各小长方形的面积之和=1=1月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O宽度:组距宽度:组距高度:高度:频率频率组距组距3 3 分析例题:频率分布直方图非常直观分析例题:频率分布直方图非常直观地表明了样本数据的分布情况,使我们地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出据模式,但原始数据不能在图

13、中表示出来来.你能根据上述频率分布直方图指出居你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?民月均用水量的一些数据特点吗?月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O(1 1)居民月均用水量的分布是)居民月均用水量的分布是“山峰山峰”状的,而状的,而且是且是“单峰单峰”的;的;(2 2)大部分居民的月均用水量集中在一个中间值)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;附近,只有少数居民的月均用水量很多或很少;(3 3)居民月均用水量的分布有一定的对称性等)居

14、民月均用水量的分布有一定的对称性等.月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O思考:对一组给定的样本数据,频率分思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以在居民月均用水量样本中,你能以1 1为组为组距画频率分布直方图吗?距画频率分布直方图吗?与分组数(或组距)及坐标系的单位长与分组数(或组距)及坐标系的单位长度有关度有关.月均用水量月均用水量/t频率频率组距组距0.40.40.30.30.20.20.10.11 2 3

15、4 5 1 2 3 4 5 O频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5在频率分布直方图中在频率分布直方图中取取各小长方形上端的中点各小长方形上端的中点用折线依次连接各中点用折线依次连接各中点得到频率分布折线图得到频率分布折线图用样本频分布估计总体分布用样本频分布估计总体分布 上上例例的的样样本本容容量量为为100,如如果果增增至至1000,其其频频率率分分布布直直方方图图的的情情况况会会有有什什么么变变化化?假如增至假如增至10000呢?呢?总体密度曲线总体密度曲线频率频率组距

16、组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线频率分布折线图就会无限接近一条光滑曲线总体密总体密度曲线度曲线总体密度曲线总体密度曲线 用用样样本本分分布布直直方方图图去去估估计计相相应应的的总总体体分分布布时时,一一般般样样本本容容量量越越大大,频频率率分分布布直直方方图图就就会会无无限限接接近近总总体体密密度度曲曲线线,就就越越精精确确地地反反映映了了总总

17、体体的的分分布布规规律律,即即越越精精确确地地反反映映了了总总体体在在各各个个范范围围内内取取值值百分比。百分比。总总体体密密度度曲曲线线反反映映了了总总体体在在各各个个范范围围内内取取值值的的百百分分比比,精精确确地地反反映映了了总总体体的的分分布布规规律律。是是研研究究总总体分布的工具体分布的工具.总体密度曲线总体密度曲线茎茎 叶叶 图图 某赛季甲、乙两名篮球运动员每场比赛得分的某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:原始记录如下:(1)甲运动员得分甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:乙运动员得分:49,24,12,

18、31,50,31,44,36,15,37,25,36,39 甲甲 乙乙 8 0 4 6 3 1 2 5 3 6 8 2 5 4 3 8 9 3 1 6 1 6 7 9 4 4 9 1 5 0 (1)甲甲:8,13,16,14,23,26,28,38,33,39,51。(2)乙:乙:12,15,24,25,31,36,31,36,37,39,44,49,50,茎叶图茎叶图 当样本数据较少时,用茎叶当样本数据较少时,用茎叶图表示数据的效果较好,它不但图表示数据的效果较好,它不但可以保留所有的信息,而且可以保留所有的信息,而且 可以可以随时记录,给数据的记录和表示随时记录,给数据的记录和表示都方便。

19、都方便。小小 结结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示大量数据)易表示大量数据 丢失一些丢失一些直方图直方图 2)直观地表明分布地)直观地表明分布地 情况情况 信息信息 1)无信息损失)无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据理论迁移理论迁移 例例1 1 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:42 42,3838,2929,3636,4141,4343,5454,4343,3434,4444,

20、40 40,5959,3939,4242,4444,5050,3737,4444,4545,2929,48 48,4545,5353,4848,3737,2828,4646,5050,3737,4444,42 42,3939,5151,5252,6262,4747,5959,4646,4545,6767,53 53,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占

21、的比例约是多少约是多少.(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 频率频率/组距组距 27 27,3232)3 0.06 0.0123 0.06 0.012 32 32,3737)3 0.06 0.0123 0.06 0.012 37 37,4242)9 0.18 0.0369 0.18 0.036 42 42,4747)16 0.32 0.06416 0.32 0.064 47 47,5252)7 0.14 0.0287 0.14 0.028 52 52,5757)5 0.10 0.0205 0.

22、10 0.020 57 57,6262)4 0.08 0.0164 0.08 0.016 62 62,6767)3 0.06 0.0123 0.06 0.012 合合 计计 50 1.00 0.20050 1.00 0.200样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.

23、70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.练习巩固练习巩固 1 有一个容量为有一个容量为50的样本数据的分组的样本数据的分组及各组的频数如下:及各组的频数如下:12.5,15.5)3 24.5,27.5)1015.5,18.5)8 27.5,30.5)518.5,21.5)9 30.5,33.5)421.5,24.5)11列出样本的频率分布表和画出频率列出样本的频率分布表和画出频率分布直方图;分布直方图;根据样本的频率分布估计,小于根据样本的频率分布估计,小于30.5的数据约占多少?的数据约占多少?解解:组

24、距为组距为3 3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070练习:某中学高一(练习:某中学高一(2)班甲,乙两)班甲,乙两名同学自高中以来每场数学考试成名同学自高中以来每场数学考试成绩情况如下:绩情况如下:甲的得分:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。茎叶图对两人的成绩进行比较。课堂小结课堂小结表示样本分布的方法:表示样本分布的方法:(1)频率分布表)频率分布表(2)频率分布图直方图)频率分布图直方图(3)频率分布折线图)频率分布折线图(4)茎叶图)茎叶图

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服