收藏 分销(赏)

用样本的频率分布估计总体分布PPT.ppt

上传人:快乐****生活 文档编号:10471642 上传时间:2025-05-29 格式:PPT 页数:31 大小:4.71MB
下载 相关 举报
用样本的频率分布估计总体分布PPT.ppt_第1页
第1页 / 共31页
用样本的频率分布估计总体分布PPT.ppt_第2页
第2页 / 共31页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,2.2,用样本估计总体,2.2.1,用样本的频率分布估计总体分布,1.,通过实例体会分布的意义和作用,.,2.,在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,.,(,重点,),3.,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计,.,(,难点,),我国是世界上严重缺水的国家之一,城市缺水问题较为突出,.,2000,年全国主要城市中缺水情况排在前,10,位的城市,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,a,用水量不超过,a,的部分按平价收费,超过,a,的部分按议价收费,.,(1),如果希望大部分居民的日常生活不受影响,那 么标准,a,定为多少比较合理呢?,(2),为了较合理地确定这个标准,你认为需要做,哪些工作?,3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0,1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2,这些数字告诉我们什么信息?,通过抽样,我们获得了,100,位居民某年的月平均用水量,(,单位:,t),,如下表:,很容易发现的是一个居民月平均用水量的最小值时,0.2t,,最大值是,4.3t,,其他在,0.2t,4.3t,之间,.,分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,.,初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数,.,下面将要学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律,.,它可以使我们看到整个样本数据的频率分布情况,.,频率分布表和频率分布直方图,(,1,)求极差(一组数据中的最大值与最小值的差),.,例如,,4.3-0.2=4.1,,说明样本数据的变化范围是,4.1(t).,(,2,)决定组距与组数,.,设,k=,极差,组距,若,k,为整数,则组数,=k,,否则,组数,=k+1.,为方便其间,组距的选择应力求,“,取整,”,.,在本问题中,如果取组距为,0.5,(,t),,那么,组数,=,极差,组距,=4.1,0.5=8.2,,,因此可以将数据分为,9,组,这个组数是比较合适的,于是取组距为,0.5,,组数为,9.,(,4,)列频率分布表,.,计算各小组的频率,作出下面的频率分布表,.,(频数,=,样本数据落在各小组内的个数,频率,=,频数,样本容量),(,3,)将数据分组,.,以组距为,0.5,将数据分组时,可以分成以下,9,组:,0,0.5),0.5,1),4,4.5.,列频率分布表,:,分组,频数累计,频数,频率,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,合计,4,8,15,22,25,14,6,4,2,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,100,1.00,频率,=,样本容量,频数,注意频数的合计应是样本容量,频率合计应是,1.,0.02,频率,/,组距,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,频率分布表一般分,“,分组,”,,,“,频数累计,”,(可省),,“,频数,”,,,“,频率,”,“,频率,/,组距,”,五列,最后一行是合计,(5),画频率分布直方图,.,根据频率分布表可以得到如图所示的频率分布直方图,:,月均用水量,/t,0.10,0.20,0.30,0.40,0.50,O,频率,/,组距,0.5,1,1.5,2.5,3.5,4.5,2,3,4,提升总结:频率分布直方图,第一步:画平面直角坐标系,.,第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度,.,第三步:以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长方形,.,频率分布是指一个样本数据在各个小范围内所占比例的大小,.,一般用频率分布直方图来反映样本的频率分布,.,月均用水量,/t,频率,/,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,各组的频率在图中哪里显示出来?,各小长方形的面积,=,频率,.,各小长方体的面积之和是否为定值?,各小长方形的面积之和为,1.,宽度:组距,高度:,频率,组距,月均用水量,/t,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,频率,/,组距,(,1,)居民月均用水量的分布是呈,“,山峰,”,状的,而且是,“,单峰,”,的;,(,2,)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(,3,)居民月均用水量的分布有一定的对称性,.,频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来,.,如果市政府希望,85%,左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即,a,的取值)有何建议?,88%,的居民在,3t,以下,标准可定为,3t.,在实际中,取,a=3t,一定能保证,85%,以上的居民用水不超标吗?,在实践中,对统计结论是需要进行评价的,.,频率分布直方图如下,:,月均用水量,/t,0.10,0.20,0.30,0.40,0.50,0.5,1,1.5,2,2.5,3,3.5,4,4.5,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,.,o,频率,/,组距,利用样本频率分布对总体分布进行相应估计,:,(,1,)上例的样本容量为,100,,如果增至,1 000,,其频率分布直方图的情况会有什么变化?假如增至,10 000,呢?,(,2,)样本容量越大,这种估计越精确,.,(,3,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,总体密度曲线,.,总体密度曲线,月均用水量,/t,a,b,(图中阴影部分的面积,表示总体在某个区间,(a,b),内取值的百分比),.,o,频率,/,组距,总体密度曲线,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总体分布的工具,.,用样本频率分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的百分比,.,茎叶图,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39;,乙运动员得分:,49,24,12,31,50,31,44,36,15,37,25,36,39.,茎叶图,甲,乙,0,1,2,3,4,5,2 5,5 4,1 6 1 6 7 9,4 9,0,8,4 6 3,6 8,3 8 9,1,叶就是从茎的旁边生长出来的数,表示得分的个位数字,茎是指中间的一列数,表示得分的十位数字,从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定,.,茎叶图的优、缺点:,在样本数据较少时,用茎叶图表示数据的效果较好,.,它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便,.,但当样本数据较多时,茎叶图就显得不太方便,.,因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长,.,1.,将样本容量为,100,的数据按从大到小的顺序分为,8,组如下表:,9,12,13,15,14,14,13,10,频数,8,7,6,5,4,3,2,1,组号,则第三组的频率为(),(A)0.14 (B)1/14 (C)0.03 (D)3/14,2.,将一个容量为,50,的样本数据分组后,组距和频数如下,:,12.5,,,15.5,),;,15.5,,,18.5,),,8,;,18.5,,,21.5,),,9,;,21.5,,,24.5,),,11,;,24.5,,,27.5,),,1,;,27.5,,,30.5,),,6,;,30.5,,,33.5,,,3,则估计小于或等于,30,的数据大约占总体的(),(A),(B),(C),(D),3.,某地区为了了解知识分子的年龄结构,随机抽样,50,名,其年龄分别如下:,42,,,38,,,29,,,36,,,41,,,43,,,54,,,43,,,34,,,44,,,40,,,59,,,39,,,42,,,44,,,50,,,37,,,44,,,45,,,29,,,48,,,45,,,53,,,48,,,37,,,28,,,46,,,50,,,37,,,44,,,42,,,39,,,51,,,52,,,62,,,47,,,59,,,46,,,45,,,67,,,53,,,49,,,65,,,47,,,54,,,63,,,57,,,43,,,46,,,58.,(1),列出样本频率分布表;,(2),画出频率分布直方图;,(3),估计年龄在,32,岁,52,岁的知识分子所占的比例约是多少,.,【解析】,(1),极差为,67-28=39,,取组距为,5,,分为,8,组,.,分 组 频数 频率,27,,,32,),3 0.06,32,,,37,),3 0.06,37,,,42,),9 0.18,42,,,47,),16 0.32,47,,,52,),7 0.14,52,,,57,),5 0.10,57,,,62,),4 0.08,62,,,67 3 0.06,合 计,50 1.00,样本频率分布表:,(,2,)样本频率分布直方图:,年龄,0.06,0.05,0.04,0.03,0.02,0.01,27 32 37 42 47 52 57 62 67,O,(,3,)因为,0.06+0.18+0.32+0.14=0.7,,故年龄在,32,岁,52,岁的知识分子约占,70%.,频率,/,组距,1.,总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布,.,2.,总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图,.,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服