资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,*,单击此处编辑母版文本样式,第二级,单击此处编辑母版标题样式,问题提出,1.,随机抽样有哪几种基本的抽样方法?,2.,随机抽样是收集数据的方法,如何通,过样本数据所包含的信息,估计总体的,基本特征,即用样本估计总体,是我们,需要进一步学习的内容,.,简单随机抽样、系统抽样、分层抽样,.,2026/2/28 周六,1,2.2.1 用样本的频率分布估计总体分布,2026/2/28 周六,2,频数:,在总体,(,或样本)中,某个个体出现的次数叫做这个个体的频数。,频率:,某个个体的频数与总体,(,或样本)中所含个体的数量的比叫做这个个体的频率。,性质:,在总体,(,或样本)中,各个个体的频率之和等于,1,。,2026/2/28 周六,3,【,问题,】,我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准,a,,用水量不超过,a,的部分按平价收费,超出,a,的部分按议价收费,.,通过抽样调查,获得,100,位居民,2007,年的月均用水量如下表(单位:,t,):,2026/2/28 周六,4,3.1,2.5,2.0,2.0,1.5,1.0,1.6,1.8,1.9,1.6,3.4,2.6,2.2,2.2,1.5,1.2,0.2,0.4,0.3,0.4,3.2,2.7,2.3,2.1,1.6,1.2,3.7,1.5,0.5,3.8,3.3,2.8,2.3,2.2,1.7,1.3,3.6,1.7,0.6,4.1,3.2,2.9,2.4,2.3,1.8,1.4,3.5,1.9,0.8,4.3,3.0,2.9,2.4,2.4,1.9,1.3,1.4,1.8,0.7,2.0,2.5,2.8,2.3,2.3,1.8,1.3,1.3,1.6,0.9,2.3,2.6,2.7,2.4,2.1,1.7,1.4,1.2,1.5,0.5,2.4,2.5,2.6,2.3,2.1,1.6,1.0,1.0,1.7,0.8,2.4,2.8,2.5,2.2,2.0,1.5,1.0,1.2,1.8,0.6,2.2,通过抽样我们得到了,100,户居民的某年的月平均用水量,2026/2/28 周六,5,为了确定一个比较合理的标准,a,,必须先了解全市居民的日常用水量的分布情况。,通过抽样调查了解居民的用水情况。,课本66页表2-1,2026/2/28 周六,6,思考,1,:,上述,100,个数据中的最大值和最小值分别是什么?由此说明样本数据的变化范围是什么?,思考,2,:,样本数据中的最大值和最小值的差称为,极差,.,如果将上述,100,个数据按组距为,0.5,进行分组,那么这些数据共分为多少组?,0.2,4.3,(,4.3-0.2,),0.5=8.2,2026/2/28 周六,7,思考,3,:,以组距为,0.5,进行分组,上述,100,个数据共分为,9,组,各组数据的取值范围可以如何设定?,思考,4,:,如何统计上述,100,个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?,0,,,0.5,),,0.5,,,1,),,1,,,1.5,),,,,4,,,4.5.,2026/2/28 周六,8,分组,频数累计(划记),频数,0,0.5),0.5,1),1,1.5),1.5,2),2,2.5),2.5,3),3,3.5),3.5,4),4,4.5,合计,频数累计(划记),正,正正正,正正正正丅,正正正正正,正正,正,丅,频数,4,8,15,22,25,14,6,4,2,100,4.,画,频数,分布表,2026/2/28 周六,9,思考,5,:,上表称为样本数据的,频率分布表,,,由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种什么统计思想?,用样本的频率分布估计总体分布,.,2026/2/28 周六,10,思考,6,:,如果市政府希望,85%,左右的居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月用水量标准(即,a,的取值)有何建议?,88%,的居民月用水量在,3t,以下,可建议取,a=3.,思考,7,:,在实际中,取,a=3t,一定能保证,85%,以上的居民用水不超标吗?哪些环节可能会导致结论出现偏差?,2026/2/28 周六,11,所得到的结论的统计意义,3t,这个标准一定能保证,85%,以上的居民用水不超标吗?,不一定!,原因,1,、样本只是总体的代表,并且具有随机性,不同的样本所得到的频率分布表和直方图是不同的。,原因,2,、明年的用水情况与今年不可能完全一样,但应该大致一样。,2026/2/28 周六,12,所得到的结论的统计意义,一般的,统计得到的结果,是对于总体较为合理的估计或预测,但其误差应该控制在合理的范围之内。,也正因为这样,统计结果的好坏,往往需要进一步的评价,或通过理论方法的检验,或通过实际应用的检验。,2026/2/28 周六,13,思考,8,:,对样本数据进行分组,其组数是由哪些因素确定的?,对样本数据进行分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,一般样本容量越大,所分组数越多.按统计原理,若样本的容量为n,分组数一般在(1+3.3lg,n,)附近选取.当样本容量不超过100时,按照数据的多少,常分成512组.,2026/2/28 周六,14,思考,9,:,一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?,第一步,求极差,.,(极差,=,样本数据中最大值与最小值的差),第二步,决定组距与组数,.,(设,k=,极差,组距,若,k,为整数,则组数,=k,,否则,组数,=k+1,),第三步,确定分点,将数据分组,.,第四步,统计频数,计算频率,制成表格,.,(频数,=,样本数据落在各小组内的个数,频率,=,频数,样本容量),2026/2/28 周六,15,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,思考,1,:,为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:,2026/2/28 周六,16,上,图称为,频率分布直方图,,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的,宽度,和高度在数量上有何特点?,宽度:,组距,高度:,频率,组距,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,17,思考,2,:,频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?,各小长方形的面积,=,频率,各小长方形的面积之和,=,1,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,18,思考,3,:,频率分布直方图非常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表示出来,.,你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,19,(,1,)居民月均用水量的分布是,“,山峰,”,状的,而且是,“,单峰,”,的;,(,2,)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;,(,3,)居民月均用水量的分布有一定的对称性等,.,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,20,思考,5,:,对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以,1,为组距画频率分布直方图吗?,与分组数(或组距)及坐标系的单位长度有关,.,月均用水量,/t,频率,组距,0.4,0.3,0.2,0.1,1 2 3 4 5,O,2026/2/28 周六,21,总结画,频率分布直方图,的操作步骤,1.,求,极差,,即数据中最大值与最小值的差,2.,决定,组距与组数,组数,=,极差,/,组距,3.,将,数据分组,通常对组内数值所在区间,取,左闭右开,区间,最后一组取闭区间,4.,登记,频数,计算,频率和频率组距,列出,频率分布表,5.,画出,频率分布直方图,(纵轴表示,频率组距,),2026/2/28 周六,22,频率分布表和频率分布直方图在带给我们许多新的信息的同时,也丢失了一些信息,如原始数据不能在分布表和直方图中很好地体现出来。,频率分布直方图的优缺点是什么?,2026/2/28 周六,23,全优81页限时规范训练,2026/2/28 周六,24,1,为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,(,如图,),,图中从左到右各小长方形面积之比为,24171593,,第二小组频数为,12.,(1),第二小组的频率是多少?样本容量是多少?,(2),若次数在,110,以上,(,含,110,次,),为达标,试估计该学校全体高一学生的达标率是多少?,全优39页变式训练,2026/2/28 周六,25,【,解析,】(1),由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:,2026/2/28 周六,26,4.,某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为20,40),40,60),60,80),,8,0,100)若低于60分的人数是15人,则该班的学生人数是(),A45B50C55D60,解析:,成绩低于60分有第一、二组数据,,在频率分布直方图中,对应矩形的高分别为0.005,0.01,,每组数据的组距为20,,,则成绩低于60分的频率,P=(0.005+0.010,),20=0.3,,又低于,60,分的人数是,15,人,,全优40页基础夯实,2026/2/28 周六,27,6.,从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:,(,1,)直方图中x的值为_;,(,2,)在这些用户中,用电量落在区间100,250)内的户数为_,解析:,(,1,)依题意及频率分布直方图知,0.002450+0.003650+0.006050+x50+0.002450+0.001250=1,,解得,x=0.0044,全优41页能力提升,2026/2/28 周六,28,6.,从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示:,(,1,)直方图中x的值为_;,(,2,)在这些用户中,用电量落在区间100,250)内的户数为_,解得,x=0.0044,(,2,)样本数据落在100,150)内的频率为0.003650=0.18,,样本数据落在150,200)内的频率为0.00650=0.3,样本数据落在200,250)内的频率为0.004450=0.22,,故在这些用户中,用电量落在区间,100,,,250,)内的户数为(,0.18+0.30+0.22,),100=70,2026/2/28 周六,29,8.,如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:,(1)求:79.5-89.5这一组数据的频数、频率;,(2)求:本次竞赛的及格率(60分及以上为及格)。,解:(,1,)频率为:,0.02510=0.25,,,频数:,600.25=15,;,(,2,),0.01510+0.0310+0.02510+0.00510=0.75,。,全优41页能力提升,2026/2/28 周六,30,思考,1,:,在城市居民月均用水量样本数据的频率分布直方图中,各组数据的平均值大致是哪些数?,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,31,思考,2,:,在频率分布直方图中,依次连接各小长方形上端的中点,就得到一条折线,这条折线称为,频率分布折线图,.,你认为频率分布折线图能大致反映样本数据的频率分布吗?,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,32,思考,3,:,当总体中的个体数很多时(如抽样调查全国城市居民月均用水量),随着样本容量的增加,作图时所分的组数增多,组距减少,你能想象出相应的频率分布折线图会发生什么变化吗?,月均用水量,/t,频率,组距,0.5,0.4,0.3,0.2,0.1,0.5 1 1.5 2 2.5 3 3.5 4 4.5,O,2026/2/28 周六,33,频率,组距,产品,尺寸,(,mm,),a,b,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线,总体密度曲线,区间 在总体内取值的概率,总体密度曲线,总体密度曲线,2026/2/28 周六,34,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,,频率分布直方图,就会无限接近,总体密度曲线,,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。,总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具,.,总体密度曲线,2026/2/28 周六,35,思考:对于一个总体,如果存在总体密度曲线,这条曲线是否惟一?,频率分布表、频率分布直方图和折线图的主要作用是表示样本数据的分布情况,此外,我们还可以用茎叶图来表示样本数据的分布情况,.,由于样本是随机的,不同的样本得到的不同,频率分布折线图,;即使对与同一样本,不同的分组情况得到的也不同,频率分布折线图,。,频率分布折线图,是随着样本容量和分组情况变化而变化的。,2026/2/28 周六,36,某赛季甲、乙两名篮球运动员每场比赛得分的原始记录为:,甲运动员的得分:,13 51 23 8 26 38 16 33 14 28 39,乙运动员的得分:,49 24 12 31 50 31 44 36 15 37 25 36 39,我们可以画出,茎叶图,,也就是中间的数表示十位数,旁边的数表示两个人得分的个位数,就象一棵树的茎与叶子一样,能更直观地看出这两个人的得分情况。,茎叶图,2026/2/28 周六,37,甲,乙,0,1,2,3,4,5,2 5,5 4,1 6 1 6 7 9,4 9,0,8,4 6 3,6 8,3 8 9,1,(1),甲运动员得分:,13,51,23,8,26,38,16,33,14,28,39,(2),乙运动员得分,:,49,24,12,31,50,31,44,36,15,37,25,36,39,茎叶图,叶就是从茎的旁边生长出来的数,表示得分的个位数。,茎是指中间的一列数,表示得分的十位数,2026/2/28 周六,38,茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况。,从运动员的成绩的分布来看,乙运动员的成绩更好;从叶在茎上的分布情况来看,乙运动员的得分更集中于峰值附近,说明乙运动员的发挥更稳定。,在样本数据较少时,用茎叶图表示数据的效果较好。它不但可以保留所有信息,而且可以随时纪录,这对数据的纪录和表示都能带来方便。但当样本数据较多时,茎叶图就显得不太方便。因为每一个数据都要在茎叶图中占据一个空间,如果数据很多,枝叶就会很长。,2026/2/28 周六,39,画茎叶图的步骤:,1.,将每个数据分为茎(高位)和叶(低位)两部分,在此例中,茎为十位上的数字,叶为个位上的数字。,2.,将最小茎和最大茎之间的数按大小次序排成一列。,3.,将各个数据的叶按读数次序(或按大小次序)写在其茎的左(右)侧。,2026/2/28 周六,40,思考:,对于样本数据:,3.1,,,2.5,2.0,,,0.8,,,1.5,,,1.0,,,4.3,,,2.7,,,3.1,,,3.5,,用茎叶图如何表示?,01234,8,0 5,0 5 7,1 1 5,3,茎,叶,2026/2/28 周六,41,【,例,2】,某赛季甲、乙两名篮球运动员每场得分情况如下:,甲的得分:,12,15,24,25,31,31,36,37,36,39,44,49,50.,乙的得分:,8,13,14,16,23,26,28,33,38,39,51,9,17.,(1),用茎叶图表示上面的数据,(2),根据你所画的茎叶图,分析甲、乙运动员的得分情况,【,解析,】(1),如图所示的茎叶图中,中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分的个位数,全优39页典例剖析,2026/2/28 周六,42,【,例,2】,某赛季甲、乙两名篮球运动员每场得分情况如下:,甲的得分:,12,15,24,25,31,31,36,37,36,39,44,49,50.,乙的得分:,8,13,14,16,23,26,28,33,38,39,51,9,17.,(1),用茎叶图表示上面的数据,(2),根据你所画的茎叶图,分析甲、乙运动员的得分情况,(2),从茎叶图上可以看出:,甲运动员的得分比较集中在茎为,3,的一行,且大致关于这一行对称,中位数是,36,;乙运动员的得分主要分散在四行,中位数是,23.,所以甲运动员的发挥比较稳定,总体得分情况比乙运动员好,2026/2/28 周六,43,
展开阅读全文