1、通过抽样方法收集数据的目的是什么通过抽样方法收集数据的目的是什么?从中寻找所包含的信息,用样本去估计总体从中寻找所包含的信息,用样本去估计总体我国是世界上严重缺水的国家之一,城市缺水问题较为突出我国是世界上严重缺水的国家之一,城市缺水问题较为突出.2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布 为了节约生活用水,某市政府计划在本市试行居民生为了节约生活用水,某市政府计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准活用水定额管理,即确定一个居民月用水量标准a,a,用水用水量不超过量不超过a a的部分按平价收费,超过的部分按平价收费,超过a a的部分按议价收费的部分按
2、议价收费.(1)(1)如果希望大部分居民的日常生活不受影响,那如果希望大部分居民的日常生活不受影响,那么标准么标准a a定为多少比较合理呢?定为多少比较合理呢?(2)(2)为了较合理地确定这个标准,你认为需要做哪些工作?为了较合理地确定这个标准,你认为需要做哪些工作?3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.
3、7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 3.0 2.9 2.4 2.4 1.9 1.3 1.
4、4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.22.8 2.5
5、 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2 假设通过抽样,我们获得了假设通过抽样,我们获得了100100位居民某年的月位居民某年的月平均用水量平均用水量(单位:单位:t)t),如下表:,如下表:很容易发现的是一个居民月均用水量的最小值是很容易发现的是一个居民月均用水量的最小值是0.2t0.2t,最大值是,最大值是4.3t4.3t,其他在,其他在0.2t0.2t4.3t4.3t之间之间.频率分布表和频率分布直方图频率分布表和频率分布直方图(1 1)求极差)求极差(一组数据中的最大值与最小值的差)(一组数据中的最大值与最小值的差).例如,例如,4.3-0.2=4.14.3-0
6、2=4.1,说明样本数据的变化范围是,说明样本数据的变化范围是4.1 t.4.1 t.(2 2)决定组距与组数)决定组距与组数.设设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否则,组数否则,组数=k+1.=k+1.【课堂探究课堂探究1 1】为方便起见,组距的选择应力求为方便起见,组距的选择应力求“组数取整组数取整”.在本问题中,组数在本问题中,组数=极差极差组距组距=4.1 0.5=8.2=4.1 0.5=8.2,因此可以将数据分为因此可以将数据分为9 9组,这个组数是比较合适的,组,这个组数是比较合适的,于是取组距为于是取组距为0.50.5,组数为,组数为
7、9.9.当样本容量不超过当样本容量不超过100时,组数一般为时,组数一般为512组组(4 4)列频率分布表)列频率分布表.计算各小组的频率,作出下面的计算各小组的频率,作出下面的频率分布表频率分布表.(频数(频数=样本数据落在各小组内的个数样本数据落在各小组内的个数,频率频率=频数频数样本容量)样本容量)(3 3)将数据分组)将数据分组.以组距为以组距为0.50.5将数据分组时,可以分成以下将数据分组时,可以分成以下9 9组:组:0,0.5),0.5,1),0,0.5),0.5,1),4,4.5.,4,4.5.列频率分布表列频率分布表:分组分组频数累计频数累计频数频数频率频率0,0.5)0.5
8、1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5合计合计48152225146420.040.080.150.220.250.140.060.041001.00频率频率=样本容量样本容量频数频数注意注意:频频数数的的合合计计应应是是样样本本容量,容量,频率合计应是频率合计应是1.1.0.02频率频率/组距组距0.080.080.160.160.300.300.440.440.500.500.280.280.120.120.080.080.040.04 频率分布表一般分频率分布表一般分“分组分组”,“频数累计频数累计”(可省),(可省),“频数频数”,“频
9、率频率”,“频率频率/组距组距”五列,最后一行是五列,最后一行是合计合计(5)(5)画频率分布直方图画频率分布直方图.根据频率分布表可以得到如图所示的频率分布直方图根据频率分布表可以得到如图所示的频率分布直方图:月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234 频率分布是指一个样本数据在各个小范围内所占比例频率分布是指一个样本数据在各个小范围内所占比例的大小的大小.一般用频率分布直方图来反映样本的频率分布一般用频率分布直方图来反映样本的频率分布.【提升总结提升总结】频率分布直方图频率分布直方图第一步:第一步:画平面直角坐
10、标系画平面直角坐标系.第二步:第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:第三步:以以组距为宽组距为宽,各组的,各组的频率与组距的商为高频率与组距的商为高,分别画出各组对应,分别画出各组对应的小长方形的小长方形.0.100.200.400.50月均用月均用水量水量/t0.30O频率频率/组距组距0.511.52.53.54.5234各组的频率在图中哪里显示出来?各组的频率在图中哪里显示出来?各小长方形的面积各小长方形的面积=频率频率.各小长方形的面积之和是否为定值?各小长方形的面积之和是否为定值?各小长方形的面积之和为各小长方形
11、的面积之和为1.1.宽度:组距宽度:组距高度:高度:频率频率组距组距月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234 你能根据上述频率分布直方图指出居民月均你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?用水量的一些数据特点吗?【课堂探究课堂探究2 2】月均用月均用水量水量/t0.100.200.300.400.50O频率频率/组距组距0.511.52.53.54.5234大部分居民的月均用水都在大部分居民的月均用水都在1t3t之间之间 如果市政府希望如果市政府希望85%85%以上的居民每月的用水量不以上的
12、居民每月的用水量不超过标准,根据上述频率分布表,你对制定居民月超过标准,根据上述频率分布表,你对制定居民月用水量标准(即用水量标准(即a a的取值)有何建议?的取值)有何建议?88%88%的居民在的居民在3t3t以下,标准可定为以下,标准可定为3t.3t.在实际中,取在实际中,取a=3ta=3t一定能保证一定能保证85%85%以上的居民用水不以上的居民用水不超标吗?超标吗?在实际中,对统计结论是需要进行评价的在实际中,对统计结论是需要进行评价的.【课堂探究课堂探究3 3】频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t/t0.100.200.300.400.500.511.5 2
13、2.533.544.5连接频率分布直方图中各连接频率分布直方图中各小长方形上端的中点小长方形上端的中点,得到得到频率分布折线图频率分布折线图.o频率频率/组距组距频率分布折线图频率分布折线图:月均用水量月均用水量/t/t0.100.200.300.400.500.511.522.533.544.5o频率频率/组距组距利用样本频率分布对总体分布进行相应估计利用样本频率分布对总体分布进行相应估计:(1 1)上例的样本容量为)上例的样本容量为100100,如果增,如果增至至1 0001 000,其频率分布直方图的情况,其频率分布直方图的情况会有什么变化?假如增至会有什么变化?假如增至10 00010
14、 000呢?呢?(2 2)样本容量越大,这种估计越精确)样本容量越大,这种估计越精确.(3 3)当样本容量无限增大,组距无限缩小,那么频率折)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲线线图就会无限接近于一条光滑曲线总体密度曲线总体密度曲线.总体密度曲线总体密度曲线月均用水量月均用水量/t/tab(图中阴影部分的面积,表示总体在某个区间(图中阴影部分的面积,表示总体在某个区间(a,b)a,b)内内取值的百分比)取值的百分比).o频率频率/组距组距总体密度曲线和横轴总体密度曲线和横轴围成的面积之和为围成的面积之和为1 1!总体密度曲线总体密度曲线总体密度曲线反映了总
15、体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律,是研究总百分比,精确地反映了总体的分布规律,是研究总体分布的工具体分布的工具.用样本频率分布直方图去估计相应的总体分布用样本频率分布直方图去估计相应的总体分布时,时,一般样本容量越大,频率分布直方图就会无限一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值的规律,即越精确地反映了总体在各个范围内取值的百分比百分比.例、某地区为了了解知识分子的年龄结构,随机抽例、某地区为了了解知识分
16、子的年龄结构,随机抽样样3030名,其年龄分别如下:名,其年龄分别如下:3232,4343,4646,4545,3737,4242,3838,4545,4848,3939,3838,4242,4949,4444,3636,5151,3939,5656,4040,4646,4444,4747,4848,3434,4545,5151,4646,5252,4444,57.57.(1)(1)列出样本频率分布表列出样本频率分布表.(2)(2)画出频率分布直方图画出频率分布直方图.(3)(3)估计年龄在估计年龄在3737岁岁5252岁的知识分子所占的比例约岁的知识分子所占的比例约是多少是多少.解:解:(1
17、)(1)极差为极差为57-32=2557-32=25,取组距为,取组距为5 5,分为,分为5 5组组.分分 组组 频数频数 频率频率 频率频率 组距组距 3232,3737)3 0.1 0.023 0.1 0.02 37 37,4242)6 0.2 0.046 0.2 0.04 42 42,4747)12 0.4 0.0812 0.4 0.08 47 47,5252)6 0.2 0.046 0.2 0.04 52 52,5757 3 0.1 0.023 0.1 0.02 合合 计计 30 1.0030 1.00样本频率分布表:样本频率分布表:(2 2)样本频率分布直方图:)样本频率分布直方图:
18、年龄年龄0.090.090.080.080.070.070.060.060.050.050.040.040.030.030.020.020.010.01 32 37 42 47 52 57 32 37 42 47 52 57 O O(3 3)因为)因为0.2+0.4+0.2=0.80.2+0.4+0.2=0.8,故年龄在,故年龄在3737岁岁5252岁岁的知识分子约占的知识分子约占80%.80%.频率频率/组距组距2 2、总体分布指的是总体取值的频率分布规律,由、总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往于总体分布不易知道,因此我们往往用样本的频率用样本的频率分布
19、去估计总体的分布分布去估计总体的分布.1、频率分布直方图的步骤:、频率分布直方图的步骤:(1)求极值)求极值(2)决定组距与组数)决定组距与组数(3)分组)分组(4)画频率分布表(频数,频率,)画频率分布表(频数,频率,频率与组距频率与组距的商的商)(5)画频率分布直方图)画频率分布直方图1.1.将样本容量为将样本容量为100100的数据按从大到小的顺序分为的数据按从大到小的顺序分为8 8组组如下表:如下表:9 91212131315151414141413131010频数频数8 87 76 65 54 43 32 21 1组号组号则第三组的频率为(则第三组的频率为()A.0.14 B.1/14 C.0.03 D.3/14A.0.14 B.1/14 C.0.03 D.3/142.(20132.(2013辽宁高考)某班的全体学生参加英语测试,辽宁高考)某班的全体学生参加英语测试,成绩的频率分布直方图如图,成绩的频率分布直方图如图,数据的分组依次为数据的分组依次为若低于若低于6060分的人数是分的人数是1515,则该班的学生人数是则该班的学生人数是()()A.45 B.50 C.55 D.60A.45 B.50 C.55 D.60成绩成绩/分分B B优化探究第优化探究第31页探究一、探究二页探究一、探究二C C
©2010-2025 宁波自信网络信息技术有限公司 版权所有
客服电话:4009-655-100 投诉/维权电话:18658249818