1、学案57 用样本估量总体 导学目标: 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估量总体分布,会用样本的基本数字特征估量总体的基本数字特征,理解用样本估量总体的思想.5.会用随机抽样的基本方法和样本估量总体的思想解决一些简洁的实际问题. 自主梳理 1.在频率分布直方图中,纵轴表示__________________,数据落在各小组内的频率用________________
2、表示,全部长方形面积之和________. 2.作频率分布直方图的步骤 (1)求极差(即一组数据中________与________的差); (2)打算________与________; (3)将数据________; (4)列________________; (5)画________________. 3.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的________,就得频率分布折线图. (2)总体密度曲线:随着__________的增加,作图时____________增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线
3、统计中称这条光滑曲线为总体密度曲线. 4.当样本数据较少时,茎叶图表示数据的效果较好,一是统计图上没有原始数据丢失,二是便利记录与表示,但茎叶图一般只便于表示两位有效数字的数据. 5.众数、中位数、平均数 (1)在一组数据中,毁灭次数________的数据叫做这组数据的众数. (2)将一组数据按大小依次排列,把处在________位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数. (3)假如有n个数x1,x2,……,xn,那么=____________叫做这n个数的平均数. 6.标准差和方差 (1)标准差是样本数据到平均数的一种____________. (2)标
4、准差:s= ________________________. (3)方差:s2=________________________________(xn是样本数据,n是样本容量,是样本平均数). 自我检测 1.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组在频率分布直方图的高为h,则|a-b|等于( ) A.hm B. C. D.h+m 2.(2010·福建)若某校高一班级8个班参与合唱竞赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( ) A.91.5和91.5 B.91.5和92
5、 C.91和91.5 D.92和92 3.(2011·滨州模拟)在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为( ) A.32 B.0.2 C.40 D.0.25 4.(2010·山东)样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为( ) A. B. C. D.2 5.(2010·江苏)某棉纺厂为了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均
6、在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm. 探究点一 频率分布直方图 例1 (2011·福州调研)如图是某市有关部门依据该市干部的月收入状况,作抽样调查后画出的样本频率分布直方图,已知图中第一组的频数为4 000,请依据该图供应的信息解答下列问题:(图中每组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)) (1)求样本中月收入在[2 500,3 500)的人数; (2)为了分析干部的收入与年龄、职业等方面的关系,必需从样本的各组中按月收入再用分层抽样方法抽出100人作进一步分析,则
7、月收入在[1 500,2 000)的这段应抽多少人? (3)试估量样本数据的中位数. 变式迁移1 为了解某校高三同学的视力状况,随机地抽查了该校100名高三同学的视力状况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的同学数为b,则a,b值分别为( ) A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83 探究点二 用样本数字特征估量总体数字特征 例2 甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的
8、测试成果如表所示: 甲的成果 环数 7 8 9 10 频数 5 5 5 5 乙的成果 环数 7 8 9 10 频数 6 4 4 6 丙的成果 环数 7 8 9 10 频数 4 6 6 4 s1、s2、s3分别表示甲、乙、丙三名运动员这次测试成果的标准差,则有( ) A.s3>s1>s2 B.s2>s1>s3 C.s1>s2>s3 D.s2>s3>s1 变式迁移2 甲、乙两名射击运动员参与某大型运动会的预选赛,他们分别射击了5次,成果如下表(单位:环): 甲 10 8 9 9
9、 9 乙 10 10 7 9 9 假如甲、乙两人中只有1人入选,则入选的最佳人选应是________. 探究点三 用茎叶图分析数据 例3 随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图. (1)依据茎叶图推断哪个班的平均身高较高; (2)计算甲班的样本方差; (3)现从乙班这10名同学中随机抽取两名身高不低于173 cm的同学,求身高为176 cm的同学被抽中的概率. 变式迁移3 (2011·汉沽模拟)某班甲、乙两同学的高考备考成果如下: 甲:512 554 528
10、549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531 (1)用茎叶图表示两同学的成果; (2)分别求两同学成果的中位数和平均分. 1.几种表示频率分布的方法的优点与不足: (1)频率分布表在数量表示上比较精确 ,但不够直观、形象,分析数据分布的总体态势不太便利. (2)频率分布直方图能够很简洁地表示大量数据,格外直观地表明分布的外形,使我们能够看到在分布表中看不清楚的数据模式.但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据
11、信息就被抹掉了. (3)频率分布折线图的优点是它反映了数据的变化趋势,假如样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线. (4)用茎叶图优点是原有信息不会抹掉,能够呈现数据的分布状况,但当样本数据较多或数据位数较多时,茎叶图就显得不太便利了. 2.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,由于方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多接受标准差. (满分:75分) 一、选
12、择题(每小题5分,共25分)
1.(2010·陕西)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则( )
A.A>B,sA>sB B.AsB
C.A>B,sA
13、三同学的视力状况,随机地抽查了该校100名高三同学的视力状况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后五组频数和为62,设视力在4.6到4.8之间的同学数为a,最大频率为0.32,则a的值为( ) A.64 B.54 C.48 D.27 4.下图是某学校进行的运动会上,七位评委为某体操项目打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( ) A.84,4.84 B.84,1.6 C.85,1.6 D.85,4 5.(2011·四川)有一个容量为66的样本,数据的分组及各组的频数如下:
14、 [11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3 依据样本的频率分布估量,数据落在[31.5,43.5)的概率约是( ) A. B. C. D. 二、填空题(每小题4分,共12分) 6.(2010·天津)甲、乙两人在10天中每天加工零件的个数用茎叶图表示如下图,中间一列的数字表示零件个数的十位数,两边的数字表示零件个数的个位数,则这10天甲、乙两人日加工零件的平均数分别
15、为______和_________________________. 7.(2010·福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n等于________. 8.(2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s2=________. 三、解答题(共38分) 9.(12分)甲、乙两人参与某体育项目训练,近期的五次测试成果得分状况如图所示. (1)分别求出两人得分的平均数与方差; (2)依据图和上面算得的结果,对两人的训练成果
16、作出评价. 10.(12分)(2010·湖北)为了了解一个小水库中养殖的鱼的有关状况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示). (1)在下面表格中填写相应的频率; 分组 频率 (2)估量数据落在中的概率为多少; (3)将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请依据这一状况来估量该水库中鱼的总条数.
17、 11.(14分)(2010·安徽)某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物): 61,76,70,56,81,91,92,91,75,81,88,67,101,103,95, 91,77,86,81,83,82,82,64,79,86,85,75,71,49,45. (1)完成频率分布表. (2)作出频率分布直方图. (3)依据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为略微污染;在151~200之间时,为轻度污染. 请你依据所给数据和上述标准,对该市的空
18、气质量给出一个简短评价. 学案57 用样本估量总体 自主梳理 1.频率与组距的比值 小长方形的面积 等于1 2.(1)最大值 最小值 (2)组距 组数 (3)分组 (4)频率分布表 (5)频率分布直方图 3.(1)中点 (2)样本容量 所分的组数 5.(1)最多 (2)中间 (3) 6.(1)平均距离 (2) (3)[(x1-)2+(x2-)2+…+(xn-)2] 自我检测 1.C 2.A 3.A 4.D 5.30 课堂活动区 例1 解题导引 (1)解关于图形信息题的关键是正确理解各种统计图表中各个量的含义,机敏运用这些信息和数据去发觉结论. (2)在频率分布直方
19、图中,最高矩形的中点对应值是众数;而中位数的左右两边的直方图面积相等;平均数是直方图的“重心”. 解 (1)∵月收入在[1 000,1 500)的概率为0.000 8×500=0.4,且有4 000人, ∴样本的容量n==10 000; 月收入在[1 500,2 000)的频率为0.000 4×500=0.2; 月收入在[2 000,2 500)的频率为0.000 3×500=0.15; 月收入在[3 500,4 000)的频率为0.000 1×500=0.05. ∴月收入在[2 500,3 500)的频率为 1-(0.4+0.2+0.15+0.05)=0.2. ∴样本中月收入
20、在[2 500,3 500)的人数为 0.2×10 000=2 000. (2)∵月收入在[1 500,2 000)的人数为 0.2×10 000=2 000, ∴再从10 000人中用分层抽样方法抽出100人, 则月收入在[1 500,2 000)的这段应抽取100×=20(人). (3)由(1)知月收入在[1 000,2 000)的频率为0.4+0.2=0.6>0.5, ∴样本数据的中位数为 1 500+=1 500+250=1 750(元). 变式迁移1 A [由频率分布直方图知组距为0.1. 4.3~4.4间的频数为100×0.1×0.1=1. 4.4~4.5间的
21、频数为100×0.1×0.3=3. 又前4组的频数成等比数列,∴公比为3. 从而4.6~4.7间的频数最大,且为1×33=27. ∴a=0.27. 依据后6组频数成等差数列,且共有100-13=87(人). 设公差为d,则6×27+d=87. ∴d=-5,从而b=4×27+×(-5)=78.] 例2 B [由已知可得甲、乙、丙的平均成果均为8.5. 方法一 ∵s=[(x1-)2+(x2-)2+…+(xn-)2], ∴s1= =. 同理s2=,s3=,∴s2>s1>s3. 方法二 ∵s=(x+x+…+x)-2, ∴s=(5×72+5×82+5×92+5×102)-8
22、52=73.5-72.25=1.25=, ∴s1=.同理s2=,s3=, ∴s2>s1>s3.] 变式迁移2 甲 解析 甲=乙=9,s=[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=, s=[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=>s,故甲更稳定,故选甲. 例3 解题导引 茎叶图在样本数据较少,较为集中且位数不多时比较适用.由于它较好地保留了原始数据,所以可以挂念我们分析样本数据的大致频率分布,还可以用来分析样本数据的一些数字特征.但当样本数据较多时,茎叶图就显得不太便利了.由于数据较多时,枝叶就会很长,需要占据
23、较多的空间. 解 (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间.因此乙班平均身高高于甲班. (2)= =170, 甲班的样本方差为 [(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2. (3)设身高为176 cm的同学被抽中的大事为A, 从乙班10名同学中抽中两名身高不低于173 cm的同学有:(181,173),(181,176),(181,178),(1
24、81,179),(179,173),(179,176),(179,178),(178,173),(178,176),(176,173)共10个基本大事,而大事A含有4个基本大事,∴P(A)==. 变式迁移3 解 (1)两同学成果的茎叶图如图所示. (2)将甲、乙两同学的成果从小到大排列为: 甲:512 522 528 534 536 538 541 549 554 556 乙:515 521 527 531 532 536 543 548 558 559 从以上排列可知甲同学成果的中位数为 =537. 乙同学成果的中位数为=534. 甲同学成果的平均分为 500+=537
25、 乙同学成果的平均分为 500+=537. 课后练习区 1.B [A中的数据都不大于B中的数据,所以AsB.] 2.D [平均数a=(15+17+14+10+15+17+17+16+14+12)=14.7. 中位数b=15,众数c=17.∴c>b>a.] 3.B [前两组中的频数为100×(0.05+0.11)=16. ∵后五组频数和为62,∴前三组为38. ∴第三组为22.又最大频率为0.32的最大频数为0.32×100=32,∴a=22+32=54.] 4.C [去掉最高分93,最低分79, 平均数为(84+84+
26、86+84+87)=85, 方差s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]==1.6.] 5.B [由条件可知,落在[31.5,43.5)的数据有12+7+3=22(个),故所求概率约为=.] 6.24 23 解析 甲=(10×2+20×5+30×3+17+6+7)=24, 乙=(10×3+20×4+30×3+17+11+2)=23. 7.60 解析 ∵第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,∴前三组频数为·n=27,故n=60. 8.3.2 解析 ==7,∴s2=[(10-7)2+(6-7)2+(8-7)
27、2+(5-7)2+(6-7)2]==3.2. 9.解 (1)甲、乙两人五次测试的成果分别为: 甲 10分 13分 12分 14分 16分 乙 13分 14分 12分 12分 14分 甲、乙两人的平均成果甲=乙,都是13分,(4分) s=[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s=[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (8分) (2)由s>s,可知乙的成果较稳定. 从折线图看,甲的成果基本上呈上升状态,而乙的成果在平均线上下波动,可知甲的成果在不断提高,
28、而乙的成果则无明显提高.(12分) 10.解 (1)依据频率分布直方图可知,频率=组距×(频率/组距),故可得下表: 分组 频率 0.05 0.20 0.28 0.30 0.15 0.02 (6分) (2)由于0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47.(9分) (3)由于=2 000, 所以水库中鱼的总条数约为2 000.(12分) 11.解 (1)频率分布表: 分组 频数 频率 [41,51) 2 [51,61) 1 [61,71) 4 [71,81) 6 [81,91) 10 [91,101) 5 [101,111) 2 (5分) (2)频率分布直方图如图所示. (10分) (3)答对下述两条中的一条即可: ①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的;有26天处于良的水平,占当月天数的;处于优或良的天数为28,占当月天数的.说明该市空气质量基本良好. ②略微污染有2天,占当月天数的;污染指数在80以上的接近略微污染的天数15,加上处于略微污染的天数2,占当月天数的,超过50%;说明该市空气质量有待进一步改善.(14分)






