资源描述
单击此处编辑母版文本样式,第一章,5,、,6,成才之路,高中新课程,学习指导,北师大版,数学,必修,3,单击此处编辑母版文本样式,第一章统计,成才之路,高中新课程,学习指导,北师大版,数学,必修,3,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,成才之路,数学,路漫漫其修远兮 吾将上下而求索,北师大版,必修,3,统计,第一章,5,用样本估计总体,6,统计活动:结婚年龄的变化,第一章,课堂典例讲练,2,易错疑难辨析,3,课后强化作业,4,课前自主预习,1,课前自主预习,据汽车工业协会统计,,2014,年上半年汽车生产,952.92,万辆,同比增长,4.08%,,同比增幅提高,1.6,个百分点;汽车销售,959.81,万辆,同比增长,2.93%,,同比增幅下降,0.4,个百分点,.1,、,2,季度汽车销售分别为,479.55,万辆和,480.62,万辆,,1,季度同比下降,3.89%,2,季度同比增长,10.03%,2,季度较,1,季度增速提高了,13.92,个百分点,.6,月汽车生产,153.13,万辆,同比增长,9.09%,,环比下降,2.37%,;销售,157.75,万辆,同比增长,9.86%,,环比下降,1.66%.,以上数据就是通过用样本来估计总体来实现对总体的估计,这就是我们本节要学习的内容,.,1,估计总体的分布,(1),要估计总体频率分布情况,我们常用,_,、,_,、,_,来估计,频率分布表,频率分布直方图,频率折线图,x,i,f,i,1,(3),在频率分布直方图中,按照分组的原则,再在左边和右边各加一个区间,从所加的左边区间的,_,开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就得到一条折线,我们称之为,_,(4),当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的,_,也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越准确,(5),随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之,_,,相应的频率折线图就会越来越接近于一条,_,中点,频率折线图,概率,减小,光滑曲线,样本平均数,样本标准差,(2),利用随机抽样得到样本,从样本数据得到的分布、均值和标准差,(,通常称之为样本分布、样本平均数和样本标准差,),并不是总体真正的分布、平均数和标准差,而只是总体的一个,_,,但这种估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息,估计,1,下列关于频率分布直方图中小矩形的高的说法正确的是,(,),A,表示该组上的个体在样本中出现的频率,B,表示取某数的频率,C,表示该组上的个体数与组距的比值,D,表示该组上的个体在样本中出现的频率与组距的比值,答案,D,解析,频率分布直方图中小矩形的高是频率与组距的比,面积才表示频率,故选,D.,2,观察新生婴儿的体重,其频率分布直方图如下图所示,则新生婴儿体重,(,单位:,g),在,2700,3000),内的频率为,(,),A,0.001,B,0.1,C,0.2D,0.3,答案,D,解析,频率分布直方图中,各小矩形的面积等于相应各组的频率由频率分布直方图可知,在区间,2700,3000),内取值的频率为,(3000,2700),0.001,0.3.,3,一个容量为,80,的样本最大值是,140,,最小值是,51,,组距为,10,,则可以分成,(,),A,10,组,B,9,组,C,8,组,D,7,组,答案,B,4,为了解一片经济林的生长情况,随机测量了其中,100,株树木的底部周长,(,单位:,cm),根据所得的数据画出样本的频率分布直方图,(,如图所示,),,那么在这,100,株树木中,底部周长小于,110cm,的株数是,_,答案,70,解析,底部周长小于,110cm,的株数是落在前三个区间的数目,相对应的小长方形的面积的和为,(0.01,0.02,0.04),10,0.7,,此即为,100,株树木中底部周长小于,110cm,的株数的频率,故所求株数为,100,0.7,70.,5,若用样本数据,1,、,0,、,1,、,2,、,1,、,3,来估计总体的标准差,则总体的标准差估计值是,_,课堂典例讲练,思路分析,由题目可获取以下主要信息:,样本数据给出,容量为,20,;,样本数据中,最大值是,30,,最小值是,21,,解答本题可根据极差,选择适当的组距进行分组,然后列表、画图即可,频率分布表与频率分布直方图,列出频率分布表如下:,(2),样本的频率分布直方图如下:,规律总结,1.,掌握画频率分布直方图的步骤,频率分布直方图的处理与坐标系的单位长度有关,为了图形的直观性,要注意单位长度,2,要掌握频率分布直方图的特点,尤其是面积表示频率,3,由频率分布直方图得到的频率是不准确的,只能估计出可能性,它把原始数据特征丢失了,只能分析出哪部分数据出现的较多或较少,分析不出具体的数据,有一容量为,200,的样本,数据的分组以及各组的频数如下:,20,,,15),,,7,;,15,,,10),,,11,;,10,,,5),,,15,;,5,0),,,40,;,0,5),,,49,;,5,10),,,41,;,10,15),,,20,;,15,20),,,17.,(1),列出样本的频率分布表;,(2),画出频率分布直方图;,(3),求样本数据不足,0,的频率,分析,由于分组已确定,可由频数分别求出各组的频率,列表、作图,解析,(1),频率分布表如下:,分组,频数,频率,累积频率,20,,,15),7,0.035,0.035,15,,,10),11,0.055,0.090,10,,,5),15,0.075,0.165,5,0),40,0.200,0.365,0,5),49,0.245,0.610,5,10),41,0.205,0.815,10,15),20,0.100,0.915,15,20),17,0.085,1.00,合计,200,1.00,(2),频率分布直方图如下图所示,点评,(1),频率分布直方图用各小矩形的面积表示相应各组的频率;,(2),不足,0,的频率即为符合条件的个体的频数占样本容量的比例,.,折线图及应用,(1),列出样本的频率分布表;,(2),画出频率折线图;,(3),估计该校同龄男同学的身高状况,规范解答,(1),在这个样本中,最大值为,181,,最小值是,157,,它们的差是,24,,可以取组距为,4 cm,,分成,7,组,根据题意列出样本的频率分布表如下:,分组,频数,频率,156.5,160.5,3,0.06,160.5,164.5,4,0.08,164.5,168.5,12,0.24,168.5,172.5,13,0.26,172.5,176.5,13,0.26,176.5,180.5,3,0.06,180.5,184.5,2,0.04,合计,50,1.00,(2),根据上表,画出如图所示的频率分布直方图,连接各个小矩形的顶端中点得频率折线图,(3),由样本的频率折线图和频率分布表可以估计该校同龄男同学的身高多数集中在,164cm,到,177cm,之间,规律总结,(1),频率折线图能直观地反映数据的增减或变化趋势,(2),按照步骤绘制频率分布直方图和频率分布折线图,分组要尽量取整,当数据为,30,100,个时应分,5,12,组为宜,(3),画图时,横轴和纵轴的单位可不一致,有一个容量为,100,的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:,起始月薪,(,百元,),13,14),14,15),15,16),16,17),频数,7,11,26,23,起始月薪,(,百元,),17,18),18,19),19,20),20,21),频数,15,8,4,6,(1),列出样本的频率分布表;,(2),画出频率分布直方图和频率分布折线图;,(3),根据频率分布估计该校毕业生起始月薪低于,2 000,元的频率,解析,(1),样本的频率分布表为,起始月薪,(,百元,),频数,频率,13,14),7,0.07,14,15),11,0.11,15,16),26,0.26,16,17),23,0.23,17,18),15,0.15,18,19),8,0.08,19,20),4,0.04,20,21),6,0.06,合计,100,1.00,(2),频率分布直方图和频率分布折线图如下图,(3),起始月薪低于,2 000,元的频率为,0.07,0.11,0.04,0.94,,,故起始月薪低于,2 000,元的频率的估计是,0.94.,频率分布直方图的应用,(1),本次活动共有多少件作品参加评比?,(2),哪组上交的作品数最多?有多少件?,(3),经过评比,第四组和第六组分别有,10,件、,2,件作品获奖,这两组哪组获奖率较高?,思路分析,本题给出了频率分布直方图,长方形高的比即面积比,以及第三组的频数为,12.,解答时可先由第三小组入手,再利用长方形高的比即面积比,从而得到各小组频率的比解决问题,为了解小学生的体能情况,抽取了某小学同一年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图如下图,已知图中从左到右前三个小组的频率分别是,0.1,0.3,0.4,,第一小组的频数为,5.,(1),求第四小组的频率,(2),问参加这次跳绳测试的学生人数,n,是多少?,(3),问在这次测试中,学生跳绳次数的中位数落在第几小组内?,解析,(1),第四小组的频率,1,(0.1,0.3,0.4),0.2.,(2),n,第一小组的频数,第一小组的频率,50.1,50.,(3),因为,0.1,50,5,0.3,50,15,0.4,50,20,,,0.2,50,10,,即第一、第二、第三、第四小组的频数分别为,5,15,20,10.,所以学生跳绳次数的中位数落在第三小组内,.,估计总体的分布,思路分析,把数据直接代入公式求解,进而估计两名运动员的射击情况,规律总结,样本的平均数和标准差是两个重要的数字特征在应用平均数和标准差解决实际问题时,若平均数不同,则直接应用平均数比较优劣;若平均数相同,则要由标准差研究其与平均数的偏离程度,为了了解,中华人民共和国道路交通安全法,在学生中的普及情况,调查部门将某校,12,名学生分为两组进行问题卷调查,第一组的得分情况为:,5,6,7,8,9,10,;,第二组的得分情况为:,4,6,7,9,9,10.,根据以上数据,判断两组中哪组更优秀?,统计活动中的数据分析,景点,A,B,C,D,E,原价,/,元,10,10,15,20,25,现价,/,元,5,5,15,25,30,日平均人数,/10,3,人,1,1,2,3,2,(1),该风景区称调整前后这,5,个景点门票的平均收费不变,日平均收入持平,问风景区是怎样计算的?,(2),另一方面,游客认为调整收费后风景区的日平均总收入相对于调价前,实际上增加了约,9.4%,,问游客是怎样计算的?,(3),你认为风景区和游客哪一个的说法较能反映整体实际?,思路分析,按照以下步骤操作:列出五个景点门票调整前后的价格,求调整前后的平均价格,统计日平均人数,计算日平均收入,分析数据,规律总结,(1),统计活动中的数据分析,可以分析数据中的平均值、方差、标准差、中位数、众数等数字特征数,从而全面把握总体情况,(2),统计活动中的数据分析,可以采用图表来分析,如条形图、扇形图、折线图、直方图以及茎叶图等,这样得到的结果更直观,更能体现出各部分所占的份量,在一次人才招聘会上,某公司的招聘人员告诉你:,“,我们公司员工的收入水平很高去年,在,50,名员工中,最高年收入达到,100,万元,他们年收入的平均数是,3.5,万元,”,,如果你希望获得年收入,2.5,万元,(1),判断自己能否成为此公司的一名高收入者?,(2),如果招聘人员继续告诉你:,“,员工年收入的变化范围是从,0.5,万元到,100,万元,”,,这个信息能否足以使你作出自己是否受聘的决定?为什么?,(3),如果招聘人员继续给你提供了如下的信息:,“,员工中年收入在中间,50%(,即去掉最少的,25%,和最多的,25%,后所剩下的,),在变化范围是从,1,万元到,3,万元,”,,你又该如何使用这条信息来作出自己是否受聘的决定?,(4),你能估计出该公司员工年收入的中位数是多少吗?为什么平均数比估计出的中位数高很多?,(2),不能,要看中位数是多少,(3),能受聘可以确定有,75%,的员工年收入在,1,万元以上,其中,25%,的员工年收入在,3,万元以上,(4),年收入的中位数大约是,2,万元因为有年收入,100,万元这个极端值的影响,使得年收入平均数比中位数高许多,易错疑难辨析,错解,由频率分布直方图可知,数据落在,15.5,18.5),内的频率为,0.054,,落在,18.5,21.5),内的频率为,0.06,,落在,21.5,24.5),内的频率为,0.075.,所以数据落在,15.5,24.5),内的数量有,500,(0.054,0.06,0.075),94.5,,所以估计数据落在,15.5,24.5),内的数量大约有,95,个,正解,由频率分布直方图可知,数据分成,7,组,其组距为,3,,,所以数据落在,15.5,18.5),内的频率为,0.054,3,,落在,18.5,21.5),内的频率为,0.06,3,,落在,21.5,24.5),内的频率为,0.075,3.,所以数据落在,15.5,24.5),内的数量有,500,(0.054,3,0.06,3,0.075,3),283.5.,所以估计数据落在,15.5,24.5),内的数量大约有,284,个,
展开阅读全文