1、第,10,章 第二节,高考数学总复习,北师大版,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,二 节,统计图表、数据的数字,特征和用样本估计总体,4,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想,5,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题,1.(2011,四川理,,1),有一个容量为,66,的样本,数据的分组及各组的频数如下:,11.5,15.5),2,15.5,19.5),4,19.5,23.5),9,23.5,27.5),18,27.5,31.5),11 31
2、5,35.5)12 35.5,39.5),7,39.5,43.5),3,根据样本的频率分布估计,数据落在,31.5,43.5),的概率约是,(,),2,若某校高一年级,8,个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是,(,),A,91.5,和,91.5,B,91.5,和,92,C,91,和,91.5 D,92,和,92,答案,A,3,(,文,)(2010,山东文,),在某项体育比赛中,七位裁判为一选手打出的分数如下:,90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为,(,),A,92,2 B,92,2.8,C,93,
3、2 D,93,2.8,答案,B,(,理,),如图,是,2011,年中央电视台举办的挑战主持人大赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为,(,),A,84,4.84,B,84,1.6,C,85,1.6 D,85,4,答案,C,4,一个社会调查机构就某地居民的月收入调查了,10 000,人,并根据所得数据画了样本的频率分布直方图,(,如图,),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这,10 000,人中再用分层抽样的方法抽出,200,人作进一步调查,其中低于,1 500,元的称为低收入者,高于,3 000,元的称为高收
4、入者,则应在低收入者和高收入者中分别抽取的人数是,(,),答案,C,解析,由图可知,低收入者的频率是,0.000 2,500,0.1,,故应在低收入者中抽取,200,0.1,20,人;高收入者的频率是,(0.000 3,0.000 1),500,0.2,,故应在高收入者中抽取,200,0.2,40,人,5,某棉纺厂为了了解一批棉花的质量,从中随机抽取了,100,根棉花纤维的长度,(,棉花纤维的长度是棉花质量的重要指标,),,所得数据都在区间,5,40,中,其频率分布直方图如右图所示,则在抽样的,100,根中,有,_,根棉花纤维的长度小于,20 mm.,答案,30,解析,本题主要考查频率分布直方
5、图的应用,从而考查考生的识图与用图能力,同时也考查了考生的数据处理能力和分析解决问题的能力,由题意知,棉花纤维的长度小于,20mm,的频率为,(0.01,0.01,0.04),5,0.3,,故抽测的,100,根中,棉花纤维的长度小于,20mm,的有,0.3,100,30(,根,),6,从某自动包装机包装的食盐中,随机抽取,20,袋,测得各袋的质量分别为,(,单位:,g),:,492,496,494,495,498,497,501,502,504,496,497,503,506,508,507,492,496,500,501,499,根据用频率分布估计总体分布的原理,该自动包装机包装的袋装食盐质
6、量在,497.5g,501.5g,之间的概率约为,_,答案,0.25,7,为了了解高一女生的体能情况,我校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为,1:2:87:4:3,,第二小组频数为,12.,(1),第二小组的频率是多少?样本容量是多少?,(2),若次数在,120,以上,(,含,120,次,),为优秀,试估计该学校全体高一学生的优秀率是多少?,频率分布直方图,(1),列出频率分布表;,(2),画出频率分布直方图;,(3),估计电子元件寿命在,100h,400h,以内的概率;,(4),估计电子元件寿命在,400h,以上的概率,
7、解析,(1),样本频率分布表如下:,寿命,(,h,),频数,频率,100,200,20,0.10,200,300,30,0.15,300,400,80,0.40,400,500,40,0.20,500,600,30,0.15,合计,200,1,(2),频率分布直方图,(3),由频率分布表可以看出,寿命在,100h,400h,的电子元件出现的频率为,0.65,,所以我们估计电子元件寿命在,100h,400h,的概率为,0.65.,(4),由频率分布表可知,寿命在,400h,以上的电子元件出现的频率为,0.20,0.15,0.35,,故我们估计电子元件寿命在,400h,以上的概率为,0.35.,点
8、评,解决总体分布估计问题的一般程序为:当总体中所取不同的数值较少时,常用条形图表示相应样本的频率分布,否则常用频率分布直方图表示相应样本的频率分布,具体步骤为:,组别,频数,频率,145.5,149.5,1,0.02,149.5,153.5,4,0.08,153.5,157.5,20,0.40,157.5,161.5,15,0.30,161.5,165.5,8,0.16,165.5,169.5,m,n,合计,M,N,(3),直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于,1,,即频率之和为,1,,由此可以估计样本数据落在某个区间的频率或概率或者总体的数字特征
9、茎叶图,点评,从茎叶图可看出,甲车间产品重量主要集中在,98,103,之间,而乙车间产品重量分布则较分散,故不计算方差也可直观作出判断:甲车间产品较稳定,用样本分布估计总体的分布,(1),把上述数据分组,列出频率分布表;,(2),根据,(1),的结果画频率分布直方图和频率分布折线图;,(3),结合上面的描述,分析该年度香皂销售的分布情况,解析,(1),频率分布表如下:,点评,(1),频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观,(2),用样本的频率分布可以估计相应的概率分布,分组,500,,,900),900,,,1100),1100,,,1300),130
10、0,,,1500),1500,,,1700),1700,,,1900),1900,,,),频数,48,121,208,223,193,165,42,频率,(1),将各组的频率填入表中;,(2),根据上述统计结果,计算灯管使用寿命不足,1500,小时的频率,解析,(1),(2),由,(1),可得,0.048,0.121,0.208,0.233,0.6,,所以灯管使用寿命不足,1500,小时的频率为,0.6.,分组,500,,,900),900,,,1100),1100,,,1300),1300,,,1500),1500,,,1700),1700,,,1900),1900,,,),频数,48,12
11、1,208,223,193,165,42,频率,0.048,0.121,0.208,0.223,0.193,0.165,0.042,用样本的数字特征估计总体的数字特征,点评,(1),平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小,(2),由,s,s,可知乙的成绩较稳定从折线图看,甲成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高,1,不要把直方图错画为条形图,两者的区别在于条形图是离散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变量,纵坐标刻
12、度为频率,/,组距,这是密度连续随机变量在某一点上是没有频率的,2,用样本频率分布来估计总体分布的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计,3,几种表示频率分布的方法的优点与不足;,(1),频率分布表在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便,(2),频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式但从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了,(3),频率折线图的优点是它反映了数据的变化趋势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线,(4),用茎叶图优点是原有信息不会抹掉,能够展示数据的分布情况,但当样本数据较多或数据数较多时,茎叶图显得不太方便了,4,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差,






