1、单击此处编辑母版文本样式,了解频率分布的意义和作用,会列频率分布表,会画频率分布直方图、频率分布折线图、茎叶图,理解它们各自的特点,/,理解样本数据标准差的意义和作用,会计算数据标准差,/,能从样本数据中提取基本的数字特征,(,如平均数、标准差,),,并给出合理的解释,/,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想,/,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题,第,2,课时,总体分布的估计、总体特征数的估计,1,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折,线图和茎叶图,会用样本的基本数字
2、特征估计总体的基本数字特征,2,能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征,(,如平均数、标准差,),,并做出合理地解释,【,命题预测,】,3,初步了解如何运用数学知识和方法进行统计研究,提高统计的准确性和科,学性;正确理解样本数据标准差的意义和作用,学会计算数据的标准差,4,掌握从实际问题中提取数据,利用样本数据对总体水平作出估计的方法,1,画频率分布直方图的基本步骤是:,(1),求极差;,(2),决定组距与组数;,(3),将,数据分组;,(4),列频率分布表;,(5),对每一组,求频率,/,组距,用若干小矩形的面积表示数据落在各个小组的频率的大小,其中要注意以下几个
3、问题:,(1),将数据分组,组数要力求合适,组数太多或太少,都会影响我们了解数据的分布情况;,(2),组距尽可能,“,取整,”,,组数可,“,进一,”,;,(3),分点比数据多一位小数,并把第一组的下限,“,略,”,去或起点微减,使样本数据都落在所分组的内部;,(4),各小长方形的面积的总和等于,1.,【,应试对策,】,(1),频率分布直方图能够很容易地表示大量数据,非常直观地表明分布的状态,使我们能够看到的分布表中看不清楚的数据模式,但是从图形本身不能看出原始的数据内容,(2),频率分布折线图的优点是它反映了数据的变化趋势如果样本容量不断增大,折线图趋向于总体密度曲线,(3),用茎叶图刻画数
4、据有两个优点:一是所有的信息都可以在茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况但当样本容量较多或数据位数较多时,用茎叶图描述就显得不方便了,2,三种图形各有优点及缺点:,3,从频率分布直方图可以清楚地看出数据分布的总体趋势,但从频率分布直方,图得不出原始的数据内容,把数据表示成直方图后,原有的数据信息就被抹掉了一般情况下,平均数是直方图的重心,众数在最高小矩形的中点处,中位数的左右矩形的面积应相等,它对极端值不敏感总体密度曲线是客观存在的,但一般很难像函数图像那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确,(1),标准差的平
5、方就是方差,即,(2),方差的计算,基本公式,简化计算公式,(),或写成,即方差等于原数据平方的平均数减去平均数的平方,简化计算公式,(),4,标准差和方差的关系及计算,平均数、方差的公式推广,1,若数据,x,1,,,x,2,,,,,x,n,的平均数为 ,那么,mx,1,a,,,mx,2,a,,,mx,3,a,,,,,mx,n,a,的平均数是,m,a,.,2,数据,x,1,,,x,2,,,,,x,n,的方差为,s,2,.,数据,x,1,a,,,x,2,a,,,,,x,n,a,的方差也为,s,2,;,数据,ax,1,,,ax,2,,,,,ax,n,的方差为,a,2,s,2,.,【,知识拓展,】,
6、1,编制频率分布表的步骤,(1),求,全距,决定组距和组数,组距,.,(2),分组,通常对组内数值所在区间取,区间,最后一组,取,(3),登记频数,计算频率,列出频率分布表,前闭后开,闭区间,2,作频率分布直方图的方法,(1),先,制作频率分布表,然后作直角坐标系;,(2),把横轴分成若干段,每一线段对应一个组的,,然后以此线段为底作,一,,,它的高等于该组的,,这样得出一系列的,(3),每个矩形的面积恰好是该组的,,这些矩形就构成了频率分布直方图,矩形,频率,/,组距,矩形,频率,组距,3,茎叶图的画法要求,茎,按从小到大的顺序从上向下列出,共茎的叶一般按从小到大,(,或从大到小,),的顺序
7、列出,同行,4,平均数、标准差和方差,(1),平,均数,称为,n,个数据,a,1,,,a,2,,,,,a,n,的,或均值,一般记为,.,(2,),标准差和方差,设一组样本数据,x,1,,,x,2,,,,,x,n,,,其平均数为,,称,为这个,样本的方差,称其算术平方根,s,为,平均数,标准差,思考:,现实中的总体所包含个体数往往是很多的,如何求得总体的平均数和标,准差呢?,提示:,通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差,,这与用样本的频率分布来近似地代替总体分布是类似的,只要样本的代表性,好,这样做就是合理的,也是可以接受的,1,(2010,东北师大附中高三测试,),一
8、个容量为,20,的样本,已知某组的频率为,0.25,,则该组的频数为,_,解析:,设频数为,x,,则 ,0.25,,,x,0.25,20,5.,答案:,5,2,(2010,江苏通州市高三素质检测,),某射击运动员在四次射击中分别打出了,10,,,x,10,8,环的成绩,已知这组数据的平均数为,9,,则这组数据的方差是,_,答案:,1,3,已知一组数据:,20,30,40,50,50,60,70,80,,其中平均数、中位数、众数的大小,关系是,_,解析:,平均数 ,50,,按由小到大排列可知,,中位数是,50,,众数也是,50.,答案:,众数中位数平均数,4,(,江苏南通模拟,),甲、乙两名射击
9、运动员参加某大型运动会的预选赛,,他们分别射击了,5,次,成绩如下表,(,单位:环,),如果甲、乙两人中只有,1,人入选,则入选的最佳人选应是,_,答案:,甲,甲,10,8,9,9,9,乙,10,10,7,9,9,5,一个社会调查机构就某地居民的月收入调查了,10 000,人,并根据所得数据画了样本的频率分布直方图,(,如图,),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这,10 000,人中再用分层抽样方法抽出,100,人作进一步调查,则在,2 500,3 000)(,元,),月收入段应抽出,_,人,解析:,分析频率分布直方图可知:,1 000,1 500),频率,0.10,;,
10、1 500,2 000),频率,0.20,;,2 000,,,2 500),频率,0.25,;,2 500,3,000),频率,0.25,;,3 000,,,3 500),频率,0.15,;,3 500,,,4 000),频率,0.05,,设在,2 500,3,000),内抽,x,人,=0.25.,x=25(,人,),答案,:,25,频率分布直方图反映样本的频率分布:,(1),频率分布直方图中横坐标表示 ,纵坐标表示,频率组距,.(2),频率分布直方图中各小长方形的面积之和为,1,,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比,(3),频率分布表和频率分布直方图是一
11、组数据频率分布的两种形式,前者准确,后者直观,(4),众数为最高矩形中点的横坐标,(5),中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标,(1),列,出频率分布表;,(2),画出频率分布直方图;,(3),估计电子元件寿命在,100 h,400 h,以内的频率;,(4),估计电子元件寿命在,400 h,以上的频率,寿命,(h),100,200),200,300),300,400),400,500),500,600,个数,20,30,80,40,30,【,例,1,】,对,某电子元件进行寿命追踪调查,情况如下,.,思路点拨:,从分组中看寿命在某一范围内的电子元件的比例即寿命在该范
12、围内,的频率,解:,(1),样本频率分布表如下:,寿命,(h),频数,频率,100,200),20,0.10,200,300),30,0.15,300,400),80,0.40,400,500),40,0.20,500,600,30,0.15,合计,200,1,(2),频率分布直方图如图:,(3),电子元件寿命在,100 h,400 h,以内的频数为,130,,则频率为,=0.65.,(4),寿命在,400 h,以上的电子元件的频数为,70,,则频率为,=0.35.,变式,1,:,(,江苏省高考命题研究专家原创卷,),为,了了解某电子元件的使用寿命,抽取容量为,10 000,的样本,其频率分布
13、直方图如图所示,根据此图估计样本中该电子元件的使用寿命在,200,400,小时的数量是,_,个,解析:,由频率分布直方图知:,该电子元件的使用寿命在,200,300,小时的频率为,100,0.15,,,该电子元件的使用寿命在,300,400,小时的频率为,100,0.25,,,所以该电子元件的使用寿命在,200,400,小时的频率为,0.15,0.25,0.4,,,所以该电子元件的使用寿命在,200,400,小时的数量为,0.4,10 000,4 000.,答案:,4 000,茎是指中间的一列数,叶是从茎的旁边生长出来的数在样本数据较少时,用茎叶图表示数据的效果较好,但当样本数据较多时,茎叶图
14、就显得不太方便了,如下:,甲的得分,:,95,81,75,91,86,89,71,65,76,88,94,110,107,;,乙的得分:,83,86,93,99,88,103,98,114,98,79,101.,画出两人数学成绩的茎叶图,请根据茎叶图对两人的成绩进行比较,思路点拨:,用中间的数字表示两位同学得分的十位数或百位数,两边的数字分别表示两人每次数学考试成绩的个位数,【,例,2,】,某,中学高一,(2),班甲、乙两名同学自高中以来每次数学考试成绩情况,解:,甲,、,乙两人数学成绩的茎叶图如图所示,从这个茎叶图上可以看出,,,乙同学的得分情况是大致对称的,中位数是,98,;,甲同学的得分
15、情况除一个特殊得分外,也大致对称,中位数是,88,.,因此乙同学发挥比较稳定,总体得分情况比甲同学好,变式,2,:,(,南通市高三调研,),如,图是某兴趣小组的学生在一次数学测验中的得分茎叶图,则该组男生的平均得分与女生的平均得分之差是,_,解析:,所有男生的得分的个位上数字之和为,47,,,所以男生的总得分为,47+90,3+80,2+70,2+60,2+50,1=787,,,因此男生的平均得分为,78.7,,,同理得女生的平均得分为,77.2,,,所以男生的平均得分与女生的平均得分之差是,1.5.,答案,:,1.5,1,平均数、方差、标准差都是总体的特征数平均数能反映总体平均值的水平,方差
16、标准差用来描述波动情况常用来比较两组数据的波动大小方差较大的波动较大,方差较小的波动较小,方差的单位是原数据的单位的平方,标准差的单位与原数据的单位相同,不要漏写单位,2,直接计算总体的平均数、方差、标准差比较麻烦,有时甚至不可能,所以常用样本的这些数字特征来估计总体的数字特征,【,例,3,】,对,划艇运动员甲、乙两人在相同的条件下进行了,6,次测试,测得他们最大速度的数据如下:,甲:,27,38,30,37,35,31,;,乙:,33,29,38,34,28,36.,根据以上数据,试判断他们谁更优秀如果选一人参加比赛,你认为选谁,更合适?,思路点拨:,看哪名划艇运动员优秀,只要比较甲、乙两
17、名划艇运动员的平均,成绩即可;要比较哪名划艇运动员发挥稳定,只要看它们成绩的方差即可,,因为方差是体现一组数据波动大小的特征数,明,甲、乙两人的最大速度的平均值相同,但乙比甲更稳定,,故乙比甲更优秀选乙参加比赛更合适,8.4,9.4,9.9,9.6,9.4,9.7,.,去,掉一个最高分和一个最低分后,所剩数据的,平均值和方差分别为,_,解析:,平均数 ,9.5.,方差,s,2,(9.4,9.5),2,(9.4,9.5),2,(9.7,9.5),2,0.016.,答案:,9.5,0.016,变式,3,:,在,一次歌手大奖赛上,七位评委为歌手打出的分数如下:,9.4,,,1,用样本估计总体是统计的
18、基本思想,而频率分布表和频率分布直方图就是用,样本的频率分布去估计总体分布的两种主要方法分布表在数量表示上比较确切,直方图比较直观,2,频率分布表中的频数之和等于样本容量,各组中的频率之和等于,1,;在频率,分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小矩形的面积的和等于,1.,【,规律方法总结,】,3,用茎叶图优点是原有信息不会抹掉,能够展开数据分布情况,但当样本数据,较多或数据位数较多时,茎叶图显得不太方便,4,标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,,数据的离散程度越大,标准差、方差越小,数据的离散程度越小,因为方差,与原始数据的单位不同,且平方后
19、可能夸大了偏差的程度,所以虽然方差与 标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般 多采用标准差,.,【,例,4,】,(2009,江苏卷,),某,校甲、乙两个班级各有,5,名编号为,1,2,3,4,5,的学生进行投篮练习,每人投,10,次,投中的次数如下表:,则以上两组数据的方差中较小的一个为,s,2,_.,【,高考真题,】,学生,1,号,2,号,3,号,4,号,5,号,甲班,6,7,7,8,7,乙班,6,7,6,7,9,分析:,先计算平均数,再根据方差的计算公式进行计算,然后进行比较,规范解答:,两个班的平均数都是,7,,甲班的方差为,s,2,乙班的方差为,s,2,因为
20、故填,.,答案:,本题考查对数据稳定性的分析和方差的计算,对数据稳定性进行直观判断以比较其方差,(,标准差,),的大小在以往的高考中也有先例,如,2007,年海南、宁夏卷中:甲、乙、丙三名射箭运动员在某次测试中各射箭,20,次,三人的测试成绩如下表,【,全解密,】,甲的成绩,环数,7,8,9,10,频数,5,5,5,5,【,命题探究,】,s,1,,,s,2,,,s,3,分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有,(,),A,s,3,s,1,s,2,B,s,2,s,1,s,3,C,s,1,s,2,s,3,D,s,2,s,3,s,1,答案:,B,乙的成绩,环数,7,8,9,10,频
21、数,6,4,4,6,丙的成绩,环数,7,8,9,10,频数,4,6,6,4,平均数与方差的计算公式一组数据,x,1,,,x,2,,,,,x,n,的平均数和方差分别是:,【,知识链接,】,由于方差的大小反映的是数据组中的数据离开平均数的集中或分散的程度,数据组的方差小则表明数据偏离平均数的程度小,因此在计算该类问题时可以先根据方差的这个意义进行判断,再进行有选择的计算数据,甲班的数据有三个和平均数相等,,6,和,8,只偏离平均数,1,个单位,而乙班的数据只有,2,个和平均数相等,,6,6,9,各偏离平均数,1,1,2,个单位,显然甲班的数据偏离平均数的程度较小,故应该是甲班的方差较小,直接计算甲
22、班的方差即可,【,方法探究,】,方差计算相对繁琐,容易出现计算上的错误,方差公式和平均数公式中都有,个 ,在计算时不要忘了,.,【,误点警示,】,1,某单位年收入在,10 000,到,15 000,、,15 000,到,20 000,、,20 000,到,25 000,、,25 000,到,30 000,、,30 000,到,35 000,、,35 000,到,40 000,及,40 000,到,50 000,元之间的职工所占的比分别为,10%,15%,20%,25%,15%,10%,和,5%,,试估计该单位职工的平均年收入,分析,:题中的比就是各组的频率,用各组中值来近似表示组内平均值,从而
23、用公式直接计算平均年收入,解:,估,计该单位职工的平均年收入为:,12 500,10%,17 500,15%,22 500,20%,27 500,25%,32 500,15%,37 500,10%,45 000,5%,26 125(,元,),故估计该单位人均年收入均为,26 125,元,2,从甲、乙两种玉米苗中各抽,10,株,测得它们的株高的茎叶图如右图,(,单位:,cm),问:,(1),哪种玉米的苗长得高?,(2),哪种玉米的苗长得整齐?,分析,:首先由茎叶图读出数据,计算平均数,注意简便算法,然后求标准差,再依据结果比较看哪种玉米的苗长得高,只要比较甲、乙两种玉米的平均高度即可;要比较哪种
24、玉米的苗长得比较整齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波动大小的特征数,解:,(1),甲,(25,41,40,37,22,14,19,39,21,42),30(cm),,,乙,(27,16,44,27,44,16,40,40,16,40),31(cm),甲,乙,(2),s,(25,30),2,(41,30),2,(40,30),2,(37,30),2,(22,30),2,(14,30),2,(19,30),2,(39,30),2,(21,30),2,(42,30),2,104.2(cm,2,),,,s,(2,27,2,3,16,2,3,40,2,2,44,2,),10,31,2,128.8(cm,2,),所以,乙种玉米苗长得高,甲种玉米苗长得整齐,点击此处进入 作业手册,






