资源描述
<p>,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,北师大版八年级数学,(,上,),数据的分析,从统计图分析数据的集中趋势,数据的离散程度,平均数,中位数与众数,日常生活中,我们常用,平均数,表示一组数据的“平均水平”,概念一:,一般地,对于,n,个数,x,1,x,2,x,n,,我们把,(x,1,+x,2,+,+x,n,)/n,叫做这,n,个数的,算术平均数,,简称平均数。,想一想,小明是这样计算东方大鲨鱼队队员的平均年龄的:,年龄,/,岁,16,18,21,23,24,26,29,34,相应队员数,1,2,4,1,3,1,2,1,平均年龄,=(161+182+214+231+243+261+292+341,),(,1+2+4+1+3+1+2+1,),23.3,(岁),例一、某广告公司欲招聘广告策划人员一名,对,A,B,C,三名候选人进行了三项素质测试,他们的各项测试成绩如下表所示:,测试项目,测试成绩,A,B,C,创新,72,85,67,综合知识,50,74,70,语言,88,45,67,(,1,)如果根据三项测试的平均成绩决定录用人选,那么谁将被录用?(,2,)根据实际需要,公司将创新、综合知识和语言三项测试得分按,431,的比例确定各人测试成绩,此时谁将被录用?,,,测试项目,测试成绩,A,B,C,创新,72,85,67,综合知识,50,74,70,语言,88,45,67,例一、某广告公司欲招聘广告策划人员一名,对,A,B,C,三名候选人进行了三项素质测试,他们的各项测试成绩如下表所示:,(,1,),A,的平均成绩为(,72+50+88,),/3=70,分。,B,的平均成绩为(,85+74+45,),/3=68,分。,C,的平均成绩为(,67+70+67,),/3=68,分。,由,7068,,,故,A,将被录用。,(,2,),A,的测试成绩为,(,724+503+881,),/,(,4+3+1,),=65.75,分。,B,的测试成绩为(,854+743+451,),/,(,4+3+1,),=75.875,分。,C,的测试成绩为(,674+703+671,),/,(,4+3+1,),=68.125,分。,因此候选人,B,将被录用,在实际问题中,一组数据里的各个数据的“重要程度”未必相同。因而,在计算这组数据时,往往给每个数据一个“,权,”。,如例一中的,4,就是创新的权、,3,是综合知识的权、,1,是语言的权。而称(,724+503+881,),/,(,4+3+1,)为,A,的三项测试成绩的,加权平均数,。,延伸与提高,(,1,)某次考试,,5,名学生的平均分是,82,,除甲外,其余,4,名学生的平均分是,80,,那么甲的得分是,(A)84 (B)86 (C)88 (D)90,(,D,),2,、若,m,个数的平均数为,x,,,n,个数的平均数为,y,,则这,(m+n),个数的平均数是,A:(x+y)/2 B:(x+y)/(m+n)C:(mx+ny)/(x+y)D:(mx+ny)/(m+n),3,、已知数据,a,1,a,2,a,3,的平均数是,a,,那么数据,2a,1,+1,2a,2,+1,2a,3,+1,的平均数是,a (B)2a,(C)2a+1 (D)2a/3+1,(C),思考题,一组,6,个数,1,,,2,,,3,,,x,y,z,的平均数是,4,(,1,)求,x,y,z,三数的平均数;,(,2,)求,4x+5,4y+6,4z+7,的平均数,。,解:由上题知,x+y+z=18,(4x+5)+(4y+6)+(4z+7),=4(x+y+z)+18,=418+18=90,(4x+5+4y+6+4z+7)/3=90/3=30,中位数和众数,本超市现因业务需要招聘员工若干名,员工的月平均工资,1000,元,愿有意者前来应聘。,一个月后,灰太狼只领到,600,元的工资。,我被骗了!,人家哪里骗你!,经理,副经理,员工,A,员工,B,员工,C,员工,D,员工,E,员工,F,员工,G,员工,H,员工,I,月工资,3000,2000,900,800,750,650,600,600,600,600,500,(单位:元),该超市工作人员月工资表,1.,请大家仔细观察表格中的数据,该公司的月平均工资是多少?经理是否欺骗了灰太狼,?,2,.,平均月工资能否客观地反映员工的实际收入?为什么?,3.,仔细观察表中的数据,你认为用哪个数据反映职员实际收入的一般水平比较合适?,大多数员工的工资比平均工资低,不能,因为平均数容易受到极端值的影响。,(,3000+2000+900+800+750+650+600+600+600+600+500)11=1000,(元),经理没有欺骗灰太狼,。,数据过大,650,元,按照你的理解能说说什么是中位数吗?,将一组数据从小到大(或从大到小)排列,,如果数据的个数是奇数,中间的数称为这组数据的中位数。,如果数据的个数是偶数,中间两个数的平均数就是这组数据的中位数。,说一说,经理,副经理,员工,A,员工,B,员工,C,员工,D,员工,E,员工,F,员工,G,员工,H,员工,I,月工资,3000,2000,900,800,750,650,600,600,600,600,500,(单位:元),超市工作人员月工资表,中位数,(,2,)平均数,1000,元和中位数,650,元哪个数表示工作人员的工资一般水平更合适呢?,中等水平,650,元,想一想,(,1,),该超市员工的工资这,组数据的中位数的意义是什么?,下列这两组数据的中位数分别是多少,?,(,1,),7 5 4 8 5,(,2,),8 2 4 8 9 6,4 5 5 7 8,2 4 6 8 8 9,(,6+8,),2=7,我会做,这组数据按顺序排列后,当一组数据的个数是奇数时,中位数取中间的那个数。,这组数据按顺序排列后,当一组数据的个数是偶数时,中位数取中间两个数的平均数。,中位数可以是这组数据中的数,也可以不是该组数据中的数。,下列这组数据的中位数分别是多少,?,(,1,),7 5 4 8 5,4 5 5 7 8,(,2,),8 2 4 8 9 6,2 4 6 8 8 9,(,6+8,),2=7,仔细观察这两个题目,你发现了什么?,学以致用,180,124,154,146,145,158,175,165,148,(1)样本数据(12名选手的成绩)的中位数是多少?,(2)一名选手的成绩是142分钟,他的成绩如何?,在一次男子马拉松长跑比赛中,抽得12名选手的成绩如下(单位:分钟):136,140,129,,解:(,1,)先将样本数据按照由小到大的顺序排列:,124,,,129,,,136,,,140,,,145,,,146,,,148,,,154,,,158,,,165,,,175,,,180,则这组数据的中位数为处于中间的两个数,146,,,148,的平均数,即:,(146+148)2=147,因此样本数据的中位数是,147,。,(2)根据(1)中得到的样本数据的结论,可以估计,在这次马拉松比赛中,大约有一半选手的成绩快于147分钟,有一半选手的成绩慢于147分钟。这名选手的成绩是142分钟,快于中位数147分钟,可以推测他的成绩比一半以上的选手的成绩好。,我来说,大家用自己的话说一说,什么是众数呢?,一组数据中出现次数最多的数称为这组数据的众数。,问:,该超市员工的工资这组数据的众数是多少?它的意义是什么?,?,经理,副经理,员工,A,员工,B,员工,C,员工,D,员工,E,员工,F,员工,G,员工,H,员工,I,月工资,3000,2000,900,800,750,650,600,600,600,600,500,(,1,),11,,,12,,,34,,,34,,,34,,,56,,,56,,,80,。,(,2,),32,,,33,,,33,,,33,,,45,,,45,,,45,,,67,。,34,33,45,1,、,一组数据的众数可,能不唯一。,2,、众数一定是这组数据中的数。,仔细观察,你有什么发现?,求出各组数,据的众数。,二.某同学进行社会调查,随机抽查了某个地区的20个家庭的收入情况,并绘制了如下的统计图:,年收入,/,万元,户数,(,1,)求这,20,个家庭的年平均收入;,(,2,)求这,20,户家庭年收入的中位数;,(3)平均数、中位数、众数,哪个更能反映这个地区的家庭的年平均收入水平?,从统计图,分析,数据的,集中趋势,统计图欣赏,折线统计图可以反映数据的变化趋势,温故知新,折线统计图,条形统计图能清楚的表示每个项目的具体数目及反映事物某一阶段属性的大小变化,温故知新,统计图欣赏,条形统计图,可以直观的反映部分占总体的百分比大小,一般不表示具体的数量,温故知新,统计图欣赏,扇形统计图,温故知新,平均数、中位数、众数都是数据处理的代表,它们刻画了一组数据的,“,平均水平,”,,是一组数据集中趋势的特征数,。,一、从散点图中分析数据的集中趋势,情景激趣与新知探究,为了检查面包的质量是否达标,随机抽取了同种规格的面包,10,个,这,10,个面包的质量如左图所示。,(,1,)这,10,个面包质量的众数、中位数分别是多少?,(,2,)估计这,10,个面包的平均质量,说说你是怎样估计的?再具体算一算,看看你的估计水平如何。,你发现这些数据的集中趋势了吗,?,100g,100g,估计方法:,这些数据,在,100,这条线上的点最多,因此可以判定众数是,100,;另外其他,7,个点,都集中在,100,附近,因此可以估计平均数也应在,100,左右。,具体计算时,可以以,100,为基准,超过的部分记为正数,低于的部分记为负数,求出它们的平均数为,0.2,,加上,100,,得平均数为,99.8,方法归纳:在散点图中,众数在点最集中的那个数值上。,二、从条形统计图中分析数据的集中趋势,议一议,甲、乙、丙三支青年排球队各有,12,名队员,三队队员的年龄情况如下图:,(1),观察三幅图,你能从图中分别看出三支球 队队员年龄的众数吗?中位数呢?,(2),根据图表,你能大致估计出三支球队队员的平均年龄哪个大、哪个小吗?你是怎么估计的,?,乙:,众数,:19,岁,中位数:,19,岁,甲:众数,:20,岁;,中位数,:20,岁,丙:,众数,:21,岁,中位数:,21,岁,(3),计算出三支球队队员的平均年龄,看看你上面的估计是否准确?,甲:,(18x1+19X3+20 x4+21X3+22X1)12=20(,岁,),乙,:,(18X3+19X5+20 x2+21X1+22x1),12,19.3(,岁,),丙,:,(,18X1+19x2+20 x1+21X5+22x3)1220.6(,岁,),方法归纳,:,在条形统计图中,众数是最高矩形所代表的值。,三、从扇形统计图中分析数据的集中趋势,做一做,小明调查了班级里,20,名同学本学期计划购买课外书的花费情况,并将结果绘制成了右面的统计图:,(1),在这,20,名同学中,本学期计划购买课外书的花费的众数是多少?,2,5,8,4,1,50,元,做一做,2,5,8,4,1,(2),若调查的总人数是,20,名时,本学期计划购买课外书的花费的中位数是多少?你是怎样得到的?,50,元,(3),计算这,20,名同学计划购买课外书的平均花费,你是怎么计算的?,=57(,元,),想一想:在上面的问题中,如果不知道调查的总人数,你还能求平均数吗?,方法归纳:在扇形统计图中,众数是面积最大的那块扇形所代表的值,用加权平均数来求平均数,其中每块扇形所占的面积就是权。,还能。在扇形统计图中用加权平均数来求,每块扇形所占的百分比就是权,例,:,某地连续统计了,10,天日最高气温,并绘制成如图,6-4,所示的扇形统计图,(1),这,10,天中,日最高,气温的众数是多少?,(2),计算这,10,天日最高,气温的平均值。,解,:,(1),根据扇形统计图,35,占的比例最大,因此日平均气温的众数是,35.,(2),这,10,天日最高气温的平均值是,:,拓展延伸,3210%+33 20%+34 20%+35 30%+36 20%34.3(C),0,1.,如图是某中学田径队队员年龄结构条形统计图,,根据图中信息解答下列问题:,(,1,)田径队共有,_,人。,(,2,)该队队员年龄的众数是,_;,中位数是,_.,(,3,)该队队员的平均年龄是,_.,队员人数,15,岁,16,岁,17,岁,18,岁,0,1,2,3,4,年龄,课堂检测,10,17,岁,17,岁,16.9,岁,巩固提高,15,2,分,20,3,分,25,4,分,40,5,分,2.,某中学八年级,(1),班在一次测试中,,某题(满分为,5,分)的得分情况如图,1,、得分的众数是,2,、得分的中位数是,3,、得分的平均数是,5,分,4,分,3.9,分,根据统计图,确定,10,次射击成绩的众数,、中位数,,先估计这,10,次射击成绩的平均数为,,再具体算一算,看看你的估计水平如何。,3.,某次射击比赛,甲队员的成绩如下图:,9.4,8.4,9.2,9.2,8.8,9,8.6,9,9,9.4,9环,9环,9环,学以致用,表示一组数据离散程度的指标,极差和方差,在日常生活中,我们经常用温差来描述气温的变化情况。例如某日在不同时刻测得乌鲁木齐和广州的气温情况如下:,0:00,4:00,8:00,12:00,16:00,20:00,乌鲁木齐,10,14,20,24,19,16,广州,20,22,23,25,23,21,那么这一天两地的温差分别是,乌鲁木齐,广州,24 10=14 ,25 20=5 ,这两个温差告诉我们,这一天中乌鲁木齐的气温变化幅度较大,广州的气温变化幅度较小。,上面的温差实际上是我们数学中关于极差的一个常见例子。,用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,.,用这种方法得到的差称为极差,(range),极差最大值最小值,在生活中,我们常常会和极差打交道,.,班级里个子最高的学生比个子最矮的学生高多少,?,家庭中年纪最大的长辈比年纪最小的孩子大多少,?,这些都是求极差的例子,.,思考,思考,为什么说图中两个城市,一个“四季温差不,大,”,一个“四季分明”?,极差是最简单的一种度量数据波动情况的量,但只能反映数据的波动范围的大小,不能衡量每个数据的变化情况,而且受极端值的影响较大,.,回顾,1.,何为一组数据的极差,?,极差反映了这组数据哪方面的特征,?,答:一组数据中的最大值减去最小值所得的差叫做这组数据的极差,极差反映的是这组数据的变化范围或变化幅度,小明和小华两人参加体育项目训练,近期的八次测试成绩如下表所示谁的成绩较为稳定?为什么?能通过计算回答吗,?,测试次数,1,2,3,4,5,6,7,8,小明,5,9,10,10,11,10,10,15,小华,5,14,13,8,12,7,6,15,分析:,从平均数来看:,从极差来看:,小明:,15-5=10,小华:,15-5=10,从平均数来看他,俩的平均水平一样。,从极差来看他俩的成绩的变化范围大小一样。,测试次数,1,2,3,4,5,6,7,8,小明,5,9,10,10,11,10,10,15,小华,5,14,13,8,12,7,6,15,测试,次数,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小明的成绩分布散点图,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小华的成绩分布散点图,测试,次数,由计算可知,两人测试成绩的平均值都是,10,分,.,但相比之下,小明的成绩大部分集中在,10,分附近,而小华的成绩与其平均值的离散程度较大,.,通常,如果一组数据与其平均值的离散程度较小,我们就说它比较稳定,.,测试,次数,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小明的成绩分布散点图,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小华的成绩分布散点图,测试,次数,各数据与平均数的差的平方的平均数叫做这批数据的方差,.,公式为:,我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况,.,这个结果通常称为方差,.,方差,测试次数,1,2,3,4,5,6,7,8,小明,5,9,10,10,11,10,10,15,小华,5,14,13,8,12,7,6,15,测试,次数,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小明的成绩分布散点图,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小华的成绩分布散点图,测试,次数,解:,方差越小,波动越小,.,方差越大,波动越大,.,测试次数,1,2,3,4,5,6,7,8,小明,5,9,10,10,11,10,10,15,小华,5,14,13,8,12,7,6,15,测试,次数,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小明的成绩分布散点图,成绩,1,2,4,3,5,6,7,8,5,7,9,11,13,15,小华的成绩分布散点图,测试,次数,6.,从甲、乙两名射击运动员中选拔一名参加比赛,预赛中,他们每人各打,10,发子弹,命中的环数如下:,甲:,9,8,9,9,8,9.5,10,10,8.5,9,;,乙:,8.5,8.5,9.5,9.5,10,8,9,9,8,10,谁的平均成绩高?,(2),谁的成绩比较稳定?,(3),你认为派,去参加比赛比较合适?请结合计算加以说明,练习,议一议,我们知道,一组数据的方差越小,这组数据就越稳定,那么,是,不是方差越小就表示这组数据越好?,x,是这一组数据,x,1,,,x,2,,,,,xn,的平均数,,s,2,是方差。,数据的离散程度还可以用方差或标准差,来刻画,方差是各个数据与平均数之差的平方的平,均数,即:,标准差就是方差的算术平方根,一般说来,一组数据的极差、方差、标准,差越小,这组数据就越稳定,概念,解:,甲、乙两队队员的身高的平均数都是,178cm,;极差分别是,2cm,和,4cm,;方差分别是,0.6,和,1.8,;因此,甲仪仗队更为整齐。,练一练,两支仪仗队队员的身高,(,单位,:cm),如下:,甲队:,178 177 179 179 178 178 177 178,177 179,乙队:,178 177 179 176 178 180 180 178,176 178,哪支仪仗队更为整齐?你是怎么判断的?,回忆:,一、想一想,1,、通过学习,平均数、中位数、众数各是什,么样的特征数?他们有什么联系?,分别怎样来求他们?,A,、都可以作为一组数据的代表。,B,、平均数比较可靠和稳定,它包括所有数据提供的,信息。因而应用最为广泛。但计算比较麻烦,容,易受到极端数的影响。,C,、众数可靠性差,但其大小只与这组数据中部分数,据有关。计算简单,在一组数据中有不少数据重,复出现时,常选用它来 表示这组数据的集中趋势。,D,、中位数可靠性也差,它与数据 的排序有关,不受,极端数据的影响,计算简单,当一组数据中个别,数据变动较大时,适合用中位数表示。,2,.平均数计算:,算术平均数=各数据的和数据的个数,3,.平均数的意义:,算术平均数反映一组数据总体的平均大小情况.,加权平均数反映一组数据中按各数据占有的不同,加权平均数=(各数据该数据的权重)的和,权重时总体的平均大小情况.,4,、中位数代表中等水平,5,、众数:,一组数据,出现最多的数据。,可,能不唯一,一定是这组数据中的数。,极差、方差和标准差,:,何谓一组数据的极差,?,极差反映了这组数据哪方面的特征,?,答 一组数据中的最大值减去最小值所得的差叫做这组数据的极差。,极差反映的是这组数据的变化范围或变化幅度,也称离散程度,极差只能反映一组数据中两个极值之间的大小情况,而对其他数据的波动情况不敏感。,方差的定义:,我们采用各偏差平方的平均数来衡量数据的稳定性,,即,叫做这组数据的方差(用,S,2,来表示)。,方差用来衡量一批数据的波动大小,(,即这批数据偏离平均数的大小,).,方差越大,说明数据的波动越大,越不稳定,.,标准差的定义,为了使得与数据单位一致,可用方差的,算术平方根来表示(即标准差):,S,为标准差。,特殊的:如果方差与标准差为零,说明数据,都没有偏差,即每个数都一样,。,一般来说,一组数据的方差或标准差越小,这组数据离散程度越小,这组数据就越稳定。,区别,平均数是反映一组数据总体趋势的指标。,方差、标准差均是表示一组数据离散程度的指标,.,计算方差的步骤可概括为“先平均,后求差,平方后,再平均”,.,</p>
展开阅读全文