1、(一)众数、中位数、平均数第1页一一 众数、中位数、平均数概念众数、中位数、平均数概念中位数中位数:将一组数据按大小依次排列,把处于:将一组数据按大小依次排列,把处于最中间位置一个数据(或最中间两个数据平均最中间位置一个数据(或最中间两个数据平均数)叫做这组数据中位数数)叫做这组数据中位数.众数众数:在一组数据中,出现次数最多数据叫做:在一组数据中,出现次数最多数据叫做这组数据众数这组数据众数 平均数平均数:一组数据算术平均数一组数据算术平均数,即即 第2页 问题问题1:众数、中位数、平均数这三个数众数、中位数、平均数这三个数普通都会来自于同一个总体或样本,它们普通都会来自于同一个总体或样本,
2、它们能表明总体或样本什么性质?能表明总体或样本什么性质?平均数平均数:反应全部数据平均水平反应全部数据平均水平 众数众数:反应往往是局部较集中数据信息反应往往是局部较集中数据信息 中位数中位数:是位置型数,反应处于中间部位是位置型数,反应处于中间部位 数据信息数据信息 第3页1、求以下各组数据、求以下各组数据众数众数(1)、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9众数是:32、求以下各组数据、求以下各组数据中位数中位数(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数
3、是:5中位数是:4第4页 3、在一次中学生田径运动会上,参加男子跳高、在一次中学生田径运动会上,参加男子跳高17名运名运动员成绩以下表所表示:动员成绩以下表所表示:成成绩绩(米米)150160165170175180185190人数人数23234111分别求这些运动员成绩众数,中位数与平均数分别求这些运动员成绩众数,中位数与平均数。解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现次数最多,次,出现次数最多,即这组数据众数是即这组数据众数是1.75上面表里上面表里17个数据可看成是按从小到大次序排列,其个数据可看成是按从小到大次序排列,其中第中第9个数据个数据1.70是最中间一
4、个数据,即这组数据中位数是最中间一个数据,即这组数据中位数是是1.70;答:答:17名运动员成绩众数、中位数、平均数依次是名运动员成绩众数、中位数、平均数依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)。(米)。这组数据平均数是这组数据平均数是第5页 二、众数、中位数、平均数与频率众数、中位数、平均数与频率分布直方图关系分布直方图关系第6页频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)众数在样本数据频率分布直方图中,众数在样本数据频率分布直方图中,就是最高矩形中点横坐标。就是最高矩形中点横坐标。怎
5、样在频率分布直方图中预计众数怎样在频率分布直方图中预计众数可将众数看作直方图中面积最大长方形可将众数看作直方图中面积最大长方形“中心中心”第7页0.52.521.5143.534.5频率频率组距组距0.040.080.150.220.250.140.060.040.02前四个小矩形面前四个小矩形面积和积和=0.49后四个小矩形面后四个小矩形面积和积和=0.262.02怎样在频率分布直方图中预计中位数怎样在频率分布直方图中预计中位数第8页分组分组0,0.5)0.5,1)1,1.5)1.5,2)2,2.5)2.5,3)3,3.5)3.5,4)4,4.5v累计频率频率0.040.080.150.22
6、0.250.140.060.040.021在样本中中位数左右各有在样本中中位数左右各有50%样本数,样本数,条形面积各为条形面积各为0.5,所以反应在直方图中位数所以反应在直方图中位数左右面积相等左右面积相等.,中位数中位数)可将中位数看作整个直方图面积可将中位数看作整个直方图面积“中心中心”第9页思索讨论以下问题:思索讨论以下问题:1、2.02这个中位数预计值,与样本中位数这个中位数预计值,与样本中位数值值2.0不一样,你能解释其中原因吗?不一样,你能解释其中原因吗?答:答:2.02这个中位数预计值这个中位数预计值,与样本中位与样本中位数值数值2.0不一样,这是因为样本数据频率分不一样,这是
7、因为样本数据频率分布直方图,只是直观地表明分布形状,不布直方图,只是直观地表明分布形状,不过过从直方图本身得不出原始数据内容,直从直方图本身得不出原始数据内容,直方图已经损失一些样本信息。方图已经损失一些样本信息。所以由频率所以由频率分布直方图得到中位数预计值往往与样本分布直方图得到中位数预计值往往与样本实际中位数值不一致实际中位数值不一致.第10页怎样在频率分布直方图中预计平均数怎样在频率分布直方图中预计平均数第11页=2.02=2.02平均数预计值等于频率分布平均数预计值等于频率分布直方图中每个小矩形面积乘直方图中每个小矩形面积乘以小矩形底边中点横坐标之以小矩形底边中点横坐标之和。和。可将
8、平均数看作整个直方图面积可将平均数看作整个直方图面积“重心重心”第12页思索讨论以下问题:思索讨论以下问题:2、样本中位数不受少数极端值影响,这在样本中位数不受少数极端值影响,这在一些情况下是一个优点,但它对极端值不一些情况下是一个优点,但它对极端值不敏感有时也会成为缺点。你能举例说明吗敏感有时也会成为缺点。你能举例说明吗?答:优点:对极端数据不敏感方法能够有答:优点:对极端数据不敏感方法能够有效地预防错误数据影响。效地预防错误数据影响。对极端值不敏感有利例子对极端值不敏感有利例子:比如当样本数据质量比如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、比较差,即存在一些错误数据(如数
9、据录入错误、测量错误等)时,用抗极端数据强中位数表示数测量错误等)时,用抗极端数据强中位数表示数据中心值更准确。据中心值更准确。第13页 缺点:(缺点:(1)出现错误数据也不知道;)出现错误数据也不知道;(2)对极端值不敏感有弊例子:对极端值不敏感有弊例子:某人含有某人含有初级计算机专业技术水平,想找一份收入初级计算机专业技术水平,想找一份收入好工作。这时假如采取各个企业计算机专好工作。这时假如采取各个企业计算机专业技术人员收入中位数作为选择工作参考业技术人员收入中位数作为选择工作参考指标就会冒这么风险:指标就会冒这么风险:很可能所选择企业初级计算机专业技术水平人很可能所选择企业初级计算机专业
10、技术水平人员收入很低,其原因是中位数对极小数据不敏员收入很低,其原因是中位数对极小数据不敏感。感。这里更加好方法是同时用平均工资和中位这里更加好方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数数作为参考指标,选择平均工资较高且中位数较大企业就业较大企业就业.第14页 例例1、下表是七位评委给某参赛选手打分,总分为、下表是七位评委给某参赛选手打分,总分为10分,分,你认为怎样计算这位选手最终得分才较为合理?你认为怎样计算这位选手最终得分才较为合理?评委 1号2号3号4号5号6号7号打分 9.69.39.39.69.99.39.4提问:提问:1、电视里评委是怎样给选手打分?、电视
11、里评委是怎样给选手打分?2、为何这么做?直接取中位数和众数值不好么?、为何这么做?直接取中位数和众数值不好么?三、众数、中位数、平均数简单应用众数、中位数、平均数简单应用特征数特征数 众数众数中位数中位数平均数平均数v去掉一个最高分和最低分后平均分v去掉两个最高分和最低分后平均分特征值特征值 9394949942944第15页例例2 某工厂人员及工资组成以下:某工厂人员及工资组成以下:人员人员经理经理管理人员管理人员高级技工高级技工工人工人学徒学徒v累计周工资周工资2200 250220200100人数人数16510123v累计2200 150011001006900(1)指出这个问题中周工资
12、众数、中位数、平均数)指出这个问题中周工资众数、中位数、平均数(2)这个问题中,工资平均数能客观地反应该厂工资水平吗)这个问题中,工资平均数能客观地反应该厂工资水平吗?为何?为何?分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出数据可见,只有经,由表格中所列出数据可见,只有经理在平均数以上,其余人都在平均数以下,故用平均数理在平均数以上,其余人都在平均数以下,故用平均数不能客观真实地反应该工厂工资水平。不能客观真实地反应该工厂工资水平。第16页课堂练习:课堂练习:1、假设你是一名交通部门工作人员。你打算向市长汇报国家
13、、假设你是一名交通部门工作人员。你打算向市长汇报国家对本市对本市26条公路项目投资平均资金数额,其中一条新公路建条公路项目投资平均资金数额,其中一条新公路建设投资为设投资为2 200万元人民币,另外万元人民币,另外25个项目标投资在个项目标投资在20万与万与100万中位数是万中位数是25万,平均数是万,平均数是100万,众数是万,众数是20万元。你万元。你会选择哪一个数字特征来表示每一个项目标国家投资?你选会选择哪一个数字特征来表示每一个项目标国家投资?你选择这种数字特征缺点是什么?择这种数字特征缺点是什么?选择平均数更加好:因为,此时众数选择平均数更加好:因为,此时众数20万比中位数万比中位
14、数25万还小,万还小,所以众数代表是局部数。中位数代表即使是大多数公路投资数所以众数代表是局部数。中位数代表即使是大多数公路投资数额,但因为其不受极端值影响,不能代表全体,因而此时成了额,但因为其不受极端值影响,不能代表全体,因而此时成了它缺点。选择平均数很好,能比很好代表整体水平,但缺点是它缺点。选择平均数很好,能比很好代表整体水平,但缺点是仍不能显示出详细数字特征仍不能显示出详细数字特征 第17页(二)第18页情境一情境一;甲.乙两名射击队员,在进行十次射击中成绩分别是:甲:10;9;8;10;8;8;10;10;9.5;7.5乙:9;9;8,5;9;9;9.5;9.5;8.5;8.5;9
15、.5试问二人谁发挥水平较稳定?分析:甲平均成绩是9环.乙平均成绩也是9环.一一.实例引入实例引入第19页情境二情境二:某农场种植了甲、乙两种玉米苗,从中各抽取某农场种植了甲、乙两种玉米苗,从中各抽取了了1010株,分别测得它们株高以下:株,分别测得它们株高以下:(单位单位cm)cm)甲:甲:31 32 35 37 33 30 32 31 30 29 乙:乙:53 16 54 13 66 16 13 11 16 62问问:哪种玉米苗长得高?哪种玉米苗长得高?哪种玉米苗长得齐?哪种玉米苗长得齐?怎么办呢?怎么办呢?第20页甲甲37(最大值)(最大值)29(最小值)(最小值)8乙乙66(最大值)(最
16、大值)11(最小值)(最小值)55极极 差差 甲甲:31 32 35 37 33 30 32 31 30 29 乙乙:53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙第21页极差:极差:一组数据最大值与最小值差一组数据最大值与最小值差极差越大,数据越分散,越不稳定极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差越小,数据越集中,越稳定极差表达了数据极差表达了数据离散程度离散程度离散程度离散程度第22页 为了对两人射击水平稳定程度为了对两人射击水平稳定程度,玉米生长高度玉米生长高度差异以及钢筋质量优劣做个合理评价差异以及钢筋质量优劣做个
17、合理评价,这里我们这里我们引入了一个新概念引入了一个新概念,方差和标准差方差和标准差.第23页设一组样本数据设一组样本数据 ,其平均数为,其平均数为 ,则,则称称s2为这个样本为这个样本方差方差,称为这个样本称为这个样本标准差标准差,分别称为样本方差、样本标准差,分别称为样本方差、样本标准差它算术平方根它算术平方根x1,x2,xn第24页v样本中各数据与样本平均数差平方和平样本中各数据与样本平均数差平方和平均数叫做均数叫做样本方差;样本方差;样本方差算术平方样本方差算术平方根叫做根叫做样本标准差样本标准差。样本方差和样本标。样本方差和样本标准差都是衡量一个样本准差都是衡量一个样本波动大小波动大
18、小量,样量,样本方差或样本标准差越大,样本数据波本方差或样本标准差越大,样本数据波动就越大。动就越大。第25页例例1.计算数据计算数据89,93,88,91,94,90,88,87方方差和标准差。(标准差结果准确到差和标准差。(标准差结果准确到0.1)解:解:.所以这组数据方差为所以这组数据方差为5.5,标准差为,标准差为2.3.见书本见书本76-77页页第26页练习:若甲、乙两队比赛情况以下练习:若甲、乙两队比赛情况以下,以下说法哪些以下说法哪些 说法是不正确:说法是不正确:甲甲乙乙平均失球数平均失球数平均失球个数标准差平均失球个数标准差1.52.11.10.41、平均来说,甲技术比乙技术好
19、;、平均来说,甲技术比乙技术好;2、乙比甲技术更稳定;、乙比甲技术更稳定;3、甲队有时表现差,有时表现好;、甲队有时表现差,有时表现好;4、乙队极少不失球。、乙队极少不失球。全对全对第27页例例2:甲、乙两种水稻试验品种连续:甲、乙两种水稻试验品种连续5年平均单位面积产量以年平均单位面积产量以下(单位:下(单位:t/hm),试依据这组数据预计哪一个水稻品种产),试依据这组数据预计哪一个水稻品种产量比较稳定量比较稳定 品种品种第一年第一年第二年第二年第三年第三年第四年第四年第五年第五年甲甲989910110102乙乙941031089798解:第28页1 1、在一次歌手大奖赛上,七位评委为歌手打
20、出分数、在一次歌手大奖赛上,七位评委为歌手打出分数以下:以下:9.49.4,8.48.4,9.49.4,9.99.9,9.69.6,9.49.4,9.79.7,去掉,去掉一个最高分和一个最低分后,所剩数据平均值和方差一个最高分和一个最低分后,所剩数据平均值和方差分别为分别为_;2 2、已知数据、已知数据 方差为方差为2 2,则求数据,则求数据 方方差。差。9.5,0.016 三三.当堂反馈当堂反馈思索一下:第29页假如数据假如数据平均数为平均数为 ,方差为方差为(1 1)新数据)新数据平均数为平均数为,方差仍为,方差仍为 (2 2)新数据)新数据平均数为平均数为,方差为,方差为 (3 3)新数据)新数据平均数为平均数为 ,方差为方差为 ,则,则方差运算性质:方差运算性质:第30页