1、第一课时第一课时 众数、中位数、众数、中位数、平均数平均数第1页问题提出问题提出在前面几节课中,我们学习了用图、表来组在前面几节课中,我们学习了用图、表来组织样本数据,用样本分布情况预计总体分布织样本数据,用样本分布情况预计总体分布情况。为了从整体上更加好地把握总体规律,情况。为了从整体上更加好地把握总体规律,我们还应从哪些方面来对总体数字特征进行我们还应从哪些方面来对总体数字特征进行研究?研究?一、用一、用众数、中位数、平均数来反应众数、中位数、平均数来反应总体平均情况总体平均情况二、用二、用方差和标准差来反应总体波动方差和标准差来反应总体波动情况情况第2页目标导学目标导学1、正确了解众数、
2、中位数、平均数概、正确了解众数、中位数、平均数概念,能够计算和预计样本数字特征。念,能够计算和预计样本数字特征。2、经过对样本数据提取基本数字特征、经过对样本数据提取基本数字特征进行合理解释,深入体会统计思想,进行合理解释,深入体会统计思想,培养应用意识和能力。培养应用意识和能力。第3页一、了解众数、中位数、平均数概念一、了解众数、中位数、平均数概念 众数:众数:在一组数据中,出现次数最多在一组数据中,出现次数最多数据叫做这组数据众数数据叫做这组数据众数 众数、中位数、平均数众数、中位数、平均数都是描述一组都是描述一组数据集中趋势特征数,只是描述角度不一数据集中趋势特征数,只是描述角度不一样,
3、其中以平均数应用最为广泛样,其中以平均数应用最为广泛.第4页平均数平均数:一组数据算术平均数一组数据算术平均数,即即 x=中位数:中位数:将一组数据按大小依次排列,将一组数据按大小依次排列,把处于最中间位置一个数据(或最中间两把处于最中间位置一个数据(或最中间两个数据平均数)叫做这组数据中位数个数据平均数)叫做这组数据中位数 第5页 练习练习1:在一次中学生田径运动会上,在一次中学生田径运动会上,参加男子跳高参加男子跳高17名运动员成绩以下表所名运动员成绩以下表所表示:表示:成成绩绩(单单位:米位:米)150160165170175180185190人数人数23234111分别求这些运动员成绩
4、众数、中位数与平分别求这些运动员成绩众数、中位数与平均数均数。二、学会求众数,中位数和平均数二、学会求众数,中位数和平均数第6页解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现次次,出现次数最多,即这组数据众数是数最多,即这组数据众数是1.75上面表里上面表里17个数据可看成是按从小到大次序个数据可看成是按从小到大次序排列,其中第排列,其中第9个数据个数据1.70是最中间一个数据,是最中间一个数据,即这组数据中位数是即这组数据中位数是1.70;这组数据平均数是这组数据平均数是答:答:17名运动员成绩众数、中位数、平均数依名运动员成绩众数、中位数、平均数依次是次是1.75(米)
5、、(米)、1.70(米)、(米)、1.69(米)(米).第7页 练习练习2:在某赛季中,甲运动员在在某赛季中,甲运动员在15场场比赛得分以下:比赛得分以下:12,15,24,25,31,31,31,36,37,44,49,50,53,53,62分别求甲运动员成绩众数,中位数与分别求甲运动员成绩众数,中位数与平均数平均数。问:假如上面数据改为:问:假如上面数据改为:12,15,24,25,31,31,31,36,37,44,49,50,53,53,102众数,中位数与平均数结果有何改变?众数,中位数与平均数结果有何改变?第8页 练习练习3:已知已知100位居民月均用水量频位居民月均用水量频率分布
6、表和频率分布直方图(书本率分布表和频率分布直方图(书本67页)页),试求出该组数据众数、中位数和平均数,试求出该组数据众数、中位数和平均数 下面,让我们看看从原始数下面,让我们看看从原始数据中得到三个量值分别是多少。据中得到三个量值分别是多少。思索:你能解释为何结果不一样吗?思索:你能解释为何结果不一样吗?第9页 归纳:归纳:众数、中位数、平均众数、中位数、平均数与频率分布直方图关系数与频率分布直方图关系 1.众数在样本数据频率分布直方图中,众数在样本数据频率分布直方图中,就是就是最高矩形中点横坐标最高矩形中点横坐标。第10页频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5
7、 2 2.5 3 3.5 4 4.5 月平均用水量(t)第11页 2.在样本中,有在样本中,有50个体小于或等于个体小于或等于中位数,也有中位数,也有50个体大于或等于中位数,个体大于或等于中位数,所以,在频率分布直方图中,所以,在频率分布直方图中,中位数左边中位数左边和右边直方图面积应该相等和右边直方图面积应该相等,由此能够预,由此能够预计中位数值。计中位数值。第12页频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)第13页3、平均数是频率分布直方图、平均数是频率分布直方图“重心重心”.是直方图平衡点。等于频率分布直
8、方是直方图平衡点。等于频率分布直方图中每个小矩形面积(即图中每个小矩形面积(即落在该组中落在该组中频率频率)乘以乘以小矩形底边中点横坐标小矩形底边中点横坐标(组中值组中值)之和之和。第14页频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t)第15页日睡眠日睡眠时间时间/h人数人数频频率率6,6.5)5 0.056.5,7)17 0.177,7.5)330.337.5,8)370.378,8.5)6 0.068.5,9)20.02累计1001练习练习4.某校学生日睡眠时间抽样频率分布见下表某校学生日睡眠时间抽样频率分布见下
9、表:试预计该校学生平均日睡眠时间试预计该校学生平均日睡眠时间第16页练习练习5.某校为了了解学生课外阅读情况某校为了了解学生课外阅读情况,随机抽查了随机抽查了50名学生名学生,得到他们在某一天各自课外阅读所用时间数据得到他们在某一天各自课外阅读所用时间数据,结果用如图所表示条形图表示结果用如图所表示条形图表示,依据条形图可得这依据条形图可得这50名名学生这一天平均每人课外阅读时间为学生这一天平均每人课外阅读时间为()A.0.6h B.0.9h C.1.0h D.1.5h时间时间(h)人数人数5102000.51.01.52.0B第17页练习练习6:”八八.一一”前夕前夕,某中学举行国防知识竞赛
10、某中学举行国防知识竞赛:满满分为分为100分分,80分以上为优异分以上为优异,现将高一两个班参赛学现将高一两个班参赛学生成绩进行整理后分成五组绘制成如图所表示频率分生成绩进行整理后分成五组绘制成如图所表示频率分布直方图布直方图,已知图中从左到右第一、第二、第三、第已知图中从左到右第一、第二、第三、第四、第五小组频率分别是四、第五小组频率分别是0.3,0.4,0.15,0.1,0.0550 60 70809010000.0050.0100.0150.030.04 求:求:(1)成绩众数、)成绩众数、中中位数;位数;(2)平均成绩)平均成绩频率频率/组距组距第18页三三 三种数字特征优缺点三种数字
11、特征优缺点1.众数众数表达了样本数据最大集中表达了样本数据最大集中点,点,但它对其它数据信息忽略使但它对其它数据信息忽略使得无法客观地反应总体特征得无法客观地反应总体特征.如前如前面例中众数是面例中众数是2.25t,它告诉我们它告诉我们,月均用水量为月均用水量为2.25t居民数比月均居民数比月均用水量为其它数值居民数多用水量为其它数值居民数多,但它但它并没有告诉我们多多少并没有告诉我们多多少.第19页 2.中位数是样本数据所占频率等中位数是样本数据所占频率等分线,它分线,它不受少数几个极端值影响不受少数几个极端值影响,这这在一些情况下是优点,但它对极端值在一些情况下是优点,但它对极端值不敏感有
12、时也会成为缺点。如上例中不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为假设有某一用户月均用水量为10t,那,那么它所占频率为么它所占频率为0.01,几乎不影响中位几乎不影响中位数数,但显然这一极端值是不能忽略。但显然这一极端值是不能忽略。第20页 3.因为平均数与每一个样本数据因为平均数与每一个样本数据相关,所以相关,所以任何一个样本数据改变都任何一个样本数据改变都会引发平均数改变,这是众数、中位会引发平均数改变,这是众数、中位数都不含有性质。数都不含有性质。也正因如此也正因如此,与众,与众数、中位数比较起来,数、中位数比较起来,平均数能够反平均数能够反应出更多关于样本数据全体信息
13、,应出更多关于样本数据全体信息,但但平均数受数据中极端值影响较大,平均数受数据中极端值影响较大,使使平均数在预计时可靠性降低。平均数在预计时可靠性降低。第21页练习练习7 某工厂人员及工资组成以下:某工厂人员及工资组成以下:人人员员经经理理管理人管理人员员高高级级技工技工工人工人学徒学徒累计周工周工资资2200250220200100人数人数16510123累计2200150011001006900(1)指出这个问题中周工资众数、中位)指出这个问题中周工资众数、中位数、平均数数、平均数(2)这个问题中,工资平均数能客观地)这个问题中,工资平均数能客观地反应该厂工资水平吗?为何?反应该厂工资水平
14、吗?为何?第22页 分析分析:众数为:众数为200,中位数为,中位数为220,平均数为,平均数为300。因平均数为因平均数为300,由表格中所列出数据可见,由表格中所列出数据可见,只有经理在平均数以上,其余人都在平均数以下,只有经理在平均数以上,其余人都在平均数以下,故用平均数不能客观真实地反应该工厂工资水平。故用平均数不能客观真实地反应该工厂工资水平。评注评注:平均数受数据中极端值影响较大平均数受数据中极端值影响较大,妨碍了对总妨碍了对总体预计可靠性体预计可靠性,这时平均数反而不如众数、中位数更这时平均数反而不如众数、中位数更客观。客观。第23页练习练习8.从甲、乙、丙三个产品中,各抽出从甲
15、、乙、丙三个产品中,各抽出8件产品,对件产品,对其使用寿命进行跟踪调查,结果以下(单位:年)其使用寿命进行跟踪调查,结果以下(单位:年)甲:甲:3,4,5,6,8,8,8,10乙:乙:4,6,6,6,8,9,12,13丙:丙:3,3,4,7,9,10,11,12三家广告中都称该种产品使用寿命是三家广告中都称该种产品使用寿命是8年,请依据年,请依据调查结果判断厂家在广告中分别利用了平均数、众数、调查结果判断厂家在广告中分别利用了平均数、众数、中位数中哪一个集中趋势特征数。中位数中哪一个集中趋势特征数。第24页小结:小结:1、正确了解众数、中位数、平均数概念;、正确了解众数、中位数、平均数概念;2
16、、能够计算和预计样本数字特征(尤其是利用频率、能够计算和预计样本数字特征(尤其是利用频率分布表和直方图)。分布表和直方图)。3、经过对样本数据提取基本数字特征进行合理解释,、经过对样本数据提取基本数字特征进行合理解释,体会三个特征优缺点,深入体会统计思想,培养应体会三个特征优缺点,深入体会统计思想,培养应用意识和能力。用意识和能力。第25页第二课时第二课时 用样本频率分布用样本频率分布预计总体分布预计总体分布 第26页目标导学目标导学1、经过实例体会分布意义和作、经过实例体会分布意义和作用。学会列频率分布表、画频率用。学会列频率分布表、画频率分布直方图、频率折线图、茎叶分布直方图、频率折线图、
17、茎叶图,体会它们各自特点。图,体会它们各自特点。2、会处理一些简单实际问题。、会处理一些简单实际问题。第27页统计基本思想方法统计基本思想方法 用样本预计总体,即通常不直用样本预计总体,即通常不直接去研究总体,而是经过接去研究总体,而是经过从总体中从总体中抽取一个样本抽取一个样本,依据样本情况去预依据样本情况去预计总体对应情况计总体对应情况.第28页统计关键问题统计关键问题 怎样依据样本情况对总体情况作怎样依据样本情况对总体情况作出一个推断出一个推断.这里包含两类问题:这里包含两类问题:一类是怎样从总体中抽取样本一类是怎样从总体中抽取样本?另一类是怎样依据对样本整理、另一类是怎样依据对样本整理
18、、计算、分析计算、分析,对总体情况作出对总体情况作出推断推断.第29页 用样本相关情况去预计总体对用样本相关情况去预计总体对应情况应情况,这种预计大致分为两类,这种预计大致分为两类,一类是用样本频率分布预计总体分一类是用样本频率分布预计总体分布布,一类是用样本某种数字特征一类是用样本某种数字特征(比如平均数、方差等)去预计总(比如平均数、方差等)去预计总体对应数字特征体对应数字特征。整体介绍整体介绍第30页 将一批数据按要求分为若干个组,将一批数据按要求分为若干个组,各组内数据个数,叫做该组各组内数据个数,叫做该组频数频数。频率:每组数据个数除以全体数据频率:每组数据个数除以全体数据个数商叫做
19、该组个数商叫做该组频率频率。依据随机抽取样本大小,分别计算依据随机抽取样本大小,分别计算某一事件出现频率,这些频率分布规律某一事件出现频率,这些频率分布规律(取值情况),就叫做(取值情况),就叫做样本频率分布样本频率分布。第31页说说明明:样样本本频频率率分分布布与与总总体体频频率率分布有什么关系?分布有什么关系?经过样本经过样本频数分布频数分布、频率分频率分布布能够预计总体频率分布能够预计总体频率分布.第32页怎样用样本频率分布怎样用样本频率分布预计总体分布?预计总体分布?第33页我国是世界上严重缺水国家之一我国是世界上严重缺水国家之一城市缺水问题较为突出。城市缺水问题较为突出。第34页1
20、1:某市政府为了节约生活用水,:某市政府为了节约生活用水,计划在本市试行居民生活用水定额计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标管理,即确定一个居民月用水量标准准a,用水量不超出用水量不超出a部分按平价收部分按平价收费,超出费,超出a部分按议价收费。部分按议价收费。第35页 假如希望大部分居民日常生假如希望大部分居民日常生活不受影响,那么标准活不受影响,那么标准a定为多定为多少比较合理呢?少比较合理呢?为了较合理地确定这个标准,为了较合理地确定这个标准,你认为你认为需要做哪些工作?需要做哪些工作?提出问题提出问题第36页 思索思索:由上表,大家能够得到什么信息?由上表,大家
21、能够得到什么信息?第37页 1.1.求极差求极差:步骤:步骤:频率分布直方图频率分布直方图 2.2.决定组距与组数决定组距与组数:组数组数=4.3 4.3-0.2=4.10.2=4.14.14.10.50.5=8.2=8.2组距组距极差极差=3.3.将数据分组将数据分组0 0,0.50.5),0.50.5,1 1),4 4,4.54.5 第38页4.4.列频率分布表列频率分布表第39页100100位居民月平均用水量频率分布表位居民月平均用水量频率分布表第40页频率频率/组组距距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5
22、4 4.5 5.5.画频率分布直方图画频率分布直方图第41页一一、求求极差极差,即数据中最大值与最小值差,即数据中最大值与最小值差二、决定二、决定组距与组数组距与组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开区间左闭右开区间,最终一组取闭区间最终一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据频率分布直方图画一组数据频率分布直方图,能够按以下能够按以下步骤进行步骤进行:五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)第42页练练 习习1.有一个容量
23、为有一个容量为50样本数据分组频数以下:样本数据分组频数以下:12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.5)4(1)列出样本频率分布表列出样本频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)依据频率分布直方图预计依据频率分布直方图预计,数据落在数据落在15.5,24.5)百)百分比是多少分比是多少?第43页解解:组距为组距为3 分组分组 频数频数 频率频率 频率频率/组距组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5
24、,27.5)1027.5,30.5)530.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027第44页频率分布直方图以下频率分布直方图以下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070小长方形有何实际意义?24.5第45页2、对某电子元件进行寿命跟踪调查,情况以下:、对某电子元件进行寿命跟踪调查,情况以下:1)、列出频率分布表)、列出频率分布表2)、预计电子元件寿命在)、预计电子元件寿命在100h400h以以内频率内频率3)、预计电子元件寿命在
25、)、预计电子元件寿命在400h以上频以上频率率第46页3.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为那么频率为0.2范围是范围是 ()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5 分分组组 频频数数 频频率率 频频数累数累计计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9.511.5 8 0.4 1611.513.5 4 0.2 20 累计 20 1.0D第47页4.一个容量为一个容量为100样本样本,数据分组和各组相关信息数据分组和各组相关信息以下表以下表
26、,试完成表中每一行两个空格试完成表中每一行两个空格.分分组组 频频数数 频频率率 频频率累率累计计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33)0.1033,36 1.00累计 100 1.00第48页课堂小结课堂小结编制频率分布直方图步骤编制频率分布直方图步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,而且把第而且把第1小组起点小组起点稍微再小一点稍微再小一点.第49页