1、 第第2课时课时 用样本的数字特用样本的数字特征估计总体的数字特征征估计总体的数字特征 (1)如何通过频率分布直方图估计数字特如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?征(中位数、众数、平均数)?快乐回忆估计众数估计众数:频率分布直方图面积最大的方频率分布直方图面积最大的方条的横轴中点数字条的横轴中点数字.(最高矩形的中点(最高矩形的中点)估计中位数:估计中位数:中位数把频率分布直方图分中位数把频率分布直方图分成左右两边面积相等成左右两边面积相等.估计平均数:估计平均数:频率分布直方图中每个小矩频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之形的面积乘以小矩形底边
2、中点的横坐标之和和.平均数平均数为我们提供了样本数据的重要为我们提供了样本数据的重要信息信息,但是但是,有时平均数也会使我们作出对有时平均数也会使我们作出对总体的片面判断总体的片面判断.某地区的统计显示某地区的统计显示,该地该地区的中学生的平均身高为区的中学生的平均身高为176 cm,给我们给我们的印象是该地区的中学生生长发育好的印象是该地区的中学生生长发育好,身高身高较高较高.但是但是,假如这个平均数是从五十万名假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算中学生抽出的五十名身高较高的学生计算出来的话出来的话,那么那么,这个平均数就不能代表该这个平均数就不能代表该地区所有中学
3、生的身体素质地区所有中学生的身体素质.因此因此,只有平只有平均数难以概括样本数据的实际状态均数难以概括样本数据的实际状态 所以我们学习从另外的角度来考察样所以我们学习从另外的角度来考察样本数据的统计量本数据的统计量标准差标准差(1)有甲、乙两种钢筋有甲、乙两种钢筋,现从中各抽取一个样本现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:(如下表)检查它们的抗拉强度(单位:kg/mm2),通过计算发现通过计算发现,两个样本的平均数均两个样本的平均数均为为125.甲甲110 120 130 125 120 125 135 125 135 125乙乙115 100 125 130 115 125
4、 125 145 125 145 哪种钢筋的质量较好?哪种钢筋的质量较好?由上图可以看出由上图可以看出,乙样本的最小值乙样本的最小值100低于甲样本的最小值低于甲样本的最小值110,乙样本的最大值乙样本的最大值145高于甲样本的最大值高于甲样本的最大值135,这说明乙种这说明乙种钢筋没有甲种钢筋的抗拉强度稳定钢筋没有甲种钢筋的抗拉强度稳定.我们把一组数据的最大值与最小值的我们把一组数据的最大值与最小值的差称为差称为极差(极差(range).由上图可以看出由上图可以看出,乙乙的极差较大的极差较大,数据点较分散;甲的极差小数据点较分散;甲的极差小,数据点较集中数据点较集中,这说明甲比乙稳定这说明甲
5、比乙稳定.运用极运用极差对两组数据进行比较差对两组数据进行比较,操作简单方便操作简单方便,但但如果两组数据的集中程度差异不大时如果两组数据的集中程度差异不大时,就不就不容易得出结论容易得出结论.我们先来帮下面这个教练来解决问题我们先来帮下面这个教练来解决问题,寻寻找答案找答案!第一次第一次 第二次第二次 第三次第三次 第四次第四次 第五次第五次甲命中环数甲命中环数78889乙命中环数乙命中环数1061068甲,乙两名射击手的测试成绩统计如下:甲,乙两名射击手的测试成绩统计如下:请分别计算两名射手的平均成绩;请分别计算两名射手的平均成绩;教练的烦恼教练的烦恼甲甲乙乙 现要挑选一名射击手参加比现要
6、挑选一名射击手参加比 赛,若你是教练,你认为挑赛,若你是教练,你认为挑 选哪一位比较适宜?为什么?选哪一位比较适宜?为什么?成绩(环)成绩(环)射射击击次次序序012234546810 请根据这两名射击手的成绩在请根据这两名射击手的成绩在 下图中画出折线统计图;下图中画出折线统计图;根据计算我们可以知道甲、乙两名射击手的平均成绩都是8环,但是相比之下,甲射击手的成绩大部分都集中在8环附近,而乙射击手的成绩与其平均值的离散程度较大.通常,如果一组数据与其平均值的离散程度较小,我们就说它比较稳定.请同学们进一步思考,什么样的数据能反映一组数据与其平均值的离散程度?从上面的表和可以看到,甲的射击成绩
7、与平均成绩的偏差较小,而乙的较大。那么如何说明呢?可以直接将各数据与平均值的差进行累加吗?在下表中写出你的计算结果并进行小结,可以用它们来比较两组数据围绕其平均值的波动情况(离散程度)吗?第一次第二次第三次第四次 第五次求和甲射击成绩78889每次成绩与平均成绩之差乙射击成绩1061068每次成绩与平均成绩之差-1000102-22-200你的小结是什么?能用上面的方法比较两组数据的波动情况吗?不能,每次相减的差有正有负,求和时可能同为0,或是其它的同一数字,这样就无法比较了!如果将每次的差都平方再求和,能解决上面的问题吗?试一下此时甲求和后为2,乙求和后为16,可以解决上面的问题。那么这种方
8、法适用于所有的情况吗?看一下下面的问题,想一想,算一算,再来给出你的结论吧!如果一共进行了七次射击测试,而甲因故缺席了两次,怎样比较谁的成绩更稳定呢?用上面的方法计算一下填入下面的表格中,然后想一下这种方法适用吗?如果不适用,应该如何改进呢?1234567求和求和甲 成绩7888缺席9缺席差的平方乙 成绩10610 6879差的平方100012444401118对,有的同学已经发现了这种方法在这里看似是适用的,但仔细想来两组数据并不一样多,这样对数据多的一组来说不公平!那么应该怎样解决呢?对,咱们的同学真聪明!求平均数就可以解决了!标准差:标准差:s=通常改用如下公式来计算标准差通常改用如下公
9、式来计算标准差:意义:意义:标准差用来表示稳定性标准差用来表示稳定性,标准差越大标准差越大,数据的离散程度就越大数据的离散程度就越大,也就越不稳定也就越不稳定.标准差越小标准差越小,数据的离散程度就越小数据的离散程度就越小,也就越稳定也就越稳定.从标准差的定义可以看出从标准差的定义可以看出,标准差标准差s0,当当s=0时时,意味意味着所有的样本数据都等于样本平均数着所有的样本数据都等于样本平均数.方差:方差:从数学的角度考虑,人们有从数学的角度考虑,人们有时用标准差的平方时用标准差的平方s2方差来代方差来代替标准差,作为测量样本数据分散替标准差,作为测量样本数据分散程度的工具:程度的工具:计算
10、公式:计算公式:一般步骤一般步骤:求平均求平均再求差再求差然后平方然后平方最后再平均最后再平均第一次第一次 第二次第二次 第三次第三次 第四次第四次 第五次第五次甲命中环数甲命中环数78889乙命中环数乙命中环数1061068甲,乙两名射击手的测试成绩统计如下:甲,乙两名射击手的测试成绩统计如下:请分别计算两名射手的平均成绩;请分别计算两名射手的平均成绩;教练的烦恼教练的烦恼甲甲乙乙 现要挑选一名射击手参加比现要挑选一名射击手参加比 赛,若你是教练,你认为挑赛,若你是教练,你认为挑 选哪一位比较适宜?为什么?选哪一位比较适宜?为什么?成绩(环)成绩(环)射射击击次次序序012234546810
11、 请根据这两名射击手的成绩在请根据这两名射击手的成绩在 下图中画出折线统计图;下图中画出折线统计图;预习结果展示预习结果展示例例1 画出下列四组样本数据的条形图画出下列四组样本数据的条形图,说明它们的异同点说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.例例:为了考察甲、乙两种小麦的长势为了考察甲、乙两种小麦的长势,分别分别从中抽出从中抽出10株苗,测得苗高如下株苗,测得苗高如下(单位单位:cm):甲甲:12 13 14 15 10 16 13 11 15
12、11乙乙:11 16 17 14 13 19 6 8 10 16问哪种小麦长得比较整齐问哪种小麦长得比较整齐?方差越大方差越大,波动越大,越不稳定。波动越大,越不稳定。比比谁最快比比谁最快(1)在一次歌手大奖赛上在一次歌手大奖赛上,七位评委为歌手打出的分数七位评委为歌手打出的分数如下如下9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉一个最高分和一去掉一个最高分和一个最低分后个最低分后,所剩数据的平均值和方差分别为所剩数据的平均值和方差分别为_.(2)在相同条件下对自行车运动员甲、乙两人进行了在相同条件下对自行车运动员甲、乙两人进行了6次测次测试试,测得他们的最大速度测得他们的最大
13、速度(单位:单位:m/s)的数据如下:的数据如下:甲273830373531乙332938342836 试判断选谁参加某项重大比赛更合适?(1)9.5,0.016 (2)33,33,乙的成绩比甲稳定乙的成绩比甲稳定,应选乙参加比赛更合适应选乙参加比赛更合适.(2015新课标全国新课标全国,18)某公司为了解用户对其产品的某公司为了解用户对其产品的满意度,从满意度,从A,B两地区分别随机调查了两地区分别随机调查了20个用户,得到个用户,得到用户对产品的满意度评分如下:用户对产品的满意度评分如下:A地区:地区:62 73 81 92 95 85 74 64 53 76 78 86956697788
14、8827689B地区:地区:73 83 62 51 91 46 53 73 64 82 93 486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程并通过茎叶图比较两地区满意度评分的平均值及分散程度度.A地区:地区:62 73 81 92 95 85 74 64 53 76 78 869566977888827689B地区:地区:73 83 62 51 91 46 53 73 64 82 93 486581745654766579通过茎叶图可以看出,通过茎叶图可以看出
15、,A地区用户满意度评分地区用户满意度评分的平均值高于的平均值高于B地区用地区用户满意度评分的平均值;户满意度评分的平均值;A地区用户满意度评分地区用户满意度评分比较集中,比较集中,B地区用户地区用户满意度评分比较分散满意度评分比较分散.(2016河北沧州模拟河北沧州模拟)为备战为备战2016年奥运会,甲、年奥运会,甲、乙两位射击选手进行了强化训练乙两位射击选手进行了强化训练.现分别从他们的现分别从他们的强化训练期间的若干次平均成绩中随机抽取强化训练期间的若干次平均成绩中随机抽取8次,次,记录如下:记录如下:甲:甲:8.3,9.0,7.9,7.8,9.4,8.9,8.4,8.3;乙:乙:9.2,
16、9.5,8.0,7.5,8.2,8.1,9.0,8.5.(1)画出甲、乙两位选手成绩的茎叶图;画出甲、乙两位选手成绩的茎叶图;(2)现要从中选派一人参加奥运会封闭集训,从现要从中选派一人参加奥运会封闭集训,从统计学角度,你认为派哪位选手参加合理?简单统计学角度,你认为派哪位选手参加合理?简单说明理由;说明理由;显然,在刻画样本数据的显然,在刻画样本数据的离散程度上,方差与标准离散程度上,方差与标准差是一样的差是一样的.但在解决实际但在解决实际问题时,一般多采用标准问题时,一般多采用标准差差.课堂小结课堂小结2.用样本估计总体的两个手段用样本估计总体的两个手段(用样本的频率(用样本的频率分布估计
17、总体的分布;用样本的数字特征估计分布估计总体的分布;用样本的数字特征估计总体的数字特征)总体的数字特征),需要从总体中抽取一个质量需要从总体中抽取一个质量较高的样本较高的样本,才能不会产生较大的估计偏差才能不会产生较大的估计偏差,且且样本容量越大样本容量越大,估计的结果也就越精确估计的结果也就越精确.1.用样本的数字特征估计总体的数字特征分两类:用样本的数字特征估计总体的数字特征分两类:用样本平均数估计总体平均数用样本平均数估计总体平均数,平均数对数据有平均数对数据有“取齐取齐”的作用的作用,代表一组数据的平均水平代表一组数据的平均水平.用样本标准差估计总体标准差用样本标准差估计总体标准差.样本容量越大样本容量越大,估计估计就越精确就越精确,标准差描述一组数据围绕平均数波动的大小标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度反映了一组数据变化的幅度.谢谢指导谢谢指导!