1、 第二章用样本估计总体第二章用样本估计总体 2.2.2用样本的数字特征估计用样本的数字特征估计 总体的数字特征总体的数字特征复习回顾v一般地,列出一组样本数据的频率分布表可以一般地,列出一组样本数据的频率分布表可以分哪几个步骤进行?分哪几个步骤进行?第一步,求极差第一步,求极差.(极差(极差=样本数据中最大值与最小值的差样本数据中最大值与最小值的差)第二步,决定组距与组数第二步,决定组距与组数.(设(设k=k=极差极差组距,若组距,若k k为整数,则组数为整数,则组数=k=k,否则,组数,否则,组数=k+1=k+1)第三步,确定分点,将数据分组第三步,确定分点,将数据分组.第四步,统计频数,计
2、算频率,制成表格第四步,统计频数,计算频率,制成表格.(频数(频数=样本数据落在各样本数据落在各小组内的个数,频率小组内的个数,频率=频数频数样本容量)样本容量)第五步,做平率分布直方图(横坐标是第五步,做平率分布直方图(横坐标是 组距,纵坐标是组距,纵坐标是 频率频率/组组距)距)月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O把频率分布直方图中个矩形的上面那条边的中点用曲线连接起来所得到的叫做频率分布折线,当分组足够多的时候,这条折线近乎平滑,此时我们称这条平滑的曲线为频率分布曲线,由于组距不可能无限制的缩小,
3、所以有时候这条曲线是不能画出的!由于平率分布直方图和频率分布折线所反映的信息中,都不包含原始数据,所以,为了能够反映出原始数据,并且还可以反映出数据的分布,我们介绍了第三种反应频率分布的方法茎叶图,茎叶图不仅保留了原始数据,而且可以随时修改,其作图步骤如下:第一步:将每个数据分为将每个数据分为“茎茎”(高位)和(高位)和“叶叶”(低位)两部分;(低位)两部分;第二步:将最小的茎和最大的茎之间的数按大小次序排成一列将最小的茎和最大的茎之间的数按大小次序排成一列第三不:将各个数据的叶按大小次序写在茎一侧将各个数据的叶按大小次序写在茎一侧.对于样本数据:对于样本数据:3.1,2.5,2.0,0.8,
4、1.5,1.0,4.3,2.7,3.1,3.5,用茎叶图可以表示如下:用茎叶图可以表示如下:茎叶0123480,50,5,71,1,53一、众数、中位数、平均数一、众数、中位数、平均数1、众数众数 在一组数据中,出现次数最多的数在一组数据中,出现次数最多的数据叫做这一组数据的众数。据叫做这一组数据的众数。2、中位数中位数 将一组数据按大小依次排列,将一组数据按大小依次排列,把处在最中间位置的一个数据(或两个数据把处在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数。的平均数)叫做这组数据的中位数。3、平均数平均数 x=1/n(x1+x2+xn)练习练习:在一次中学生田径运动会上,
5、在一次中学生田径运动会上,参加男子跳高的参加男子跳高的17名运动员的成绩如下名运动员的成绩如下表所示:表所示:成绩成绩(单位:米单位:米)1.50 1.60 1.65 1.70 1.751.80 1.85 1.90人数人数23234111分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的众数是次数最多,即这组数据的众数是1.75上面表里的上面表里的17个数据可看成是按从小到大的个数据可看成是按从小到大的顺序排列的,其中第顺序排列的,其中第9个数据个数据1.70
6、是最中间的一是最中间的一个数据,即这组数据的中位数是个数据,即这组数据的中位数是1.70;这组数据的平均数是这组数据的平均数是1.69米。米。答:答:17名运动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米).课时小结2众数、中位数与平均数的异同点是什么?众数、中位数与平均数的异同点是什么?提示提示:(1)众数、中位数与平均数都是描述一组数据集中趋势的量,平均众数、中位数与平均数都是描述一组数据集中趋势的量,平均数是最重要的量数是最重要的量 (2)众数考查各个数据出现的频率,大小只与这组数据中的部分数
7、众数考查各个数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响中位数可能在所给数据中,也可能不在所给数据中当一组数据中影响中位数可能在所给数据中,也可能不在所给数据中当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势的个别数据变动较大时,可用中位数描述其集中趋势(4)平均数与每一个样本的数据有关,任何一个样本数据的改变都会引平均数与每一个样
8、本的数据有关,任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具备的性质也正因为这个原因,起平均数的改变,这是众数、中位数都不具备的性质也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性息但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低降低(注意:实际问题中求得的平均数、众数和中位数应带上单位注意:实际问题中求得的平均数、众数和中位数应带上单位)如何通过频率分布直方图估计众数、中位数、平均数如何通过
9、频率分布直方图估计众数、中位数、平均数?(1)众数是最高矩形的中点。)众数是最高矩形的中点。(2)中位数两边直方图面积相等。)中位数两边直方图面积相等。(3)平均数等于每个小矩形的面积乘以小矩形底边)平均数等于每个小矩形的面积乘以小矩形底边中点的横坐标之和中点的横坐标之和。例:在上一节调查的例:在上一节调查的100位居民的月均用水位居民的月均用水量的问题中,得到样本数据的频率分布直方量的问题中,得到样本数据的频率分布直方图,你能由图得到月均用水量的众数,中位图,你能由图得到月均用水量的众数,中位数,平均数吗?数,平均数吗?频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组
10、距组距0.100.200.300.400.500.511.5 22.533.544.5 分组分组 频率频率 0,0.5)0.04 0.5,1)0.08 1,1.5)0.15 1.5,2)0.22 2,2.5)0.25 2.5,3)0.14 3,3.5)0.06 3.5,4)0.04 4,4.5)0.02 频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5众数为最高矩众数为最高矩形的中点形的中点众数为众数为2.25t频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距
11、组距0.100.200.300.400.500.511.5 22.533.544.5中位数左右两中位数左右两边直方图的面边直方图的面积应相等积应相等中位数为中位数为2.02t 频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5平均数为每个平均数为每个小矩形面积乘小矩形面积乘以小矩形底边以小矩形底边中点的横坐标中点的横坐标之和之和平均数为平均数为2.02当样本数据质量比较差时,使用众数、中位数或平均当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的
12、数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度要一个统计数字刻画样本数据的离散程度.这个数据就这个数据就是接下来我们要讲的是接下来我们要讲的方差和标准差方差和标准差.方差和标准差都是用来考察样本数据的分散程度的大小,最方差和标准差都是用来考察样本数据的分散程度的大小,最常用的统计量是标准差标准差常用的统计量是标准差标准差是样本数据到平均数的一种是样本数据到平均数的一种平均距离平均距离,一般用,一般用s表示标准差的平方叫做方差,一般用表示标准差的平方叫做方差,一般用来表
13、示,也为测量样本数据分散程度的工具方差或者标准来表示,也为测量样本数据分散程度的工具方差或者标准差越小就表示改组数据的离散程度较小,数据比较集中,气差越小就表示改组数据的离散程度较小,数据比较集中,气计算公式如下:计算公式如下:假设一组数据分别为:x1,x2,xn,其平均数为,则标准差为:例题讲解例例1:计算甲、乙两名运动员的射击成绩的标准差,比较其射:计算甲、乙两名运动员的射击成绩的标准差,比较其射击水平的稳定性击水平的稳定性.甲:甲:7 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 7s s甲甲=2=2,s s乙乙=1.095.=1.095.由此我们可以看出甲运动员成绩的方差大于乙的,说明甲的成绩波动较大,没有乙的稳定小结:众数、中位数、平均数各自优缺点小结:众数、中位数、平均数各自优缺点 众数:体现了样本数据的最大集中点,但对其它数据众数:体现了样本数据的最大集中点,但对其它数据 的忽视使得无法客观的反映总体特征。的忽视使得无法客观的反映总体特征。中位数:它不受少数几个极端值影响,在某些情况下是中位数:它不受少数几个极端值影响,在某些情况下是优点,但有时也会是缺点。优点,但有时也会是缺点。平均数:可以反映出更多关于样本数据全体信息,担起平均数:可以反映出更多关于样本数据全体信息,担起受极端值影响大。受极端值影响大。
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100