1、第三章集中量数集中趋势和离中趋势是次数分布的 个基本特征。数据的集中趋势是指数据分布中大量数据向 某方向集中的程度,用来描述这一特点的统计量 称为集中量数。常用的集中量数包括算术平均数、加权平均数、中位数和众数等等。数据的离中趋势指数据中数据彼此的分散程 度,用来描述这一特点的统计量称为差异量数。算术平均数(arithmetic average)一般简称为平均数(average)或均 数、均值(/we),一般用表示,或X算术平均数是最常用的集中量。算术平均数的计算方法原始数据计算公式+X_ Xr+X2+八n(4.1)n1X=EX n算术平均数的特点在一组数据中,每个变量与平均数的差(离差)的总
2、和为零。Ex=YXi-X=O在一组数据中,每个数都加上一个常数C,则所得 的平均数为原来的平均数加常数c w(c+x)-=c+xN在一组数据中,每个数都乘上一个常数C,则所得 的平均数为原来的平均数乘常数C W(CxX)=Cx1N使用次数分布表计算平均数x=fiXcl+f2xC2+7kx fi+fi+.+fkGt _ 1kEfjXQ j=lna1x=EfXcn表47 52名学生数学成绩平均数计算表成绩组中值Xc频数fF*Xc计算95-97.5219590-92.521851 x=EfXc85-87.53262.580-52.55262.5n75 77.586203595.070-72.5117
3、97.55265 67.59607.560-62.55312.5=69.1355 57.5423050-52.5210545 47.5147.5合计523595.0二、算术平均数的意义算术平均数是应用最普遍的一种集中量O它是真值”(true score)的最佳估计值。真值是反映某种现象的真实水平的分数o由于测量过程中的各种偶然因素的影响,真值 往往很难得到。在实际测量中,往往采用“多次测量,取平均数”的方法,用平均数去估计真值。三、算术平均数的优缺点优点:算术平均数具备一个良好的集中 量所应具备的一些特点:反应灵敏、有公式 严密确定、简明易懂、适合代数运算等等,因此是一个最常用的集中量。主要不
4、足:容易受两极端数值的影响;一组数据中有模糊不清的数值时无法计算。比I、计算和应用算术平均数的原则同质性原则:算术平均数只能用于表示 同类数据的集中趋势。平均数与个体数值相结合的原则:在解 释个体特征时,既要看平均数,也要结合个 体的数据。平均数与标准差、方差相结合原则:描 述一组数据时既要分析其集中趋势,也要分 析离散程度。第二个中位数中位数(median)又称为中数,是按顺序排列的一组数据中位于中间位置的数。中位数是常用集中量的一种。,般用Md或Afd表示o1、中位数的计算方法原始数据计算法1、一组数据中无重复数值的-首先将一组数据按顺序排列若为奇数则。为第,个数x+x+1若为偶数,则=2
5、 222一组数据中有重复数值的-1)重复数值没有位于中间的,与 无重复数值的一样求中位数-2)当重复数值位于中间,数列个 数为奇数的如:11 11 11 11 13 13 13 17 17-3)当重复数值位于中间,数列个数为偶数的次数分布表计算法由次数分布表计算中位数 需要用到累积次数分布表。当表中数据的累积方向不 同时,计算公式也不同。表4-2 52名学生数学成绩次数分布表74.457411成绩频数f累积频数95-25273.551090-25073.1985-34872.65880-54572.2775 84071.75670-113271.3565 92170.8546051270.43
6、55 4769.952502369.5145 11合计52由下至上累积频数计算公式(n A iMd=Lb+fb(4.3a)I 2)J Md公式中:Lb为中位数所在组的精确下限 f b为中位数所在组下限以下的累积频数n为数据总和fMd为中位数所在组的频数 i为组距由上至下累积频数计算公式Md=L-f(4.3b)J MdG J a k2 J公式中:而为中位数所在组的精确上限后为中位数所在组上限以上的累积频数为数据总和为中位数所在组的频数.为组距95252902508534880545758407011326592160512554750234511-=262 2(ii Md=Lb+-fb12I f
7、Md=69.5+(26 2 哈=71.77合计523.中位数的特点及应用中位数是根据全部数据的个数来确定其位置的,意义简明,对按顺序排列的数据来讲,计算中位数 也比较容易。中位数不受两端极端数据的影响,但 反应不灵敏,也不适合进一步代数运算的要求。一 般用于下列情况:一组数据中有极端数据时;一组数据中有个别数据不确切、不清楚时;资料属于等级性质时。众数(mode)用心表示,有两种定义:y理法分效是指与频数分布曲线最高点相 对应的横坐标上的一点;7一陷众劾是一组数据中出现次数最多的那个数。众数也是一种集中量,也可用来表示一 组数据的集中趋势。1.众数的计算方法观察法寻找粗略众数未分组数据中出现次
8、数最多的数即为众数。次数分布表中,频数最多那一组数据的组中 值,即为众数。公式法计算理论众数的近似值用公式计算的众数称为理论众数。一般在心 理与教育统计中常用的公式有皮尔逊的经验公式 和金氏插补法公式。皮尔逊经验公式Mo3Md-2X金氏插补法(4.5)M儿+JaJ a+J b(4.6)皮尔逊经验公式只有当数据分布呈正态或接 近正态时才能使用。当数据分布呈偏态时,一般 用金氏插补法计算众数。2.众数的优缺点众数的概念简单易懂,但 比较粗略,不能灵敏地反映一 组数据的变化,而且不适合进 一步代数运算。一般用于类别 变量或等级变量的资料。4.算术平均数、中位数、众数三者的关系在正态分布中:M=Md=
9、M0在正偏态分布中:M Md Mo在负偏态分布中:M Md Mo第四个其它集中量数除了算术平均数、中位数 和众数以外,在应用中还有一 些其它集中量。这些统计指标 可以从其它角度描述一组数据 的集中趋势。1,加权平均数加权平均数是不同比重数据(或平均数)的平均数,一般用X.表示。其计算公式有两种:ZW.-X.1/C1/X(4.7)E x,、Xvr=(4 8)Zn.所谓权数是指各变量在构成总体中的重要性程度o2、几何平均数几何平均数(geometric mean)是n个数 值连乘积的n次方根,用Mg或簿 表示。计 算公式为Mg=气1乂(4.9)当数据的分布呈偏态时,可用几何平均数 表示该组数据的集中趋势。几何平均数的变式P2.工X”再乂 X2 X_1(4.10)两边取对数,得1lgMg=(lgX一IgXjn-1注意:几何平均数计算的是平均的变化情况,如果要 计算平均增长率,需要从几何平均数中减去基数1。集中量可用统计量建议统计量称名变量众数众数顺序变量众数、中位数中位数等距变量众数、中位数、平均数平均数比率变量众数、中位数、平均数平均数练习与思考第78页和79页的各练习题。注意观察和收集我们生活中的资料,分析在集中量的使用中,哪些是正确的,哪些是错误的?
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100