1、离中趋势测量法 变异指标如按数量关系来分有以下两类变异指标如按数量关系来分有以下两类;n n凡用绝对数来表达得变异指标凡用绝对数来表达得变异指标凡用绝对数来表达得变异指标凡用绝对数来表达得变异指标,统称绝对离势统称绝对离势统称绝对离势统称绝对离势;n n凡用相对数来表达得变异指标凡用相对数来表达得变异指标凡用相对数来表达得变异指标凡用相对数来表达得变异指标,统称相对离势统称相对离势统称相对离势统称相对离势;主要有极差、平均差、四分位差、标准差等。主要有异众比率、标准差系数、平均差系数和一些常用得偏态系数。变异指标用以反映总体各单位标志值得变动范围或参变异指标用以反映总体各单位标志值得变动范围或
2、参差程度差程度,与平均指标相对应与平均指标相对应,从另一个侧面反映了总体得特从另一个侧面反映了总体得特征。征。第一节 全距与四分位差1 1、全距全距全距全距(Range)(Range)R=X R=Xmaxmax X Xminmin 例例 求求7474,8484,6969,9191,8787,7474,6969这些数字这些数字得全距。得全距。解解 把数字按顺序重新排列把数字按顺序重新排列:6969,6969,7474,7474,8484,8787,9191,显然有显然有 R=XR=Xmaxmax X Xminmin 919169692222全距全距全距全距(R R):):最大值和最小值之差。也叫
3、极差最大值和最小值之差。也叫极差最大值和最小值之差。也叫极差最大值和最小值之差。也叫极差。全距越全距越全距越全距越大大大大,表示变动越大。表示变动越大。表示变动越大。表示变动越大。运用上述方法计算左边数列得全距对分组资料对分组资料对分组资料对分组资料,不能确知最大值和最小值不能确知最大值和最小值不能确知最大值和最小值不能确知最大值和最小值,求全距求全距求全距求全距:(1 1)用组值最大组得组中值减去最小组得组中值用组值最大组得组中值减去最小组得组中值 (2 2)用组值最大组得上限减去最小组得下限用组值最大组得上限减去最小组得下限 (3 3)用组值最大组得组中值减去最小组得下限用组值最大组得组中
4、值减去最小组得下限;或最大组得上限减去最小组得组中值或最大组得上限减去最小组得组中值优点优点:缺点缺点:计算简单、计算简单、计算简单、计算简单、直观。直观。直观。直观。(1 1)受极端值影响大受极端值影响大受极端值影响大受极端值影响大;(2 2)没有量度中间各个单位间得没有量度中间各个单位间得没有量度中间各个单位间得没有量度中间各个单位间得差异性差异性差异性差异性,数据利用率数据利用率数据利用率数据利用率 低低低低,信息丧失严信息丧失严信息丧失严信息丧失严重重重重;(3 3)受抽样变动影响大受抽样变动影响大受抽样变动影响大受抽样变动影响大,大样本全大样本全大样本全大样本全距比小样本全距大。距比
5、小样本全距大。距比小样本全距大。距比小样本全距大。2 2、四分位差四分位差四分位差四分位差(Quartile deviation)(Quartile deviation)第三四分位数和第一四分位数得半距。第三四分位数和第一四分位数得半距。第三四分位数和第一四分位数得半距。第三四分位数和第一四分位数得半距。避免全距受极端值影响大得缺点。避免全距受极端值影响大得缺点。避免全距受极端值影响大得缺点。避免全距受极端值影响大得缺点。求下列两组成绩得四分位差求下列两组成绩得四分位差求下列两组成绩得四分位差求下列两组成绩得四分位差:A:78 80 82 85 89 87 90 86 79 88 84 81A
6、78 80 82 85 89 87 90 86 79 88 84 81B:55 68 78 88 99 100 98 90 85 83 84 81B:55 68 78 88 99 100 98 90 85 83 84 81 请大家计算一下,看能否算对第二节 平均差(Mean absolute deviation(Mean absolute deviation)要测定变量值得离中趋势要测定变量值得离中趋势,尤其就是要测定各变量尤其就是要测定各变量值相对于平均数得差异情况值相对于平均数得差异情况,一个很自然得想法就就是一个很自然得想法就就是计计算各变量值与算术平均数得离差。算各变量值与算术平均数
7、得离差。平均差就是离差绝对平均差就是离差绝对平均差就是离差绝对平均差就是离差绝对值值值值得算术平均数。得算术平均数。得算术平均数。得算术平均数。(mean deviation)mean deviation)1 1、对于未分组资料对于未分组资料对于未分组资料对于未分组资料 A A D=D=2 2、对于分组资料对于分组资料对于分组资料对于分组资料 A A D=D=3 3、平均差得性质平均差得性质平均差得性质平均差得性质 在受抽样变动、极端值影响在受抽样变动、极端值影响在受抽样变动、极端值影响在受抽样变动、极端值影响,处理不确定组距处理不确定组距处理不确定组距处理不确定组距方面均同于算术平均数方面均
8、同于算术平均数方面均同于算术平均数方面均同于算术平均数;不适于代数运算不适于代数运算不适于代数运算不适于代数运算,其理论其理论其理论其理论意义不易阐述。意义不易阐述。意义不易阐述。意义不易阐述。例例例例1 1 试分别以算术平均数为基准试分别以算术平均数为基准试分别以算术平均数为基准试分别以算术平均数为基准,求求求求8585,6969,6969,7474,8787,9191,7474这些数字得平均差。这些数字得平均差。这些数字得平均差。这些数字得平均差。例例例例2 2 试以算术平均数为基准试以算术平均数为基准试以算术平均数为基准试以算术平均数为基准,求下表所示数据求下表所示数据求下表所示数据求下
9、表所示数据得平均差。得平均差。得平均差。得平均差。计算左边数列得平均差第三节 标准差(standard deviation)各变量值对其算术平均数得离差平方各变量值对其算术平均数得离差平方各变量值对其算术平均数得离差平方各变量值对其算术平均数得离差平方得算术平均数得平方根得算术平均数得平方根得算术平均数得平方根得算术平均数得平方根,均方差均方差,又称用又称用又称用又称用S S表示。表示。表示。表示。即克服平均差带有绝对值得缺点即克服平均差带有绝对值得缺点即克服平均差带有绝对值得缺点即克服平均差带有绝对值得缺点,又又又又保留其综合平均得优点。保留其综合平均得优点。保留其综合平均得优点。保留其综合
10、平均得优点。1 1、对于未分组资科对于未分组资科对于未分组资科对于未分组资科 求求7272、8181、8686、6969、5757这些数字得标准差。这些数字得标准差。大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点2 2、对于分组资对于分组资对于分组资对于分组资料料料料 计算左边数列得标准差 计算左边数列得标准差 例例例例 调查大一男生调查大一男生调查大一男生调查大一男生6060人得身高情况如下表所示人得身高情况如下表所示人得身高情况如下表所示人得身高情况如下表所示,求求求求她们身高
11、得标准差。她们身高得标准差。她们身高得标准差。她们身高得标准差。解解解解 因为就是分组资料因为就是分组资料因为就是分组资料因为就是分组资料,计算标准差运用加权式计算标准差运用加权式计算标准差运用加权式计算标准差运用加权式,并并并并参见下表参见下表参见下表参见下表 标准差就是反映总体各单位标志值得离散状况和差异标准差就是反映总体各单位标志值得离散状况和差异程度得最佳测度。程度得最佳测度。(1 1)以算术平均数为基准计算得标准差比以其她任以算术平均数为基准计算得标准差比以其她任何数值为基准计算得标准差要小。何数值为基准计算得标准差要小。“最小二乘方最小二乘方最小二乘方最小二乘方”性质性质性质性质各
12、变量值对算术平均数得离差得平方和各变量值对算术平均数得离差得平方和,必定小于她们必定小于她们对任何其她数偏差得平方和。对任何其她数偏差得平方和。(2 2)她将总体中各单位标志值得差异全包括在内她将总体中各单位标志值得差异全包括在内,受受抽样变动影响小。但在受极端值影响以及处理不确定组抽样变动影响小。但在受极端值影响以及处理不确定组距方面距方面,缺点同算术平均数。缺点同算术平均数。值得注意得就是值得注意得就是,在推论统计中我们将发现在推论统计中我们将发现,方差就是方差就是比标准差更有理论价值得概念。所谓方差比标准差更有理论价值得概念。所谓方差,即标准差得即标准差得平方平方,她直接写成她直接写成
13、也常被称为变异数。也常被称为变异数。3 3、标准差得性标准差得性标准差得性标准差得性质质质质4 4、标准分标准分标准分标准分(standard score)(standard score)以离差和标准差得比值来测定变量以离差和标准差得比值来测定变量以离差和标准差得比值来测定变量以离差和标准差得比值来测定变量 与与与与 得相得相得相得相对位置。使原来不能直接比较得离差标准化对位置。使原来不能直接比较得离差标准化对位置。使原来不能直接比较得离差标准化对位置。使原来不能直接比较得离差标准化,可以相可以相可以相可以相互比较互比较互比较互比较,加、减、平均。加、减、平均。加、减、平均。加、减、平均。(
14、1 1)Z Z就是和就是和就是和就是和X X一一对应得变量值一一对应得变量值一一对应得变量值一一对应得变量值;(2 2)Z Z分数没有单位分数没有单位分数没有单位分数没有单位,就是一个不受原资料就是一个不受原资料就是一个不受原资料就是一个不受原资料单位影响得相对数单位影响得相对数单位影响得相对数单位影响得相对数,所以可以用于不同单位所以可以用于不同单位所以可以用于不同单位所以可以用于不同单位资料得比较资料得比较资料得比较资料得比较;(3 3)Z Z分数实际表达了变量值距总体均值分数实际表达了变量值距总体均值分数实际表达了变量值距总体均值分数实际表达了变量值距总体均值有几个标准差。有几个标准差。
15、有几个标准差。有几个标准差。Z Z分数也有标准正态变量之称。按分数也有标准正态变量之称。按分数也有标准正态变量之称。按分数也有标准正态变量之称。按Z Z值大小编制值大小编制值大小编制值大小编制出得正态分布表出得正态分布表出得正态分布表出得正态分布表,其用途十分广泛。其用途十分广泛。其用途十分广泛。其用途十分广泛。Z Z分数得性质分数得性质分数得性质分数得性质:Z Z Z Z分数之和等于分数之和等于分数之和等于分数之和等于0 0 0 0Z Z分数得算术平均数等于分数得算术平均数等于分数得算术平均数等于分数得算术平均数等于0 0Z Z分数得标准差等于分数得标准差等于分数得标准差等于分数得标准差等于
16、1 1,方差也等于方差也等于方差也等于方差也等于1 1第四节 相对离势 上述各种反映离中趋势得变异指标上述各种反映离中趋势得变异指标,都具有和原都具有和原资料相同得计算单位资料相同得计算单位,称绝对离势。但欲比较具有不称绝对离势。但欲比较具有不同单位得资料得参差程度同单位得资料得参差程度,或比较单位虽相同而均值或比较单位虽相同而均值不相同得资料得参差程度不相同得资料得参差程度,离势得绝对指标则很可能离势得绝对指标则很可能导致某些错误结论。所以导致某些错误结论。所以,我们还得了解和学习相对我们还得了解和学习相对离势。离势。1 1、变异系数变异系数 绝对离势统计量与其算术平均数得比率绝对离势统计量
17、与其算术平均数得比率,用用V V表示。变异系数就是最具有代表性得相对离表示。变异系数就是最具有代表性得相对离势。势。n n全距系数全距系数 全距系数就是众数据得全全距系数就是众数据得全距与其算术平均数之比距与其算术平均数之比,其计其计算公式就是算公式就是n n平均差系数平均差系数 平均差系数就是众数据得平平均差系数就是众数据得平均差与其算术平均数之比均差与其算术平均数之比,其其计算公式就是计算公式就是n n标准差系数标准差系数 标准差系数就是众数据得标标准差系数就是众数据得标准差与其算术平均数之比准差与其算术平均数之比,其其计算公式就是计算公式就是 2 2、异众比率异众比率 所谓异众比率所谓异
18、众比率,就是指非众数得频数与总体单位就是指非众数得频数与总体单位数数得比值得比值,用用VV R R来表示来表示 其中其中:为众数得频数为众数得频数;就是总体单位数就是总体单位数 异众比率能表明众数所不能代表得那异众比率能表明众数所不能代表得那异众比率能表明众数所不能代表得那异众比率能表明众数所不能代表得那一部分变量值在总体中得比重。一部分变量值在总体中得比重。一部分变量值在总体中得比重。一部分变量值在总体中得比重。例例1 1:某项调查发现某项调查发现,现今三口之家得家庭最多现今三口之家得家庭最多(32%32%),),求异众比率。某开发商根据这一报导求异众比率。某开发商根据这一报导,将房将房屋得
19、户型大部分都设计为适合三口之家居住得样式和面屋得户型大部分都设计为适合三口之家居住得样式和面积积,您认为如何呢?您认为如何呢?例例2 2:设为测体重设为测体重,得到成人组和婴儿组各得到成人组和婴儿组各100100人得人得两个抽样总体。成人组平均体重为两个抽样总体。成人组平均体重为6565千克千克,全距为全距为1010千千克克;婴儿组平均体重为婴儿组平均体重为4 4千克千克,全距为全距为2 2、5 5千克。能否认千克。能否认为成人组体重得离势比婴儿组体重得离势大?为成人组体重得离势比婴儿组体重得离势大?例例3 3:对一个群体测量身高和体重对一个群体测量身高和体重,平均身高为平均身高为170170、2 2厘米厘米,身高标准差为身高标准差为5 5、3030厘米厘米;平均体重为平均体重为7070千克千克,体重标准差为体重标准差为4 4、7777千克。比较身高和体重得离散程度。千克。比较身高和体重得离散程度。






