资源描述
2024/8/8 周四第五章 离中趋势的量度110名同学的成绩:名同学的成绩:78 80 82 85 89 87 90 86 79 88另另10名同学的成绩名同学的成绩55 68 78 88 99 100 98 90 85 83均值相等(均值相等(84.4),但两组数据有差别吗),但两组数据有差别吗?是否有必要去计算一下数据之间的差?是否有必要去计算一下数据之间的差距呢?距呢?2024/8/8 周四第五章 离中趋势的量度2A组:组:60,60,60,60,60B组:组:58,59,60,61,62C组:组:40,50,60,70,80D组:组:80,80,80,80,80平均数不同,离势可能相同;平均数相同,平均数不同,离势可能相同;平均数相同,离势可能不同。离势可能不同。2024/8/8 周四第五章 离中趋势的量度3第一节第一节 全距与四分位差全距与四分位差1.全距全距(range)全距(全距(R):最大值和最小值之差。也叫):最大值和最小值之差。也叫极差极差。全距越大,。全距越大,表示变动越大。表示变动越大。对分组资料,不能确知最大值和最小值:对分组资料,不能确知最大值和最小值:1、组值最大组的组中值减去最小组的组中值、组值最大组的组中值减去最小组的组中值 2、组值最大组的上限减去最小组的下限、组值最大组的上限减去最小组的下限 3、组值最大组的组中值减去最小组的下限;最大组的、组值最大组的组中值减去最小组的下限;最大组的上限减去最小组的组中值上限减去最小组的组中值2024/8/8 周四第五章 离中趋势的量度42024/8/8 周四第五章 离中趋势的量度5求下列两组成绩的全距:求下列两组成绩的全距:A:78 80 82 85 89 87 90 86 79 88B:55 68 78 88 99 100 98 90 85 83优点:计算简单、直观。优点:计算简单、直观。缺点:受极端值影响大;缺点:受极端值影响大;没有量度中间各个单位间的差异性,数据没有量度中间各个单位间的差异性,数据利用率利用率 低,信息丧失严重;低,信息丧失严重;受抽样变动影响大,大样本全距比小样本全受抽样变动影响大,大样本全距比小样本全距大。距大。2024/8/8 周四第五章 离中趋势的量度62.四分位差四分位差(Quartile deviation)QD:第三四分位数和第一四分位数的半距。:第三四分位数和第一四分位数的半距。避免全距受极端值影响大的缺点。避免全距受极端值影响大的缺点。QD=2024/8/8 周四第五章 离中趋势的量度7求下列两组成绩的四分位差:求下列两组成绩的四分位差:A:78 80 82 85 89 87 90 86 79 88 84 81B:55 68 78 88 99 100 98 90 85 83 84 81A:78,79,80,81,82,84,85,86,87,88,89,90B:55,68,78,81,83,84,85,88,90,98,99,1002024/8/8 周四第五章 离中趋势的量度8第二节第二节 平均差平均差(Mean absolute deviation(Mean absolute deviation)离差离差各变量值与算术平均数的差各变量值与算术平均数的差平均差平均差离差绝对值的算术平均数。(离差绝对值的算术平均数。(mean deviation)1.未分组资料未分组资料 A D=2.分组资料分组资料 A D=3.平均差的性质:平均差的性质:仍属算术平均数;在受抽样变动、极端值影响,理论意仍属算术平均数;在受抽样变动、极端值影响,理论意义不易阐述义不易阐述有时以中位数为基准来计算平均差更合理。有时以中位数为基准来计算平均差更合理。2024/8/8 周四第五章 离中趋势的量度9例例521 试分别以算术平均数为基准,试分别以算术平均数为基准,求求85,69,69,74,87,91,74这些数这些数字的平均差。字的平均差。例例522 试以算术平均数为基准,求下试以算术平均数为基准,求下表所示数据的平均差。表所示数据的平均差。2024/8/8 周四第五章 离中趋势的量度10人口数(人口数(X)户数户数(f)频率频率(P)23456785816106410.100.160.320.200.120.080.02合计合计501.002024/8/8 周四第五章 离中趋势的量度11第三节第三节 标准差标准差S(standard deviation)意义意义:克服平均差带有绝对值的缺点,又保留其优点。:克服平均差带有绝对值的缺点,又保留其优点。定义定义:各变量值对其算术平均数的离差平方的算术平均:各变量值对其算术平均数的离差平方的算术平均数的平方根。(均方差)数的平方根。(均方差)Describes how scores of an interval/ratio variable are spread across the distribution to the mean score.1.未分组资料未分组资料 S=2024/8/8 周四第五章 离中趋势的量度12 S=2024/8/8 周四第五章 离中趋势的量度13方差方差方差(方差(variance,2,S2):各数据与平均数差数各数据与平均数差数的平方和的平均值称为方差,也称为变异的平方和的平均值称为方差,也称为变异数。数。因此,方差的定义公式为:因此,方差的定义公式为:2=(X-)2/n-1 S2=(X-)2/n-12024/8/8 周四第五章 离中趋势的量度14例例1:求:求72、81、86、69、57这些数字的标准这些数字的标准差和方差。差和方差。简算式:简算式:S=2024/8/8 周四第五章 离中趋势的量度152.分组资料分组资料S=S=2024/8/8 周四第五章 离中趋势的量度16求下表数据资料的标准差求下表数据资料的标准差2024/8/8 周四第五章 离中趋势的量度17l是反映总体各单位标志值的离散状况和差异程度的最是反映总体各单位标志值的离散状况和差异程度的最佳测度。佳测度。(1)以算术平均数为基准计算的标准差比以其他任何数)以算术平均数为基准计算的标准差比以其他任何数值为基准计算的标准差要小。值为基准计算的标准差要小。“最小二乘方最小二乘方”性质性质各变量值对算术平均数的离差的平方和,必定小于各变量值对算术平均数的离差的平方和,必定小于他们对任何其他数偏差的平方和。他们对任何其他数偏差的平方和。(2)它将总体中各单位标志值的差异全包括在内,受抽)它将总体中各单位标志值的差异全包括在内,受抽样变动影响小。但在受极端值影响以及处理不确定组样变动影响小。但在受极端值影响以及处理不确定组距方面,缺点同算术平均数。距方面,缺点同算术平均数。l方差:标准差的平方。方差:标准差的平方。3.标准差的性质标准差的性质2024/8/8 周四第五章 离中趋势的量度18问:已知一组数列的平均数和标准差,此问:已知一组数列的平均数和标准差,此时若将该组数列的每一个变量值均增加时若将该组数列的每一个变量值均增加10形成一组新数列,请问新数列的平均形成一组新数列,请问新数列的平均数和标准差怎样变化。数和标准差怎样变化。注意注意:样本标准差样本标准差(Sample Standard Deviation):n-1样本方差样本方差2024/8/8 周四第五章 离中趋势的量度19假如两个学生都通过不同的大学入学考试,共同假如两个学生都通过不同的大学入学考试,共同向一个学校申请奖学金。设向一个学校申请奖学金。设Mary参加的是参加的是ACT(the Academic College Testing Service)and scored 26 ACT points,036 John 参加的参加的是是SAT(the Stanford Admissions Test)and scored 900 SAT points.2001600另有其他数据,另有其他数据,ACT:Mean=22,S=2SAT:Mean=1000,S=100请问若只能一人获奖,应该给谁?请问若只能一人获奖,应该给谁?2024/8/8 周四第五章 离中趋势的量度204.标准分标准分(standardized score)定义:以离差和标准差的比值来测定变量定义:以离差和标准差的比值来测定变量X 与与 的相对的相对位置。使原来不能直接比较的离差标准化,可以相互位置。使原来不能直接比较的离差标准化,可以相互比较,加、减、平均比较,加、减、平均 Z=z分数的特性:分数的特性:1、z是和是和X一一对应的变量值。一一对应的变量值。2、Z分数没有单位,是一个不受原资料单位影响的相对分数没有单位,是一个不受原资料单位影响的相对数,所以可以用于不同单位资料的比较。数,所以可以用于不同单位资料的比较。3、Z分数实际表达了变量值距总体均值有几个标准差。分数实际表达了变量值距总体均值有几个标准差。Z=2,Z=3.2,标准正态变量标准正态变量2024/8/8 周四第五章 离中趋势的量度21Z分数的性质:分数的性质:1、Z分数之和等于分数之和等于02、Z分数的算术平均数等于分数的算术平均数等于03、Z分数的标准差等于分数的标准差等于1,方差也等于,方差也等于1实际意义:以均值为基础,以标准差为量度单位,各实际意义:以均值为基础,以标准差为量度单位,各总体之间可以通过标准分进行合理的比较和相加。总体之间可以通过标准分进行合理的比较和相加。2024/8/8 周四第五章 离中趋势的量度22Z分数的应用分数的应用(1)可用于比较分数性质不同的观测值在各可用于比较分数性质不同的观测值在各自数据分布中的相对位置高低。自数据分布中的相对位置高低。(2)当已知各不同质的观测值的次数分布为当已知各不同质的观测值的次数分布为正态分布时,可用正态分布时,可用Z分数求不同观测值的分数求不同观测值的总和或均值,以表示在团体中的相对位总和或均值,以表示在团体中的相对位置。置。2024/8/8 周四第五章 离中趋势的量度23例例1:甲班的平均分为:甲班的平均分为80分,乙班的平均分为分,乙班的平均分为60分,标准分,标准差都为差都为10分,分,A、B分别属于甲、乙两班。分别属于甲、乙两班。A的成绩为的成绩为80分,分,B的成绩为的成绩为75分,试比较两学生成绩的好坏。分,试比较两学生成绩的好坏。例例2:甲乙两班的平均分均为:甲乙两班的平均分均为60分,甲班的标准差为分,甲班的标准差为10,乙班的标准差为乙班的标准差为20分,分,A、B分别属于甲、乙两班,成分别属于甲、乙两班,成绩均为绩均为80分,试比较两学生成绩的好坏。分,试比较两学生成绩的好坏。一个一个20岁的大学生智力测验中作对了岁的大学生智力测验中作对了35个题目,一个个题目,一个6岁岁的儿童作对了的儿童作对了9个题目,谁更聪明?个题目,谁更聪明?2024/8/8 周四第五章 离中趋势的量度24作业作业1.计算下列数据的全距、平均差、方差和标准差计算下列数据的全距、平均差、方差和标准差 78 80 82 85 89 87 90 86 79 88 55 68 78 88 99 100 98 90 85 832.2024/8/8 周四第五章 离中趋势的量度252.求下表频次分布的标准差求下表频次分布的标准差2024/8/8 周四第五章 离中趋势的量度263.下列数据是从下列数据是从1620岁的抽烟者中抽出的样本。岁的抽烟者中抽出的样本。X为每天抽烟支数,为每天抽烟支数,mean=15支,支,S=5支。请完支。请完成下表。成下表。CaseXZ(standardized score)张三张三17李四李四30王五王五4马六马六202024/8/8 周四第五章 离中趋势的量度27第四节第四节 相对离势相对离势 用离势的绝对离势除以其平均指标就得到离用离势的绝对离势除以其平均指标就得到离势的相对指标,称为相对离势。势的相对指标,称为相对离势。当所对比的两个数列的水平高低不同时,就当所对比的两个数列的水平高低不同时,就不能采用全距、平均差或标准差进行对比分析,不能采用全距、平均差或标准差进行对比分析,因为它们都是绝对指标,其数值的大小不仅受因为它们都是绝对指标,其数值的大小不仅受各单位标志值差异程度的影响,而且受到总体各单位标志值差异程度的影响,而且受到总体单位标志值本身水平高低的影响;为了对比分单位标志值本身水平高低的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的影响。就必须消除数列水平高低的影响。2024/8/8 周四第五章 离中趋势的量度28 1、异众比率异众比率:非众数的频数与总体单位数的比值。:非众数的频数与总体单位数的比值。V R表示表示意义:能表明众数所不能代表的那一部分变量值在总体意义:能表明众数所不能代表的那一部分变量值在总体中的比重。中的比重。2、变异系数:绝对离势统计量与其算术平均数的比率,、变异系数:绝对离势统计量与其算术平均数的比率,用用V表示。表示。(1)全距系数全距系数:数列中全距与算术平均数之比。:数列中全距与算术平均数之比。(2)平均差系数平均差系数:数列中各变量的平均差与其算术平均:数列中各变量的平均差与其算术平均数之比。数之比。(3)标准差系数标准差系数:数列中各变量的标准差与其算术平均:数列中各变量的标准差与其算术平均数之比。数之比。变异系数的意义变异系数的意义:对不同性质、不同水平总体的离:对不同性质、不同水平总体的离 散程度进行比较。散程度进行比较。2024/8/8 周四第五章 离中趋势的量度29例例1:某项调查发现,现今三口之家的家庭最多(某项调查发现,现今三口之家的家庭最多(32%),),求异重比率。某开发商根据这一报导,将房屋的户型求异重比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样式和面积,你大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?认为如何呢?例例2:设为测体重,得到成人组和婴儿组各:设为测体重,得到成人组和婴儿组各100人的两个人的两个抽样总体。成人组平均体重为抽样总体。成人组平均体重为65千克,全距为千克,全距为10千克;千克;婴儿组平均体重为婴儿组平均体重为4千克,全距为千克,全距为2.5千克。能否认为成千克。能否认为成人组体重的离势比婴儿组体重的离势大?人组体重的离势比婴儿组体重的离势大?例例3:对一个群体测量身高和体重,平均身高为:对一个群体测量身高和体重,平均身高为170.2厘米,厘米,身高标准差为身高标准差为5.30厘米;平均体重为厘米;平均体重为70千克,体重标准千克,体重标准差为差为4.77千克;比较身高和体重的离散程度。千克;比较身高和体重的离散程度。2024/8/8 周四第五章 离中趋势的量度303.偏态系数偏态系数偏态偏态=算术平均数算术平均数-众数众数偏斜系数偏斜系数=偏态偏态/标准差标准差=0,对称分布,对称分布;0为右偏;为右偏;0为左为左偏偏-3,+32024/8/8 周四第五章 离中趋势的量度31练习:甲乙两单位职工工资资料如下:练习:甲乙两单位职工工资资料如下:练习:甲乙两单位职工工资资料如下:练习:甲乙两单位职工工资资料如下:试比较哪个单位的职工工资差异程度小试比较哪个单位的职工工资差异程度小试比较哪个单位的职工工资差异程度小试比较哪个单位的职工工资差异程度小月工资月工资甲单位(人)甲单位(人)乙单位(人)乙单位(人)600以下以下21600700427008001048009007129001000661000110045合计合计33302024/8/8 周四第五章 离中趋势的量度32SPSS基本统计基本统计在中可以很容易地得出频数分布表,平均在中可以很容易地得出频数分布表,平均数,标准差等。数,标准差等。2024/8/8 周四第五章 离中趋势的量度33界面菜单界面菜单l菜单栏:菜单栏:file(SPSS文件的操作)文件的操作)lEdit(编辑菜单)(编辑菜单)lView(用户界面设置菜单)(用户界面设置菜单)lData(数据文件建立和编辑菜单)(数据文件建立和编辑菜单)lTransform(数据基本处理菜单)(数据基本处理菜单)lAnalyze(统计分析菜单,主要统计功能)(统计分析菜单,主要统计功能)lGraphs(统计图形菜单)(统计图形菜单)lUtilities(相关应用和设置菜单)(相关应用和设置菜单)lWindows(各窗口切换菜单)(各窗口切换菜单)lHelp(帮助菜单)(帮助菜单)2024/8/8 周四第五章 离中趋势的量度34一、频数分布一、频数分布频数分布:可以概略地看到资料的分布情况,可频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。做初步整理之用,从中还可检查数据输入情况。Analyze Descriptive Statistics Frequencies可选入多个变量。可选入多个变量。2024/8/8 周四第五章 离中趋势的量度352024/8/8 周四第五章 离中趋势的量度362024/8/8 周四第五章 离中趋势的量度37二、描述统计分析过程二、描述统计分析过程对于定距以上变量,可以进行集中趋势和对于定距以上变量,可以进行集中趋势和离中趋势的统计离中趋势的统计Analyze Descriptive Statistics Descriptives变量可多选变量可多选 其中选项有:其中选项有:Mean Std.deviation Minimum 2024/8/8 周四第五章 离中趋势的量度382024/8/8 周四第五章 离中趋势的量度39Statistics:Dispersion(离差栏)离差栏):Std.Deviation标准差标准差 Variance 方差方差 Range全距全距Minimum Maximum S.E.mean均数的标准误均数的标准误Central Tendency(集中趋势栏)集中趋势栏)Mean Median Mode Sum例:例:09-012024/8/8 周四第五章 离中趋势的量度40Distribution(分布参数)分布参数)Skewness偏度(偏度(0,1.5,0.5,-0.5)标准正态分布,值为标准正态分布,值为0;正数,右偏;负数,左偏;正数,右偏;负数,左偏;值绝对值大于值绝对值大于1,则可肯定数据的分布不成正态分,则可肯定数据的分布不成正态分布布 Kurtosis 峰度(峰度(0,正,负):尖平程度,正,负):尖平程度 标准正态分布,值为标准正态分布,值为0;大于;大于0,分布比标准正态,分布比标准正态分布峰高(尖);小于分布峰高(尖);小于0,2024/8/8 周四第五章 离中趋势的量度412024/8/8 周四第五章 离中趋势的量度42还可直接作出图形:还可直接作出图形:Charts:Bar charts:条形图条形图Pie Charts:圆图、饼图圆图、饼图Histograms:直方图。只适用于连续的数值直方图。只适用于连续的数值型变量。型变量。2024/8/8 周四第五章 离中趋势的量度432024/8/8 周四第五章 离中趋势的量度442024/8/8 周四第五章 离中趋势的量度451、各观察值均加减同一数后(、各观察值均加减同一数后()A、均数不变,标准差改变、均数不变,标准差改变 B、均数改变,标准差不变、均数改变,标准差不变 C、两者均改变、两者均改变 D、两者均不变、两者均不变2、比较身高和体重两组数据变异度大小宜采用(、比较身高和体重两组数据变异度大小宜采用()A、标准差、标准差 B、变异系数、变异系数 C、极差、极差 D、离差、离差3、以下指标中(、以下指标中()可用来描述计量资料的离散程度。)可用来描述计量资料的离散程度。A、算术均数、算术均数 B、几何均数、几何均数 C、中位数、中位数 D、标准差、标准差4、偏态分布,宜用(、偏态分布,宜用()描述其分布的集中趋势。)描述其分布的集中趋势。A、算术均数、算术均数 B、标准差、标准差 C、中位数、中位数 D、四分位差、四分位差综合练习综合练习综合练习综合练习1 12024/8/8 周四第五章 离中趋势的量度465、某地调查、某地调查20岁男大学生岁男大学生100名,身高标准差为名,身高标准差为4.09cm,体重标准差为体重标准差为4.10kg,比较两者的变异程度,结果(,比较两者的变异程度,结果()。)。A、体重变异度大、体重变异度大 B、身高变异度较大、身高变异度较大 C、两者变异度、两者变异度相同相同 D、由于单位不同,两者标准差不能直接比较。、由于单位不同,两者标准差不能直接比较。6、均数总是大于中位数。、均数总是大于中位数。7、均数总是比标准差大、均数总是比标准差大。8、样本均数大时,标准差也一定会大。、样本均数大时,标准差也一定会大。9、样本量增大时,极差会增大。、样本量增大时,极差会增大。
展开阅读全文