收藏 分销(赏)

统计学变异指标.ppt

上传人:精*** 文档编号:2091670 上传时间:2024-05-15 格式:PPT 页数:49 大小:1.52MB
下载 相关 举报
统计学变异指标.ppt_第1页
第1页 / 共49页
统计学变异指标.ppt_第2页
第2页 / 共49页
统计学变异指标.ppt_第3页
第3页 / 共49页
统计学变异指标.ppt_第4页
第4页 / 共49页
统计学变异指标.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、四、变异指标四、变异指标概念:概念:越大,表明数据越分散、不集中;越大,表明数据越分散、不集中;变异指标越小,表明数据越集中,变动范围变异指标越小,表明数据越集中,变动范围越小。越小。一、变异指标的概念一、变异指标的概念 它是反映总体中它是反映总体中各单位标各单位标志值差异程度的综合指标。志值差异程度的综合指标。一、变异指标的概念一、变异指标的概念一、变异指标的概念一、变异指标的概念 变异指标(标志变动度)变异指标(标志变动度),平均指标说明总体各单位变量值分布的集中趋势;平均指标说明总体各单位变量值分布的集中趋势;平均指标是说明总体各单位某一数量标志一般水平的综合指平均指标是说明总体各单位某

2、一数量标志一般水平的综合指标。标。但是,平均指标将总体各单位标志值的差异抽象化了,是但是,平均指标将总体各单位标志值的差异抽象化了,是总体各单位标志总体各单位标志值的代表水平,它不能反映总体各单位标志值值的代表水平,它不能反映总体各单位标志值的差异情况。例如,的差异情况。例如,变异指标说明总体各单位变量值分布的离中趋势或分散程度。变异指标说明总体各单位变量值分布的离中趋势或分散程度。工人姓名工人姓名 甲甲 乙乙 丙丙 丁丁 戊戊 460 460 520 520 600 600 700 700 850850奖金额(元)奖金额(元)数量标志数量标志标志值(变量值)标志值(变量值)平均奖金平均奖金=

3、626626(元)(元)离中趋势的概念:离中趋势的概念:指总体中各单位标志值背离分布中心(平均数)的指总体中各单位标志值背离分布中心(平均数)的程度,也就是总体各单位标志值之间差异程度,用标志程度,也就是总体各单位标志值之间差异程度,用标志变异指标反映其大小。变异指标反映其大小。平均数平均数 (3 3)试问)试问A、C 两门课程平均两门课程平均考分更有代表性?考分更有代表性?表表 例如,例如,A课程课程考分:考分:65 70 75 80 8565 70 75 80 85 B课程课程考分:考分:68 70 76 80 8168 70 76 80 81学生学生序号序号 各课程考分各课程考分(分)(

4、分)xAxBxC甲甲乙乙丙丙丁丁戊戊 65 65 70 70 75 75 80 80 85 8568687070767680808181 79 79 85 85 90 90 95 95100100合合 计计 375375375375449449 (1 1)试计算)试计算A、B、C三门课程三门课程的平均考分。的平均考分。(2 2)试问)试问A、B两门课程平均两门课程平均考分哪个更有代表性?考分哪个更有代表性?65657575 85 85 B 组组 A 组组变异大变异大变异小变异小 标志变异指标与平均数的代表性成反比,表明总体各单位标志变异指标与平均数的代表性成反比,表明总体各单位标志值的分散程度

5、。即标志变异指标数值越大,平均数的代标志值的分散程度。即标志变异指标数值越大,平均数的代表性越小。例表性越小。例二、标志变异指标的作用二、标志变异指标的作用二、标志变异指标的作用二、标志变异指标的作用 1.1.它是衡量平均数代表性的尺度。它是衡量平均数代表性的尺度。2.2.它可以反映社会经济活动过程的均衡性或稳定它可以反映社会经济活动过程的均衡性或稳定性程度。性程度。3.3.它还是抽样分析和相关分析的重要指标。它还是抽样分析和相关分析的重要指标。注意:注意:标志变异指标的作用是在与平均指标结合中产生标志变异指标的作用是在与平均指标结合中产生的,离开了平均指标,它就失去了意义。而它与平均指标的,

6、离开了平均指标,它就失去了意义。而它与平均指标相结合,则可全面反映总体的特征,并对平均指标的代表相结合,则可全面反映总体的特征,并对平均指标的代表性做出评价。性做出评价。例:某车间两个生产小组各人日产量(件)如下:例:某车间两个生产小组各人日产量(件)如下:甲组:甲组:20 40 60 70 80 100 12020 40 60 70 80 100 120 乙组:乙组:67 68 69 70 71 72 7367 68 69 70 71 72 73 甲、乙两组工人的平均产量都为70件。通过观察可以看出,甲组数据的变异程度较大,乙组数据的变异程度较小。也可以用图示的方法观察产量的变异情况:举例举

7、例:衡量平均数代表性衡量平均数代表性70707070甲组甲组乙组乙组结论:结论:标志变异程度和平均数的代表性呈反比关系。标志变异程度和平均数的代表性呈反比关系。产量差异产量差异程度较大程度较大产量差异产量差异程度较小程度较小举例:举例:反映社会经济活动过程的均衡性反映社会经济活动过程的均衡性观察:哪个厂供货比较均衡?观察:哪个厂供货比较均衡?钢厂钢厂供货计划完成百分比供货计划完成百分比(%)(%)季度总供货计季度总供货计划执行结果划执行结果一月一月二月二月三月三月甲厂甲厂100323434乙厂乙厂100203050表表(一)变异指标的种类(数值)(一)变异指标的种类(数值)绝对指标(与原变量值

8、名数相同)绝对指标(与原变量值名数相同)相对指标(表现为无名数)相对指标(表现为无名数)全距全距平均差平均差标准差标准差全距全距系数系数平均差平均差系数系数标准差标准差系数系数 三、变异指标的计算方法三、变异指标的计算方法 分类:分类:全距全距 平均差平均差 标准差标准差 变异系数变异系数全距全距全距 R R(rangerange):测定标志变异程度的最测定标志变异程度的最简单的指标,它是标志的简单的指标,它是标志的最大值和最小值之差最大值和最小值之差,反,反映总体标志值的变动范围。映总体标志值的变动范围。公式:全距最大标志值最小标志值公式:全距最大标志值最小标志值 RXmaxXmin评价:评

9、价:从计算可知,全距仅取决于从计算可知,全距仅取决于两个极端数两个极端数值值,不能全面反映总体各单位标志值变异的程度,不能全面反映总体各单位标志值变异的程度,也不能拿来评价平均指标的代表性。也不能拿来评价平均指标的代表性。计算:R=XmaxXmin例、甲同学成绩全距例、甲同学成绩全距R=93 70=22(分分)乙同学成绩全距乙同学成绩全距R=98 51=47(分分)特点:计算方便,易于理解;特点:计算方便,易于理解;易受极端数值的影响。易受极端数值的影响。全距【例例例例2 2 2 2】某季度某工业公司某季度某工业公司某季度某工业公司某季度某工业公司18181818个工业企业产值计划完成情个工业

10、企业产值计划完成情个工业企业产值计划完成情个工业企业产值计划完成情况如下,计算全距。况如下,计算全距。况如下,计算全距。况如下,计算全距。计划完成程度计划完成程度()组中值组中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)9090以下以下9090100100100100110110110110以上以上858595951051051151152 23 310103 380080025002500172001720044004400合计合计18182490024900对于组距数列,全距计算公式为:对于组距数列,全距计算公式为:RR最高组的上限值最高组的上限值最低组的下限值最低组的下

11、限值表表全距的特点全距的特点 全距是测定标志变动度的一种粗略方法。全距是测定标志变动度的一种粗略方法。优点:优点:计算简单,含义明确,对于测定对称分计算简单,含义明确,对于测定对称分布的数列具有特殊优点。布的数列具有特殊优点。缺点:缺点:它主要取决于极端数值,带有较大的偶它主要取决于极端数值,带有较大的偶然性,然性,往往不能充分反映现象的实际离散程度。往往不能充分反映现象的实际离散程度。2、用于比较不同总体数值的均衡性或、用于比较不同总体数值的均衡性或平均数的代表性;平均数的代表性;在两个总体或两组数据平均数相等时,要比较其平均数代表性大小,这时:全距较大的总体,其标志变异程度也较大,平均数的

12、代表性较小,或社会经济活动过程的均衡性或稳定性较差;反之,则相反。全距的作用全距的作用1、经常应用于生产过程的质量控制;、经常应用于生产过程的质量控制;平均差平均差平均差A.DA.D (average deviationaverage deviation):):是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。简单平均差:A.D=加权平均差A.D=根据未分组资料计算根据未分组资料计算 表表试问试问A、B 两课程的平均考分更有代表性?两课程的平均考分更有代表性?学生学生序号序号 考分(分)考

13、分(分)xAxB甲甲乙乙丙丙丁丁戊戊 656570 70 757580 80 858568687070767680808181合计合计 375375375375 平均数离差平均数离差-10-10-5-5 0 0 5 5 10 10解:解:离差绝对值离差绝对值 平均数离差平均数离差 离差绝对值离差绝对值 A.DAA.DB故,学生故,学生B 课程平均考分比课程平均考分比A 课程平均考分更有代表性。课程平均考分更有代表性。10 10 5 5 0 0 5 5 10 103030-7-7-5-5 1 1 5 5 6 6 7 7 5 5 1 1 5 5 6 624245565758527522753375

14、12757200-17-731385245135195660qq优点优点优点优点:不易受极端数值的影响,能较好地反映全不易受极端数值的影响,能较好地反映全部单位标志值的实际差异程度;平均差弥补了全距部单位标志值的实际差异程度;平均差弥补了全距之不足,它考虑了所有的标志值。之不足,它考虑了所有的标志值。qq缺点缺点缺点缺点:用绝对值的形式消除各标志值与算术平均数离用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于数学处理和参与统计分析运算。差的正负值问题,不便于数学处理和参与统计分析运算。3 3.平均差的特点平均差的特点 评价:评价:平均差意义明确,计算容易,平均差意义明确,计算容易

15、,反应灵敏。但计算时要用绝对值,不适合反应灵敏。但计算时要用绝对值,不适合代数运算,因此在进一步统计分析中应用代数运算,因此在进一步统计分析中应用较少。较少。标准差标准差标准差 (standard deviationstandard deviation):各:各单位标志值对其算术平均数的离差的单位标志值对其算术平均数的离差的平方平方的的算术平均数的算术平均数的平方根平方根,反映的是各标志值对,反映的是各标志值对其平均数的平均差异程度。其平均数的平均差异程度。标准差是描述数标准差是描述数据离散程度的最常用的差异量。据离散程度的最常用的差异量。分类:简单标准差分类:简单标准差 加权标准差加权标准差

16、公式公式:简单平均差:简单平均差:=加权平均差:=简捷计算:标志值数值较大、平均值未知,以A为假定平均数(一般取靠近中间的标志值或组中值)学生学生序号序号 课程(分)课程(分)xAxB甲甲乙乙丙丙丁丁戊戊 656570 70 757580 80 858568687070767680808181合计合计 375375375375 306306 136136平均数离差平均数离差离差平方离差平方平均数离差平均数离差离差平方离差平方-10-10-5-5 0 0 5 5 10 10 100 100 25 25 0 0 81 81 100 100-7-7-5-5 1 1 5 5 6 6 49 49 25

17、25 1 1 25 25 36 36问问A、B 那一门课程的平均考分更有代表性?那一门课程的平均考分更有代表性?解:解:因为因为B课程标准差较小,所以课程标准差较小,所以B课程平均分比课程平均分比A课程平均分代表性大。课程平均分代表性大。【例例2 2】根据未经分组的资料根据未经分组的资料表表【例例】根据某车间根据某车间200200名工人加工零件的资料,计算工名工人加工零件的资料,计算工人的生产零件标准差。人的生产零件标准差。按零件数按零件数分组分组(个个)职工人职工人数数(人人)f)f4040505050506060606070707070808080809090202040408080505

18、01010-合合 计计200200根据变量数列资料计算根据变量数列资料计算表表标准差计算表标准差计算表按零件数分按零件数分组组(个个)职工人数职工人数(人人)f)f组中组中值值x x40405050505060606060707070708080808090902020404080805050101045455555656575758585-19.5-19.5-9.5-9.50.50.510.510.520.520.5380.25380.2590.2590.250.250.25110.25110.25420.25420.25760576053610361020205512.55512.5420

19、2.54202.5合合 计计2002002095020950将表中计算结果代入公式,得到:将表中计算结果代入公式,得到:表表4-4-33335565758595105115-3-2-10123-30-38-500272824-39941014990765002756723711 1、反映某总体各单位某种标志值的离散程度;、反映某总体各单位某种标志值的离散程度;2 2、用于比较不同总体数值的均衡性或平均数的、用于比较不同总体数值的均衡性或平均数的代表性;代表性;在两个总体或两组数据平均数在两个总体或两组数据平均数相等相等时,要比较其平均时,要比较其平均数代表性大小,这时:数代表性大小,这时:标准

20、差较大的总体,其标志变异程度也较大,标准差较大的总体,其标志变异程度也较大,平均数的代表性较小,或社会经济活动过程的平均数的代表性较小,或社会经济活动过程的均衡性或稳定性较差;反之,则相反。均衡性或稳定性较差;反之,则相反。3 3.标准差的作用标准差的作用 评价评价:标准差是表示一组数据离散程度的最好指:标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量。标,是统计分析中最常用的差异量。标准差具备一个良好的差异量应具备的条件,如:标准差具备一个良好的差异量应具备的条件,如:反应灵敏,有公式严密确定,简明易懂,适合代数运反应灵敏,有公式严密确定,简明易懂,适合代数运算等等。算等等

21、。标准差表示一组数据的离散程度,须注意必须是标准差表示一组数据的离散程度,须注意必须是同一类数据同一类数据(即同一种测量工具的测量结果),而且(即同一种测量工具的测量结果),而且被比较样本的水平比较接近。被比较样本的水平比较接近。数据数据1 1:1 1、2 2、3 3、4 4、5 5 数据数据2 2:1010、2020、3030、4040、5050显显然然,这这两两组组数数据据的的差差别别程程度度相相同同,而而它它们们水水平平不不同同或或平平均均数数不不同同,这这时时就就不不能能用用绝绝对对指指标标(标标准准差差)比比较它们的差异程度大小。较它们的差异程度大小。这这时时就就要要计计算算离离散散

22、系系数数指指标标来来比比较较它它们们之之间间的的差差别别程程度度大小。大小。如果如果两个数列平均水平两个数列平均水平不同,或不同,或两个数列标志值的两个数列标志值的计量单位不同时计量单位不同时,要比较其数列的变动度(即比较其,要比较其数列的变动度(即比较其数列平均数的代表性大小),怎么办?数列平均数的代表性大小),怎么办?注意:这时需消除平均水平不同或计量单位不注意:这时需消除平均水平不同或计量单位不同的影响,同的影响,计算标志变异系数计算标志变异系数。是总体中变异指标与其算术平均是总体中变异指标与其算术平均数之比,以反映标志值差异的相对水平。数之比,以反映标志值差异的相对水平。变异系数变异系

23、数(V):):变异系数标准差系数标准差系数离散系数指标的种类离散系数指标的种类在实际工作中运用最为广泛的是标准差系数指标。在实际工作中运用最为广泛的是标准差系数指标。注意:注意:标准差与标准差系数的不同应用条件:标准差与标准差系数的不同应用条件:在比较两个不同数列(总体)标志变异程度大小在比较两个不同数列(总体)标志变异程度大小(或说明其平均数代表性大小)时,当(或说明其平均数代表性大小)时,当其平均水平相其平均水平相同同时,可直接时,可直接计算标准差计算标准差进行比较;当进行比较;当其平均水平不其平均水平不相同(或其计量单位不同)相同(或其计量单位不同)时,需消除平均水平不同时,需消除平均水

24、平不同或计量单位不同的影响,计算或计量单位不同的影响,计算标准差系数标准差系数进行比较。进行比较。根据根据表:表:学生学生序号序号 考分(分)考分(分)xAxC甲甲乙乙丙丙丁丁戊戊 656570 70 757580 80 85858080858590909595100100合计合计 375375450450 平均数离差平均数离差-10-10-5-5 0 0 5 5 10 10 解:解:离差平方离差平方平均数离差平均数离差离差平方离差平方-10-10-5-5 0 0 5 5 10 10 100 100 25 25 0 0 25 25 100 100 250 250 100 100 25 25 0

25、 0 25 25 100 100250250 VAVC故,故,C 组平均考分更有代表性。组平均考分更有代表性。试问试问A、C 课程平均考分哪个更有代表性?课程平均考分哪个更有代表性?又如又如,甲、乙两个农场有关资料如甲、乙两个农场有关资料如 表表4-354-35:指指 标标甲农场甲农场乙农场乙农场 亩数(亩)亩数(亩)平均亩产量(斤平均亩产量(斤/亩亩 标准差(斤标准差(斤/亩)亩)80008000 600 600 15 151000010000 800 800 18 18解:解:V甲甲V乙故,乙农场的粮食平均亩产量更有代表性。故,乙农场的粮食平均亩产量更有代表性。例例小结:在两个总体或两组数

26、据平均数小结:在两个总体或两组数据平均数不相等不相等时,时,要比较其平均数代表性大小,这时:要比较其平均数代表性大小,这时:标准差系数较大的总体,其标志变异程度也较标准差系数较大的总体,其标志变异程度也较大,平均数的代表性较小,或社会经济活动过大,平均数的代表性较小,或社会经济活动过程的均衡性或稳定性较差;反之,则相反。程的均衡性或稳定性较差;反之,则相反。也就是说标准差系数和标志值的离散程度成正也就是说标准差系数和标志值的离散程度成正大,和平均数的代表性或现象的均衡性成反比。大,和平均数的代表性或现象的均衡性成反比。例如:两种不同水稻品种,分别在例如:两种不同水稻品种,分别在5 5个田块上试

27、种,其产量如下:个田块上试种,其产量如下:要求:要求:分别计算两品种的单位面积产量。分别计算两品种的单位面积产量。计算两品种亩产量的标准差和标准差系数。计算两品种亩产量的标准差和标准差系数。假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广假定生产条件相同,确定哪一品种具有较大稳定性,宜于推广 甲品种乙品种田块面积产量田块面积产量1.2 1.2 1.11.11.01.00.90.90.80.86004954455404201.51.41.21.00.7840770540520450因因V乙乙V甲,故乙品种具有较大稳定性,宜于推广甲,故乙品种具有较大稳定性,宜于推广应用条件:应用条件:当所对

28、比的两个数列的平均水平当所对比的两个数列的平均水平高低相同时,就采用全距、平均差或标准差进行高低相同时,就采用全距、平均差或标准差进行对比分析,对比分析,当所对比的两个数列的水平高低不同当所对比的两个数列的水平高低不同时,时,其数值的大小不仅受各单位标志值差异程度其数值的大小不仅受各单位标志值差异程度的影响,而且受到总体单位标志值本身水平高低的影响,而且受到总体单位标志值本身水平高低的影响;为了对比分析不同水平的变量数列之间的影响;为了对比分析不同水平的变量数列之间标志值的变异程度,就必须消除数列水平高低的标志值的变异程度,就必须消除数列水平高低的影响,影响,这时就要计算变异系数这时就要计算变

29、异系数。是非标志标准差是非标志:一个总体只能分为具有某一标志值的单位和不具有某标志值得单位两组。这种用“是”“否”“有”“无”来表示的标志称是非标志。是非标志表现:用“1”表示是用“0”表示非用p表示是出现的次数占总次数的比重用q表示非出现的次数占总次数的比重总体按所研总体按所研究标志不同究标志不同变量总体变量总体(研究数量标志)(研究数量标志)属性总体属性总体(研究品质标志)(研究品质标志)在属性总体中,当所研究的标志,其表现只有两种属在属性总体中,当所研究的标志,其表现只有两种属性,性,即即“是是”或或“非非”时,将该属性总体称为时,将该属性总体称为是非标志是非标志总体。总体。例如:例如:

30、学生按性别分组学生按性别分组男生男生女生女生(是)(是)(非)(非)企业按经济类型分组企业按经济类型分组国有企业国有企业集体企业集体企业(是)(是)个体企业个体企业其它企业其它企业(非)(非)(一)什么是是非标志总体(一)什么是是非标志总体(二)是非标志(二)是非标志(二)是非标志(二)是非标志(属性属性属性属性)总体的成数总体的成数总体的成数总体的成数 在在是非标志(属性)总体中,设总体有是非标志(属性)总体中,设总体有N个单位,其个单位,其中有中有N1个单位具有某种性质或属性(是的属性),有个单位具有某种性质或属性(是的属性),有N0个单位不具有某种性质或属性(非的属性),个单位不具有某种

31、性质或属性(非的属性),即即N1+N0=N 则,则,即总体中即总体中具有某一属性的单位具有某一属性的单位数占总体单位数的比重数占总体单位数的比重即总体中不即总体中不具有某一属性的单具有某一属性的单位数占总体单位数的比重位数占总体单位数的比重(三)是非标志(三)是非标志(三)是非标志(三)是非标志(属性属性属性属性)总体的平均数总体的平均数总体的平均数总体的平均数 由于由于品质标志(是非标志)品质标志(是非标志)的表现不能用数值的表现不能用数值表示,为了研究问题表示,为了研究问题方便,我们可以将方便,我们可以将品质标志(是非标志)品质标志(是非标志)数量化数量化。即用。即用1 1表示单位标志表示

32、单位标志为为“是是”的标志值的标志值(即具有某种性质的单位的(即具有某种性质的单位的标志值标志值););用用0 0表示单位表示单位标志为标志为“非非”的标志值的标志值(即不具有某种性质的单位的标志值)。(即不具有某种性质的单位的标志值)。表表4-364-36属性(是非标志)属性(是非标志)总体的平均数:总体的平均数:性性 别别标志值标志值 X 单位数单位数F频率(频率(概率)概率)FF 男(是)男(是)女(非)女(非)1 10 0N1 N0 P=N1 N Q=N0 N合合 计计 N1 1(四)是非标志(四)是非标志(四)是非标志(四)是非标志(属性属性属性属性)总体的标准差总体的标准差总体的标

33、准差总体的标准差性性 别别标志值标志值 X 单位数单位数F频率(频率(概率)概率)FF 男(是)男(是)女(非)女(非)1 10 0N1 N0 P=N1 N Q=N0 N合合 计计 N1 1属性(是非标志)总体的标准差:属性(是非标志)总体的标准差:表表4-4-3737注意:当注意:当 P =0.50.5时,时,(最大)(最大)【例例例例】某厂某月份生产了某厂某月份生产了某厂某月份生产了某厂某月份生产了400400400400件产品,其中合格品件产品,其中合格品件产品,其中合格品件产品,其中合格品380380380380件,不合格品件,不合格品件,不合格品件,不合格品20202020件。求产件。求产件。求产件。求产品质量分布的集中趋势与离中趋势。品质量分布的集中趋势与离中趋势。品质量分布的集中趋势与离中趋势。品质量分布的集中趋势与离中趋势。解:解:解:解:是非标志的算术平均数:=p是非标志的标准差:=此课件下载可自行编辑修改,供参考!感谢您的支持,我们努力做得更好!

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服