1、第三章 统计整理一、教学目的1、理解统计整理的概念;理解分配数列。2、掌握统计整理的内容。3、掌握统计分组的方法。4、掌握数据图形化描述的方法。二、教学重点统计整理的内容;统计分组的方法;数据图形化描述的方法。三、教学难点分配数列。四、教学时数建议课堂讲授6学时。五、教学内容参考 第一节 统计数据整理的概念和内容一、统计数据整理的概念(一)统计数据整理的概念和意义统计数据整理就是对搜集到的初始数据进行审核、分组、汇总,使之条理化、系统化,成为能够反映总体特征的综合数据的工作过程。统计调查所取得的原始资料是反映总体各个单位的资料,这些属于有关标志的标志表现仅说明各个单位的具体情况,是不系统的、分
2、散的,还可能带有一定的片面性。统计所需要的是反映总体特征的统计指标,都是以数字形式表示的,因此需要进行统计整理。统计数据整理,是统计由对个别现象的认识上升到对总体现象认识的一个重要阶段,在统计研究工作中起着承前启后的作用,它既是数据搜集的继续和深化,又是数据分析的基础和前提。它实现从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,是进一步进行统计分析的必要前提。可见,统计数据整理绝不是一个单纯的技术问题,而是统计工作中一个极其重要的理论问题。(二)统计数据整理的分类根据数据搜集方式和研究任务的不同,统计数据的整理可以分为以下三种:1定期统
3、计报表数据的整理定期统计报表数据的整理是指对填报统计报表所需数据的整理,为正式填报统计报表做好准备。为此,各基层企事业单位和各综合部门都应建立统计台账。统计台账是为整理统计数据和进行统计分析而专门设置的一种系统积累统计资料的表册。建立统计台账,能够使统计数据更全面、系统,有利于及时、准确地编制统计报表,也有利于系统地积累资料,避免资料散失。2专题性统计数据的整理专题性统计数据的整理是指对专门调查搜集的统计数据进行的整理,以满足专题统计研究的需要。在专题性统计数据的整理中应密切结合各级领导部门的需要,根据专题性研究的目的确定整理的内容和题目,同时要注意资料的时效性、广泛性和政策性。3历史统计数据
4、的整理历史统计数据的整理是指对本部门、本单位的历史统计数据按照研究目的的要求,进行系统的加工和处理。历史统计数据整理是统计部门一项十分重要的任务。二、 统计数据整理的原则和内容(一)统计数据整理的原则统计数据整理必须遵循目的性、联系性和简明性三个原则。目的性原则是指数据整理一定要按照预定的目的,进行科学的分组、分类,才能整理出研究问题所需要的综合指标。联系性原则是指数据整理所涉及的指标不仅是相互联系的,还应存在一定的逻辑关系,选用什么统计指标以及指标之间前后关联的顺序如何,都是整理过程中要特别注意的。简明性要求在整理过程中选用最简明的方法,以取得节约和实用的效果。(二)统计数据整理的内容统计数
5、据整理的内容或程序一般有五个方面:第一,根据统计研究的目的和要求,确定应该整理的指标,并根据分析的需要确定具体的分组;第二,对大量的原始数据进行预处理;第三,对各指标进行汇总,计算出各组单位数、总体单位数以及各组或总体的有关标志值之和;第四,将汇总整理的数据编制成统计表;第五,对统计数据进行系统积累。三、 统计数据的预处理(一)数据的审核与筛选1.数据的审核在对统计数据进行整理时,首先要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全
6、等。准确性审核主要包括两个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。审核数据准确性的方法主要有逻辑检查和计算检查。逻辑检查主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。逻辑检查主要用于对定类数据和定序数据进行审核。计算检查是检查调查表中的各项数据在计算结果和计算方法上有无错误。例如,各分项数字之和是否等于相应的合计数,各结构比例之和是否等于1或100,出现在不同表格上的同一指标数值是否相同等。计算检查主要用于对定距数据和定比数据的审核。对于二手数据,除了对其完整性和准确性进行审核外,还
7、应着重审核数据的适用性和时效性。首先应弄清楚数据的来源、数据的口径以及有关的背景材料,以便确定这些数据是否符合分析研究的需要,是否需要重新加工整理等。此外,还要对数据的时效性进行审核,一般来说,应尽可能使用最新的统计数据。2.数据的筛选对审核中发现的错误应尽量予以纠正。如果对发现的错误无法纠正或有些数据不符合统计调查的要求而又无法弥补时,就要对数据进行筛选。筛选有两方面内容:一是将某些不符合要求的数据或有明显错误的数据予以剔除;二是将符合某种特定条件的数据筛选出来,将不符合特定条件的数据予以剔除。(二)数据的订正对审核过程中发现的迟报、漏报及计算错误等问题,应及时催报、补报、改正,并针对不同的
8、错误做出不同的处理:第一,对于可以肯定的一般错误,应代为更正,并向有关单位核实;第二,对于可疑之处或无法代为更正的错误,应通知原报送单位复查更正;第三,对于在一个单位发现的有代表性的重大差错,除通知原报送单位更正外,还要将差错情况通报尚未报送资料的单位,以防止类似错误的发生;第四,对于违反统计法规的,应查明责任,予以适当处理。(三)数据的排序数据排序就是按照一定的顺序将数据排列,以便初步显示数据的一些明显特征和规律,为研究者找到解决问题的线索。此外,排序还有助于对数据的检查纠错,为分组、汇总提供依据。对于定类型数据,可以按字母的顺序或笔画数的多少排序;对于定距数据和定比数据,可以按递增顺序或按
9、递减顺序排序。排序后的数据称为顺序统计量。定距和定比数据的排序只有两种,即递增排序和递减排序。第二节 统计分组一、统计数据分组的意义(一)统计数据分组的含义统计数据分组是指根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干类型(组),使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变为有序的、能够反映总体特征的资料。(二)统计分组的作用统计分组在统计认识过程中的基本作用主要表现在以下几方面。1划分现象的不同类型统计分组的最基本作用,就是把复杂的社会现象划分为各个性质不同的组成部分,以认识事物质的差别。例如,把社会产品划分为生产资料和消费资料;将国民经
10、济划分为第一产业、第二产业和第三产业等。只有通过科学分组来划分现象的类型,才能正确地了解、研究现象的实质,发挥统计研究的作用。2反映总体的内部结构在统计分组的基础上,计算各部分占总体的比重可以揭示总体内部结构,表明总体中各部分与整体以及各部分之间存在的数量关系,从而反映事物的构成特征和性质。通过比较总体内部结构的动态变化还可以揭示现象发展变化的过程和规律。3分析现象之间的依存关系社会经济现象之间存在着广泛的相互依存关系,根据研究目的,按照一定标志对总体进行分组,然后通过观察相关标志的数量变化,揭示相关事物之间的依存关系。如农作物的耕作深度与收成率之间的关系、家庭工资收入与生活费支出之间的关系、
11、市场商品价格与其需求量之间的关系等,都可以通过统计分组来研究。二、统计数据分组的类型统计数据分组按反映研究对象的特点和分组的形式分类主要有以下几种类型。(一)属性分组和变量分组1属性分组属性分组是指按照反映事物属性的品质标志进行的分组。2变量分组变量分组是指按照数量标志进行的分组。变量分组的组限是指各种不等的变量值。(二)简单分组、复合分组和分组体系1简单分组简单分组是指将总体按照一个标志进行的分组。这种分组只能从某一方面去说明总体特征。2.复合分组复合分组是指将总体按照两个或两个以上的标志,重叠起来进行的分组。这里所谓的重叠,是指在前一次分组结果的内部再进行下一次分组。3分组体系分组体系是指
12、将总体按照两个或两个以上相互联系、相互补充的标志,对被研究对象进行平行分组所形成的体系。分组体系可以从不同角度、不同方面对某一现象做出比较全面的说明。三、统计数据分组的方法统计数据分组的关键在于分组标志的选择和各组界限的划分。(一)分组标志的选择分组标志的选择是统计分组的核心问题,分组标志就是对统计总体进行分组的标准或依据。选择正确的分组标志,是统计分组能充分发挥作用的前提。总体单位一经分组,就突出了各单位在分组标志下的差异,同时也掩盖了总体单位在其他标志下的不同。所以,同一总体由于选择的分组标志不同,对其认识可能会得出不同甚至相反的结论。为了保证统计分组科学合理,选择分组标志必须遵循穷尽原则
13、、互斥原则和反映事物本质的原则。(二)统计分组方法分组标志一经选定,就要在分组标志变异范围内划定各相邻组间的性质界限和数量界限。根据分组标志的不同特征,统计总体可以按品质标志分组,也可以按数量标志分组。1按品质标志分组按品质标志分组是指按对象的属性特征分组,又分为简单品质分组和复杂品质分组两种情况。(1)简单品质标志分组。简单品质分组是指分组标志一经确定,组的名称和组数也就随之确定,而且各单位应分在哪一组也比较明确,不存在组与组之间界限区分困难的问题。例如,人口按性别分为男、女两组,具体到每一个人应该分在哪一组是一目了然的。(2)复杂品质标志分组。有些现象按品质标志分组是比较复杂的,如工业部门
14、分类、人口职业分类等。对这些复杂问题的分组,统计学上称为分类。统计分类不仅涉及复杂的分组技术,而且涉及国家的政策和科学理论。为保证各种分类的科学性、统一性和完整性,便于各个部门掌握和使用,国家统计局会同有关部门制定了统一的分类目录,在全国范围内实行。如商品分类目录、工业产品分类目录、工业部门分类目录等。2按数量标志分组按数量标志分组是指选择反映事物数量差异的数量标志作为分组标志,根据其变异范围区分各组界限,将总体划分为若干个性质不同的组成部分。数量标志反映的是事物特定内容的数量特征,其概念是具体明确的,但按数量标志分组,并不是单纯地确定各组间的数量差异,而是要通过分组体现的数量变化来确定现象的
15、不同性质和不同类型。因此,根据变量值的大小来准确划分性质不同的各组界限并不容易,这要求在按数量标志分组时,首先分析总体中可能有多少种性质不同的组成部分,然后再研究确定各组成部分之间的数量界限。根据总体各单位某一数量标志值的变动特征,可供选择的分组方式有单项式分组和组距式分组两种。(1)单项式分组。单项式分组是指按每一个具体变量值对现象总体所进行的分组。单项式分组一般适用于离散型变量,且变量值不多、变动范围较小的情况。在离散型变量变动范围比较大、总体单位数又很多的情况下,若采用单项式分组,把每一变量值作为一组,则必然会使分组的组数过多,各组次数过于分散,不能反映总体内部各部分的性质和差异,从而失
16、去了统计分组的真正意义。至于连续型变量,由于其变量值无法一一列举,更不能采用单项式分组,因此在这些情况下就需要采用组距式分组方法。(2)组距式分组。组距式分组是指按变量值的一定范围对现象总体所进行的分组。在现象总体的变动范围内,将其划分为若干个区间,各区间内的所有变量值作为一组,其组内性质相同,组间性质相异。与单项式分组相比较,各组的变量值不是某一具体的点值,而是一个区间。组距式分组一般在变量值变动幅度较大的情况下采用。在组距式分组中,涉及组限、组距、组数、组中值等分组要素。组限组限是用来表示各组之间界限的变量值,是决定事物质量的数量界限。其中,在每一组中最小的变量值为下组限,简称为下限;最大
17、的变量值为上组限,简称为上限。组限的表达形式与变量的特点密切相关。如果分组标志是连续型变量,则组限一般用重合式表达。所谓重合式,就是相邻两组中,前一组的上限与后一组的下限数值相重叠,这些变量值的归属,一般按“上限不在内”的原则处理。如果分组标志是离散型变量,则组限一般用不重合式表达。所谓不重合式,是指前一组的上限与后一组的下限两变量值紧密相连但不重叠。例如,在人口年龄构成的抽样调查中,将人口按年龄分为014岁、1564岁、65岁及以上三组,组与组之间变量值紧密衔接,但不重叠。凡年龄超过14岁但不满15岁的,属于014岁组;凡年龄超过64岁但不满65岁的,仍属于1564岁组。组距组距是指一组变量
18、值的区间长度,也就是每一组的上限与下限之间的距离。即:组距上限-下限。组距式分组中,常常会遇见首末两组“开口”的情况,即用“以下”表示第一组,用“以上”表示最后一组,这些有上限无下限或有下限无上限的组称为开口组,如“3千元以下”和“8千元以上”即为开口组。组距式分组中,根据各组的组距是否相等可以分为等距分组和异距分组。各组组距都相等的分组称为等距分组,各组组距不相等的分组则称为异距分组,或称为不等距分组。组数组数即分组个数。在所研究总体一定的情况下,组数的多少和组距的大小是紧密联系的。一般来说,组数和组距成反比关系,即组数少,则组距大;组数多,则组距小。如果组数太多,组距过小,会使分组资料烦琐
19、、庞杂,难以显现总体现象的特征和分布规律;如果组数太少,组距过大,可能会失去分组的意义,达不到正确反映客观事实的目的。在确定组距和组数时,应注意保证各组都能有足够的单位数,组数既不能太多,也不宜太少,以能充分、准确体现现象的分布特征为宜。组中值组中值即组距的中点数值,它是各组变量值的代表水平。在重合式组限的分组中,它是各组上限与下限的简单平均数;在非重合式组限的分组中,它是本组下限与后一组下限的简单平均数。即:重合式组限组的组中值上限+下限2非重合式组限组的组中值本组下限+后一组下限2当遇到缺少上限或下限的开口组时,其组中值以相邻组组距为依据计算。即缺下限组的组中值上限-邻组组距2邻组组中值邻
20、组组距缺上限组的组中值下限+邻组组距2邻组组中值十邻组组距应当指出,在组距式分组中,组距掩盖了分布在组内各单位的实际变量值,因此需要用组中值来代表该组的一般水平,这就是组中值在统计分析中被广泛采用的原因。四、统计资料的再分组统计资料的再分组是指把统计分组资料按某种要求重新划定各组界限,再将资料中的单位数和比重分布做出相应的调整。第三节 分配数列一、分配数列概念及构成要素在统计分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位及数值在各组间的分布,称为次数分布或频数分布,又称为分配数列或分布数列。分配数列由两个要素构成:一是分组标志的标志表现,二是总体单位在各组中
21、出现的次数及各组标志值。次数有两种表现:一是以绝对数形式表现的次数,也称为频数,用f表示。二是以相对数形式表现的次数,即各组次数占全部次数的比重,称为比率、频率或相对次数。二、分配数列及其种类在分组的基础上,把所有数据或总体单位按组归并、排列,形成所有数据或总体各单位在各组间的分布,称为次数分配或分配数列。例如我国人口的性别分布。分配数列是统计分组的一种重要形式,可以反映总体的结构分布状况和分布特征。任何一个分配数列都具备两个基本因素,一是分组标志下的具体表现或分组形成的各组,二是各组相对应的总体单位数或次数(或比率)。即构成要素:一是组别,二是分布在各组的频数(f)和频率(ff)。频率有两个
22、性质:(1)0ff1;(2)ff1。(一)品质分配数列品质分配数列(简称为品质数列),是指按品质标志分组形成的分配数列,其组别表现为一系列的概念或范畴。(二)变量分配数列变量分配数列(简称为变量数列),是指按数量标志分组形成的分配数列,其组别表现为不同的数值或数域。变量数列又分为单项数列和组距数列。1单项数列。单项数列是以一个变量值为一组编制的变量分配数列。2组距数列。组距数列是以表示一定变动范围的两个变量值构成的组所编制的变量分配数列。三、累计频数和累计频率累计频数和累计频率是将变量分配数列中各组频数或频率依次累加而得到的各组累计频数或累计频率。累计的方法有两种:一是向上累计,也称较小制累计
23、,即将各组频数或频率由变量值低的组依次向变量值高的组累计,它表明从第一组下限开始到本组上限为止的累计频数或频率;二是向下累计,也称较大制累计,即将各组频数或频率由变量值高的组依次向变量值低的组累计,它表明从最末一组的上限开始到本组下限为止的累计频数或频率。累计频数和累计频率可以概括地反映总体各单位的分布特征。四、分配数列的编制任何分配数列都是在统计分组的基础上归类汇总的结果。从这个意义上来说,数列的编制过程实质上是分组与汇总的过程。(一)品质数列的编制编制品质数列,首先应按品质标志对总体作属性分组,然后划分各组界限。属性分组有时比较简单,分组标志一经确定,组名称和组数也就确定,不存在组与组之间
24、界限划分的困难。(二)变量数列的编制变量数列编制的根本目的在于通过现象的数量差别去描述事物质的区别。即不同的变量组别之间具有质的差别。1.单项数列的编制对于离散型变量,如果变量值种类较少且变动范围较小,可编制单项数列。2组距数列的编制对于离散型变量,若变动幅度较大,变量值的种类较多,则宜编成组距数列。对于连续型变量,由于连续型变量的取值不能一一列举,只能编制组距数列。组距数列编制过程为:(1)将原始数据按大小顺序排列,并确定最大值、最小值和全距R。表3|11中统计学考分全距R98-49=49分。(2)确定组距数列的类型。由于统计学考分分布比较均匀,可编制等距数列。(3)确定组数和组距。组数的多
25、少和组距的大小是相互制约的。组数越多,组距越小;组数越少,组距越大。等距数列组距=全距组数。确定组数和组距时,一般应遵循以下几条原则:考虑组距内的同质性。本例中必须将及格与不及格的质的界限体现出来。要能反映总体分布规律,即要体现原始数据分布的集中趋势或离中趋势。组距不能太大或太小。经验表明,组数一般应在515组,组距最好是5或10的整数倍数。在等距数列情况下,如果总体单位数不是很多,变量变动范围不是很大时,可以用斯特吉斯(HASturges)经验公式计算出一个参考组距。公式为:iR1+3.322lgN式中i组距;R全距;N总体单位数。(4)确定组限和组限的表示法。确定组限应遵循以下几条原则:最
26、小组下限低于或等于最小变量值,最大组上限应大于或等于最大变量值;如果有极端值,可用开口组;组限应有利于表现总体单位分布规律;对于等距数列,如果组距是5的倍数,则每组下限也最好是5的倍数。(5)从最小组起依次排列,并分别计算各组频数和其他有关指标,形成分组统计表。第四节 统计图形化描述经过整理以后的统计资料往往通过统计表和统计图显示出来,因此,统计表和统计图成为显示统计数据的重要工具。一、统计表(一)统计表的概念和构成统计表就是由纵横交叉的线条所组成的,用于显示统计数据的表格。统计表的运用范围极其广泛,其主要优点是:能使统计资料条理化,更清晰地表述统计数据之间的相互联系;统计数据的显示简明易懂;
27、便于计算和比较表内的各项统计指标,并易于检查数字的完整性和正确性。统计表由总标题、横标目、纵标目和统计数字四个要素构成。(二)统计表的分类在统计研究中通常按作用、反映对象的特点和分组情况对统计表进行分类。1调查表、汇总表和分析表统计表按作用不同可以分为调查表、汇总表和分析表。调查表是在统计调查中用于登记、搜集原始资料的表格;汇总表是用于统计资料整理、汇总的表格;分析表是用于统计分析的表格。2空间数列表和时间数列表统计表按所反映统计数列的时空性质不同,可以分为空间数列表和时间数列表。空间数列表又称为静态表,是反映同一时间条件下不同空间范围内的统计数列的表格,它可以说明现象在不同空间内的数量分布状
28、态。时间数列表又称为动态表,是反映同一空间条件下不同时间上的统计数列的表格,它可以说明在既定的空间范围内现象在不同时间上的变动过程。空间数列表和时间数列表还可以结合起来显示统计数据。3简单表、分组表和复合表统计表按对总体分组情况的不同,可以分为简单表、分组表和复合表。简单表是指对总体未做任何分组、仅按单位名称或时间顺序排列而成的统计表。分组表又称简单分组表,是对总体的统计单位按一个标志进行分组而形成的统计表。利用分组表可以深入分析现象的内部结构和现象之间的相互依存关系。复合表又称为复合分组表,是对总体的统计单位按两个或两个以上的标志进行交叉重叠分组而形成的统计表。复合表可以反映所研究对象受几种
29、因素的共同影响而发生的变化。(三)统计表的编制规范统计表应科学、简明、实用、美观、便于比较,能够准确反映被研究现象的数量特征。因此,设计和填写统计表时必须遵循以下规范要求。(1)统计表的标题、项目、指标要简明扼要,能准确反映内容,使人一目了然,便于分析。如果指标的计量单位只有一个,则通常列在表的右上角,如果计量单位较多,则列在相应的指标栏内。(2)统计表的纵栏、横行的排列要尽量反映出内容方面的逻辑关系。(3)当统计表的栏目较多时,可进行编号以说明其相互关系。主词栏和计量单位栏常用甲、乙、丙等文字编号,宾词栏常用1、2、3等数字编号。(4)表中的合计栏可以排在前面,也可以排在最后,如果只列出其中
30、部分项目,则合计栏必须排在前面。(5)表中的统计数字要根据纵横关系对位,数字为零时要写出“0”来,没有数字的空格用“”线表示;不可以出现空白;估算的数字应在表下说明;无法取得资料的用“”号表示;如果某项数字与邻项数字相同,则仍应填写数字,不得用“同上”“同左”等字样或符号代替。(6)表的上下两端用粗线,左右两边不封口,纵栏之间用细线分开,横行之间可以不加线。如果横行过多,也可以每五行加一细线。(7)统计表的资料来源及其他需要说明的问题可以在表下加以注明。二、统计图用来表现统计数据的各种几何图形、具体事物的形象、符号等都称为统计图。用统计图来显示统计数据,具有直观、生动、形象、易懂的优点。统计图
31、没有冗长的数据和呆板的表格形式,易为一般人接受和理解。不同的统计图绘制方法不同,但都必须遵守如实反映、便于比较、通俗易懂、鲜明醒目、灵活机动的原则。(一)直方围和条形图1直方图直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标系中,横轴表示数据分组,纵轴表示频数或频率,这样各组与相应的频数就形成了一个矩形,即直方图。2条形图条形图是用宽度相同的条形的高度或长度来表示数据变动的图形。条形图可以横置和纵置,纵置时也叫柱形图。条形图和直方图不同,条形图用条形的长度(横置时)表示各类别数量的多少,其宽度(表示类别)是固定的,直方图是用面积表示数量的多少;直方图各矩形通常是连续排列,而条形图
32、则是分开排列的。(二)折线图和曲线图1折线图折线图也称为频数多边图,它是在直方图的基础上把相邻直方形的顶边中点连接成一条折线,再把折线两端与横轴上直方形两侧延伸的假象组中点相连,形成了频数分布折线图。折线图也可以用组中值与次数求坐标点连接而成。2曲线图曲线图是用曲线的升降起伏来表示被研究现象的变动情况及其趋势的图形。曲线图根据所示数据的性质和作用的不同,可以分为频数分布曲线图、动态曲线图和依存关系曲线图。在频数分布折线图的基础上,当变量数列的组数无限增多时,折线图便近似地表现为一条平滑的曲线,变成了频数分布曲线图。(三)圆形图和环形图1圆形图圆形图又称为饼图,它是以圆的面积或圆内各扇形的面积来
33、表示数值大小或总体内部结构的一种图形。根据圆形图的作用不同,可以分为圆形比较图、圆形结构图和圆形结构比较图。2环形图环形图中间有一个“空洞”,总体中的每一个部分数据用环中的一段表示。环形图可以同时绘制多个总体的数据系列,每一个数据系列为一个环,可以显示多个总体各部分所占的相应比例,从而有利于进行比较研究。(四)雷达图这种图形既像雷达荧光屏上看到的图像,也像个蜘蛛网,因此也有人将其称为蛛网图。雷达图在显示或对比各变量的数值时非常有用。利用雷达图也可以研究多个样本之间的相似程度。三、频数(次数)分布的主要类型客观现象的频数(次数)分布主要有钟形分布、U形分布和J形分布三种类型。(一)钟形分布钟形分
34、布是指靠近两端的变量值分配次数较少,中间变量值分配次数较多,绘制成的曲线图形状宛如一口古钟。钟形分布是客观现象分布中最常见的分布,其突出特征是“中间大,两头小”。对称分布中的正态分布是最重要性的分布,许多客观现象总体都趋近于正态分布。中心变量值两侧的变量值次数分布不对称的称为非对称分布或偏态分布,通常有左偏态和右偏态两种。(二)U形分布U形分布的特征与钟形分布特征恰恰相反,靠近中间的变量值分布次数少,靠近两端的变量值分布次数多,分布特征是“两头大,中间小”。绘成的曲线图形如英文字母“U”。例如,人口在不同年龄上的死亡率一般近似地表现为U形分布。(三)J形分布J形分布有正反两种情况:次数随变量值
35、增大而增多时所绘成的曲线图形如英文字母“J”,称为正J形分布;次数随变量增大而减少时所绘成的曲线图犹如反写的英文字母“J”,称为反J分布。例如,商品供给量随着价格的提高而不断增加,使供给曲线呈正J形分布;人口总体按年龄大小的分布一般呈反J形分布。第四章 统计分析综合指标一、教学目的1、掌握总量指标的计算和分析方法。2、掌握相对指标的分析方法并能灵活运用。3、掌握平均指标的区别和联系。4、掌握标志变异指标的计算方法。二、教学重点相对指标的计算及分析;平均指标的计算;标志变异指标的计算方法。三、教学难点相对指标的计算及分析;平均指标的区别与联系。四、教学时数建议8课时,其中:课堂讲授7学时,课业交
36、流和讨论1学时。五、教学内容参考第一节 总量指标一、总量指标的概念和作用 (一)总量指标的概念总量指标是反映某种社会经济现象在一定时间、空间和条件下的总规模、总水平或工作总量的综合指标。由于总量指标的表现形式为绝对数,因此,总量指标又称为统计绝对数,表现形式为绝对数。总量指标的特点为: (1)总量指标是统计数据直接汇总的结果;(2)总量指标数值随着总体范围的大小而增减变化。(二)总量指标的作用 1.总量指标是对社会经济现象最基本的描述,是认识社会经济现象的起点 人们要想了解一个国家或一个地区的国民经济和社会发展状况,首先就要准确地掌握客观现象在一定时间、地点条件下的发展规模或水平,然后才能更深
37、入地认识所要研究的问题。2.总量指标是制定政策,编制计划,实行社会经济管理的基本依据要实现国民经济的协调发展和企业生产经营活动的正常进行,就需要掌握宏观经济和微观经济运行的环境、条件、投入、产出等各方面的数量状况,研究各方面的数量关系。虽然可以用相对数、平均数来反映,但归根结底还是需要总量指标予以反映。3.总量指标是计算相对指标和平均指标的基础总量指标是统计整理汇总后,首先得到的能说明具体社会经济总量的综合性数字,是最基本的统计指标。相对指标和平均指标一般都是由两个有联系的总量指标相对比而计算出来的,它们是总量指标的派生指标。总量指标计算是否科学、合理、准确,将会直接影响相对指标和平均指标等一
38、系列派生指标的准确性。二、总量指标的分类 (一)按反映内容分为总体单位总量和总体标志总量 1.总体单位总量总体单位总量是总体中单位数之和,说明总体本身的规模大小。对于一个研究目的而言,总体单位总量只有一个。2.总体标志总量总体标志总量是总体中各单位某一数量标志值的总和,说明总体数量特征的总量。仍以研究某地区工业企业生产情况为例,每一工业企业的职工人数是一个数量标志,该地区所有工业企业职工总数就是总体标志总量。此外,该地区的年工业总产值、利税总额、设备总量等也都是总体标志总量。因此,对于一个研究目的而言,总体标志总量可以有若干个。(二)按反映的时间状态分为时期指标和时点指标1.时期指标时期指标是
39、反映社会经济现象在一段时期内发展的总量。时期指标的特点为:指标数值可以连续计量,其累计数表明现象在该时期的总成果;指标数值与时期长短成正比。2.时点指标时点指标是反映社会经济现象在某一时刻(或瞬间)的总量。时点指标的特点为:数值不能累计;指标数值的大小与时间间隔没有直接的依存关系,如年末人口数、季末设备台数、月末商品库存数等。(三)按计量单位分为实物指标、价值指标、劳动量指标1.实物指标 实物指标是用实物单位计量的总量指标。实物单位是根据事物的属性和特点采用的计量单位,主要有自然单位、度量衡单位和标准实物单位。(1)自然单位是按照被研究现象的自然状况来度量其数量的一种计量单位。(2)度量衡单位
40、是按照统一的度量衡制度的规定来度量其数量的一种计量单位。(3)标准实物单位是按照统一折算标准来度量被研究现象数量的一种计量单位。2.价值指标价值指标是用货币单位计量的总量指标。货币单位是用货币“元”来度量社会劳动成果或劳动消耗的计量单位。价值指标从原则上说应是反映商品价值量的指标,而实际上是货币量指标。因为价值量不能计算,只能通过价格来体现,而价格围绕价值波动,并不等于价值,价格只是价值的一种货币表现。因此,价值指标又称为货币指标。价值指标具有广泛的综合性和概括性。它能将不能直接相加的产品数量过渡到能够相加,用以综合说明具有不同使用价值的产品总量或商品销售量的总规模或总水平。价值指标广泛应用于
41、统计研究、计划管理和经济核算之中。但价值指标也有其局限性,综合的价值量容易掩盖具体的物质内容,比较抽象。因此,在实际工作中,应注意把价值指标与实物指标结合起来使用,以便全面认识客观事物。3.劳动量指标劳动量指标是用劳动量单位计量的总量指标。劳动量单位是用劳动时间表示的计量单位,如“工日”“工时”等。工时是指一个职工做一个小时的工作,工日通常指一个职工做八个小时的工作。三、总量指标的计算(一)直接计算法直接计算法是指对研究对象用直接的计数、点数和测量等方法,登记各单位的具体数值加以比较汇总,得到总量指标。(二)间接推算法间接推算法是指采用社会经济现象之间的平衡关系、因果关系、比例关系或利用非全面
42、调查资料推算总量的方法。四、计算和应用总量指标应注意的问题(一)明确规定每项指标的含义和范围正确统计总量指标的首要问题就是要明确规定每项总量指标的含义和范围。(二)注意现象的同质性在计算实物指标的总量时,只有同质现象才能计算。同质性是由事物的性质或用途决定的。(三)正确确定每项指标的计量单位具体核算总量指标时,究竟采用哪一种计量单位,要根据被研究现象的性质、特点以及统计研究的目的而定,同时要注意与国家统一规定的计量单位一致,以便于汇总并保证统计资料的准确性。第二节 相对指标一、相对指标的含义和表现形式相对指标又称为“相对数”,是用两个有联系的指标进行对比的比值来反映社会经济现象的数量特征和数量
43、关系的综合指标。相对指标数值有两种表现形式:无名数和复名数。无名数是一种抽象化的数值,多以系数、倍数、成数、百分数或千分数表示。复名数主要用以表明事物的密度、强度和普遍程度等。例如,人均粮食产量用“千克/人”表示,人口密度用“人/平方公里”表示等。二、相对指标的作用(1)相对指标通过数量之间的对比,可以表明事物的相关程度、发展程度,它可以弥补总量指标的不足,使人们清楚了解现象的相对水平和普遍程度。(2)相对指标把现象的绝对差异抽象化,使原来无法直接对比的指标变为可比。(3)相对指标说明总体内在的结构特征,为深入分析事物的性质提供依据。三、相对指标的种类及计算根据统计研究的目的和任务的不同,对比
44、基础的不同,可将相对指标划分为六种:计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标和动态相对指标。(一)计划完成相对指标1.计划完成相对指标的含义计划完成相对指标又称为计划完成百分数,是将现象在某一段时间内实际完成数与计划规定数相比较,用以表明计划完成情况的相对指标,通常用百分数(%)表示。计划完成程度相对指标是用来检查、监督计划执行情况的相对指标。其计算公式如下: 计划完成程度相对数=实际完成数计划任务数100%注:分子实际完成数减分母计划完成数的差额(正或负)则表明执行计划的绝对效果。2.计划完成相对指标的计算由于计划指标数值是计算计划完成相对指标的基数(母项数据
45、),其表现形式有绝对数、相对数和平均数三种。因此,在计算计划完成相对数时应根据计划指标的具体形式加以计算,具体分为以下两种形式:(1)计划数是以绝对数或平均数形式下达的(2)计划数是以相对数或平均数形式下达的在经济管理中,一些计划任务数是以增长或减少的百分数形式给出的,此时计算计划完成程度相对指标,要注意基本公式中的分子、分母应分别包含原有的基数1或100%。其计算公式如下:计划完成程度相对数=1实际提高或降低率1计划提高或降低率100%3.计划完成相对指标的特点(1)对比数为同一总体。(2)分子、分母不能互换。(3)计算结果视指标性质而定。如果大于100%,对于提高率而言,为超额完成计划;对
46、于降低率而言,则没有完成计划。如果小于100%,对于提高率而言,为没有完成计划;对于降低率而言,则为超额完成计划。(二)结构相对指标结构相对指标又称为结构相对数,是指在总体分组的基础上,以总体的某一部分数值与总体数值相对比求得的比重或比率指标。用以反映总体内部构成状况,一般以百分数表示。其计算公式如下:结构相对指标=总体某部分的数值总体全部指标数值100%结构相对指标的特点:(1)总体各部分计算结果小于1。(2)总体各部分比重之和等于1。(3)分子、分母不能互换。(三)比例相对指标比例相对指标又称为比例相对数,是指将同一总体中各组成部分之间的同类指标数值进行对比,用以反映社会经济现象内部各组成
47、部分之间的相互对比关系。其计算公式如下:比例相对指标=总体某部分的数值总体另一部分指标数值100%比例相对指标一般用倍数或百分数表示,也可以用比例式表示。比例相对指标的特点:(1)对比的分子分母必须是同质现象。(2)分子、分母可以互换。(四)比较相对指标比较相对指标又称为比较相对数,是指同类指标在不同空间进行静态对比所形成的相对指标,用以说明某一同类现象在同一时间内不同总体数量对比关系。其计算公式如下: 比较相对指标=某一总体指标数值另一总体同类指标数值100%比较相对指标一般用百分数、系数或倍数等表示。计算比较相对指标的指标数值可以是总量指标,也可以是相对指标或平均指标。比较相对指标的特点: (1)不同总体的同一指标数值的比较。(2)各部分指标数值不存在相加的关系。(3)分子、分母是否可互换,分为两种情况:比较标准为一般对象时,分子与分母可以互换。比较标准为典型化对象时,分子与分母不能互换。(五)强度相对指标强度相对指标又称为强度相对数,是指两个性质不同但有一定联系的总量指标之间比较而形成的相对指标,用以表明某一现象在