1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑
2、母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,第一章 绪论,第一节,什
3、么是统计,第二节,统计学的种类及其性质,第三节,统计学的基本概念,第一节 什么是统计,一,统计,(Statistics),的涵义,二,统计研究的基本环节,一、统计,(Statistics),的涵义,统计是人们认识客观世界总体数量变动关系和变动规律的活动的总称,是人们认识客观世界的一种有力工具。,统计的研究对象具有以下特点:,数量性。统计数据是客观事物量的反映。,总体性。统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析,得出反映现象总体的数量特征。,变异性。总体各单位的特征表现存在着差异,而且这些差异并不是事先可以预知的。,“,统计”的,3,种含义,统计工作(又称统计实践)
4、是搜集、整理、分析和提供关于社会经济现象的数字资料工作的总称。,英文中的统计,statistics,与“国家”同一词根,可以说,自从有了国家,就有统计实践活动。,统计数据是统计实践活动的成果。,如:经济增长速度、价格指数等。,对统计数据要求:客观性、准确性和及时性。,统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。,统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践,二、统计研究的基本环节,统计设计,收集数据,整理与分析,资料积累,开发应用,统计学理论与相关实质性学科理论,描述统计,推断统计,统计调
5、查、实验,1.,统计设计,根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。搞好统计设计不仅要有统计学的一般理论和方法为指导,而且还要求设计者对所要研究的问题本身具有深刻的认识和相关的学科知识。,2.,收集数据,统计数据的收集有两种基本方法。对于大多数自然科学和工程技术研究来说,有可能通过有控制的科学实验去取得数据,这时可以采用实验法。对于社会经济现象来说,一般无法进行重复实验,要取得有关数据就必须进行调查观察。,3.,整理与分析,运用的方法包括:描述统计和推断统计。,描述统计是指对采集的数据
6、进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。,推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。推断统计是现代统计学的主要内容。,4.,统计资料的积累、开发与应用,统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。如何更好地将统计数据和统计方法应用于各自的研究领域是应用统计学研究的一个重要方面。,第二节 统计学的种类及其性质,一,统计学的产生与发展,二,理论统计学和应用统计学,三,统计学与有关学科的联系与区
7、别,一、统计学的产生与发展,1.,政治算术学派,最早的统计学源于,17,世纪英国的政治算术。其代表人物是威廉配第,(William Patty,,,16231687,年,),。威廉,佩第在,政治算术,(1676,年,),一书中,写到:本书“不用比较级、最高级进行思辨或议论,而是用数字,来表达自己想说的问题,借以考察在自然中有可见的根据的原因。”政治算术学派主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。,2.,国势学派,最早使用“统计学”这一术语的是德国国势学派的阿亨瓦尔,(G,Achenwall,,,1719-1772),。国势学派虽然创造了统计学
8、这一名词,但他们主要使用文字记述的方法对国情国力进行研究,其学科内容与现代统计学有较大的差别。,3.,社会统计学派,1850,年,德国的统计学家克尼斯,(K.G.A.knies),发表了题为,独立科学的统计学,的论文,提出统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学,他主张以“国家论”作为国势学的科学命名,而以“统计学”作为“政治算术”的科学命名。在德国、日本和前苏联,社会统计学派都曾有相当大的影响。,各国学者在社会经济统计指标的设定与计算、指数的编制、资料的收集与整理、统计调查的组织和实施、经济社会的数量分析和预测等方面做出的贡献已成为现代统计学的重要组成部分。例如
9、,“恩格尔系数”,至今仍为人们广泛使用。国民收入和国内生产总值的核算方法被称为“,20,世纪最伟大的发明之一”。,4.,数理统计学派,创始人是比利时统计学家凯特勒,(Adolphe Quetelet,,,17961874,年,),。他所著的代表作,概率论书简,、,社会物理学,等将概率论和统计方法引入社会经济方面的研究。,在学科性质上,凯特勒认为统计学是一门既研究社会现象又研究自然现象的方法论科学。,从,19,世纪中叶到,20,世纪,数理统计学得到迅速发展。,英国生物学家高尔顿提出并阐述了“相关”的概念;,皮尔逊提出了计算复相关和偏相关的方法。,戈塞特建立了“小样本理论”,即所谓的“,t,分布”
10、;,费歇 样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。,到,20,世纪中期,数理统计学的基本框架已经形成。数理统计学派成为英美等国统计学界的主流。,二、理论统计学和应用统计学,历经,300,多年的发展,统计学目前已经成为横跨社会科学和自然科学领域的多科性的科学。,“统计学是有关如何测定、收集和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。”从横向看,各种统计学都具有上述共同点,因而能够形成一个学科“家族”。从纵向看,统计学方法应用于各种实质性科学,同它们相结合,产生了一系列专门领域的统计学。,由此可见,现代统计学可以分为两大类:一类是以抽象的数量为研究对
11、象,研究一般的收集数据、整理数据和分析数据方法的理论统计学。另一类是以各个不同领域的具体数量为研究对象的应用统计学。,经,济,学,社,会,学,教,育,学,其,他,社,科,物,理,学,生,物,学,医,学,其,他,理,工,农,经,济,统,计,社,会,统,计,教,育,统,计,其,他,社,科,统,计,统 计 学,物,理,统,计,生,物,统,计,医,药,统,计,其,他,理,工,农,统,计,图,1-2,统计学学科体系,理论统计学把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变量的一般规律。理论统计学的特点是计量不计质,它具有通用方法
12、论的理学性质。,应用统计学是有具体对象的方法论。所谓应用既包括一般统计方法的应用,更包括各自领域实质性科学理论的应用。应用统计学从所研究的领域或专门问题出发,视研究对象的性质采用适当的指标体系和统计方法,解决所需研究的问题。应用统计学不仅要进行定量分析,还需要进行定性分析。所以应用统计学通常具有边缘交叉和复合型学科的性质。,理论统计学和应用统计学总是互相促进,共同提高的。理论统计的研究为应用统计提供方法论基础,应用统计学在对统计方法的实际应用中,又常常会对理论统计学提出新的问题,开拓理论统计学的研究领域。,社会经济统计学是一门以社会经济现象的数量方面为特定研究对象的应用统计学。,要在社会经济领
13、域应用统计方法,必须解决如何科学地测定社会经济现象即如何科学地设置指标的问题。要对社会经济问题进行统计分析,也必须以有关的经济与社会理论为指导。因此,社会经济统计学的特点是在质与量的紧密联系中,研究事物的数量特征和数量表现。,由于社会经济现象所具有的复杂性和特殊性,社会经济统计学不仅要应用一般的统计方法,而且还需要研究自己独特的方法,如核算的方法、综合评价的方法等等。,通过社会经济统计,国家可以准确、及时、全面、系统地掌握国民经济和社会发展情况,对国民经济和社会运行监督和预警,为宏观调控和决策提供依据。企业可以及时了解商品市场和要素市场运行的状况和企业自身的经营动态,为企业营销决策、投资理财提
14、供参考。,三、统计学与有关学科的联系与区别,1.,数学与统计学,数学与统计学都是研究数量规律的,都要利用各种公式进行运算。数学中的概率论,为统计学提供了数量分析的理论基础。统计学中的理论统计学以抽象的数量为研究对象,其大部分内容也可以看作是数学的分支。,统计学与数学的区别,从研究对象看,数学以最一般的形式研究数量的联系和空间形式。统计学特别是应用统计学则总是与客观的对象联系在一起的。,从研究方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特别是应用统计学家需要深入实际,进行调查或实验去取得数据,研究时不仅要运用统计的方法,而且还要掌握某一专门领域的知识。,2.,统
15、计学与经济学:统计学与相关的实质性学科如经济学等,有密切的联系。,统计学是开展经济研究不可或缺的重要工具。通过统计的实证研究,可以帮助人们认识有关的数量规律,同时检验经济学理论的真实性和完善程度。获得诺贝尔经济学奖的学者三分之二以上与统计有关。,经济学等实质性学科对经济统计学起着重要的指导作用。不仅统计指标的设定离不开实质性学科的指导,而且应用统计方法也在很大的程度上受所研究对象性质的影响。,统计学与相关实质性学科的区别。,实质性学科研究该领域现象的本质关系并对有关规律作出合理的解释和论证。而统计学只是为实质性学科研究和认识数量规律提供专门的方法和工具,并不直接对规律产生的原因和机理作进一步的
16、分析。,第三节 统计学的基本概念,一,总体与总体单位,二,样本,三,标志,四,统计指标与指标体系,五,统计数据,一、总体与总体单位,统计总体是根据一定目的确定的所要研究的事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。例如要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体。,同质性是确定统计总体的基本标准,它是根据统计的研究目的而定的。研究目的不同,所确定的总体也不同,其同质性的意义也随之变化。例如,研究城镇居民贫困户的生活状况,那么,贫困线下的城镇居民户则构成了统计总体,贫困线下的城镇居民户是同质的,而贫困线上的城镇居民户是非同质的。,统计总体还应具备大量性。
17、统计总体应该由足够数量的同质性单位构成。,总体单位(简称单位)是组成总体的各个个体。根据研究目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动过程等非实物单位。,总体和单位的概念是相对而言的,随研究目的不同,总体范围不同而变化。同一个研究对象,在一种情况下为总体,但在另一种情况下又可能变成单位。,根据总体所包含的单位数量,总体可以分为有限总体和无限总体两类。有限总体是由有限量的单位构成的总体。当总体单位数难以确定,其数量可能是无限时,便构成无限总体。,二、样本,当总体单位数量很多甚至无限时,不必要或不可能对构成总体的所有单位都进行调查。这时,需要采用一定的方式,从由作为研究对
18、象的事物全体构成的总体(又称母体)中,抽取一部分单位,作为总体的代表加以研究。这种由总体的部分单位组成的集合称为样本(又称子样)。,样本也由一定数量的单位构成的,样本所包含的总体单位数称为样本容量。,三、标志,总体各单位普遍具有的属性或特征称为标志。例如每个工人都具有性别、工种、文化程度、技术等级、年龄、工龄、工资等属性和特征,这些就是工人作为总体单位的标志。,标志分为品质标志和数量标志两种。品质标志表明单位属性方面的特征,品质标志的表现只能用文字、语言来描述如工人的性别。数量标志表明单位数量方面的特征,可以用数值来表现,如年龄。,如果一个总体中各单位有关标志的具体表现都相同,称之为不变标志。
19、例如在工人这一总体中,职业是不变标志。在一个总体中,当一个标志在各单位的具体表现有可能不同时,这个标志便称为变异标志。例如各人的工龄可能表现不同,因而是可变标志。,一个总体至少要有一个不变标志,才能够使各单位结合成一个总体。不变标志是总体同质性的基础。,作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。,四、统计指标与指标体系,统计指标是反映统计总体数量特征的概念和数值。如,2002,年我国国内生产总值,104790.6,亿元。,统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。,指标的概念(名称)是对所研究现象本质的抽象概括,也是对总体
20、数量特征的质的规定性。确定统计指标必须有一定的理论依据,使之与社会经济或科学技术的范畴相吻合。同时,又必须对理论范畴和计算口径加以具体化。,指标的数值反映所研究现象在具体时间、地点、条件下的规模和水平。在观察指标数值时,必须了解其具体的时间状态、空间范围、计量单位、计量方法等限定,同时注意由于上述条件的变化而引起数值的可比性问题。,指标与标志的关系,标志反映总体单位的属性和特征,而指标则反映总体的数量特征。标志和指标的关系是个别和整体的关系。需要通过对各单位标志的具体表现进行汇总和计算才能得到相应的指标。,由于总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。例如,
21、如果所要研究的是全国工业企业的情况,则各企业的职工人数、固定资产、工业增加值等都是总体单位(即各个企业)的标志,而如果研究目的变成研究某一企业的职工状况,则该企业变成一个总体,企业职工人数变成了统计指标,每个职工的文化程度、技术等级、性别、年龄等就成为标志。,统计指标可以分为数量指标和质量指标。,凡是反映现象总规模、总水平的统计指标称为数量指标。例如人口总数、企业总数、商品进出口总额等等,这些指标反映现象或过程的总规模和水平,所以也称为总量指标,用绝对数来表示。,凡是反映现象相对水平和工作质量的统计指标称为质量指标,例如职工平均工资、人口密度、工人出勤率等等。质量指标是总量指标的派生指标,用相
22、对数或平均数来表示,以反映现象之间的内在联系和对比关系。,统计指标体系是由一系列相互联系的统计指标组成的有机整体。用以反映所研究现象各方面相互依存相互制约的关系。例如,工业企业统计指标体系。,五、统计数据,变量与变量值,说明现象的某一数量特征的概念也被称为变量,变量的具体取值是变量值,统计数据就是统计变量的具体表现。,例如,固定资产是一个变量,各企业固定资产的具体数值是变量值。,为了区别,在本书中,凡是变量均用大写的英文字母表示,而变量值则用小写英文字母表示。,连续型变量是指变量的取值在数轴上连续不断,无法一一列举,即在一个区间内可以取任意实数值。例如,气象上的温度、湿度,零件的尺寸等。,离散
23、型变量是指变量的其取值是整数值,可以一一列举。例如,企业数,职工人数等。,确定性变量是受确定性因素影响的变量,即影响变量值变化的因素是明确的,是可解释和可控制的。,随机变量则是受许多微小的不确定因素(又称随机因素)影响的变量。变量的取值无法事先确定。,社会经济现象既有确定性变量也有随机变量。统计学所研究的主要是随机变量。,数据的计量尺度,统计数据是总体单位标志或统计指标的具体数量表现。,根据对研究对象计量的不同精确程度,人们将计量尺度由低到高、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。,(,1,)定类尺度是按照客观现象的某种属性对其进行分类。这一场合的所使用的数值只是作
24、为各种分类的代码,并不反映各类的优劣、量的大小或顺序。例如,人口按性别分为男女,用“,1”,表示男性,用“,0”,表示女性。定类尺度的主要数学特征是“,=”,或“”。在统计处理中,对于不同的类别,虽然可以计算单位数,但它不能表明第一类的一个单位可以相当于第二类的几个单位。,(,2,)定序尺度是对客观现象各类之间的等级差或顺序差的一种测度。利用定序尺度不仅可以将研究对象分成不同的类别,而且还可以反映各类的优劣、量的大小或顺序。例如,学生成绩可以分为优、良、中、及格和不及格等五类。在这里,定序尺度虽然无法表明一个优等于几个良,但却能确切地表明优高于良,良又高于中,。定序尺度的主要数学特征是“,”,
25、。,(,3,)定距尺度是对现象类别或次序之间间距的测度。定距尺度不但可以用数表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异。定距尺度使用的计量单位一般为实物单位,(,自然或物理,),或者价值单位。定距尺度的主要数学特征是“,+”,或“,”,。统计中的总量指标就是运用定距尺度计量的。,(,4,)定比尺度。定比尺度是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数,(,或平均数,),,用于反映现象的结构、比重、速度、密度等数量关系。例如,将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。定
26、比尺度的主要数学特征是“,”,或“,”,。,数据的类型,横截面数据又称为静态数据,它是指在同一时间对同一总体内不同单位的数量进行观察而获得的数据。,时间序列数据又称为动态数据,它是指在不同时间对同一总体的数量表现进行观察而获得的数据。,例如,,2005,年全国各省市自治区的国内生产总值就属于横截面数据。而“十五”期间我国历年的国内生产总值就属于时间序列数据。,数据的表现形式,绝对数。现象的规模、水平一般以绝对数形式表现。绝对数的计量单位一般为实物单位或价值单位,有时也采用复合单位。实物单位可以是自然计量单位,也可以是物理计量单位,如人口数用人计量,机器数用台计量,对于一些化工产品和燃料,常常还
27、折合成标准实物单位计量。复合计量单位是由两种或两种以上计量单位复合而成的,如以“吨公里”为货物周转量的计量单位,以“千瓦时”为用电量的计量单位。,相对数。相对数由,2,个互相联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、计划完成相对数等。关于这些相对数的含义及其计算,本书将在第十章作详细介绍。,平均数。平均数反映现象总体的一般水平或分布的集中趋势。关于这部分的内容,本书将在第三章作详细介绍。,第一节,统计数据的收集,第二节,数据整理,第三节,频数分布,第二章 统计数据的收集与整理,第二节,统计表和统计图,第四节,第一节,统计数据的收集,一
28、,统计数据收集概述,二,统计数据的收集方法,三,统计调查的具体形式,四,统计调查体系,五,现有统计资料的主要来源,一、,统计数据收集概述,统计方案设计,收集数据,整理与分析,资料积累、,开发、应用,根据统计学理论与相关实质性学科理论设计,描述统计与,推断统计,统计调查、试验获得,实现与实质性学科的结合,(一)有关概念,(一)有关概念,1.,统计数据收集的概念,统计数据收集是根据统计研究预定的目的和任务,运用科学的方法与手段,采集反映客观现象数据的过程。,统计数据收集处于统计工作的基础性阶段,(一)有关概念,2.,统计调查数据收集的渠道,1,)统计调查,2,)试验,3.,原始资料和二手资料,原始
29、资料:直接向调查对象收集的反映被调查单位情况的统计资料。,二手资料:借助他人的调查或已公布的资料加工整理后得到的资料。,(二)统计调查的方案设计,(二)统计调查的方案设计,1.,确定调查目的,调查目的是确定调查内容,选择具体调查调查方 式的前提。,2.,确定调查对象和调查单位,调查对象:需要调查的现象总体,该总体是性质 相同的许多调查单位组成。,调查单位:所要调查的具体单位,它是进行调登 记的标志的承担者。,(二)统计调查的方案设计,3.,确定调查项目和调查表,调查项目:所要调查的具体内容,即调查单位的特征(基本标志),由一系列的品质标志和数量标志组成。,调查表:将各个调查项目按照一定的顺序排
30、列一,定的表格上,就构成了调查表。,调查表分为:,1,)一览表,2,)单一表,(二)统计调查的方案设计,4.,确定调查时间和调查期限,调查时间:调查资料所属的时间,又称客观时间。,调查期限:进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间,又称主观时间。,5.,确定调查的组织实施计划,具体包括:确定调查机构、培训调查人员、落实经费来源和开支、确定资料的报送方法和公布调查结果的时间,二、,统计数据的收集方法,1.,直接观察法:调查人员到现场对调查对象进行观察点数和计量。,2.,报告法:或称通讯法,一般是由统计工作机构将调查表格分发或电传给被调查者,被调查者则根据填报的要求将填好的调查表
31、格寄回。,3.,采访法:根据被调查者的答复来收集统计资料,这种方法又可分为口头询问法和被调查者自填法两种。,二、,统计数据的收集方法,4.,登记法:由有关的组织机构发出通告,规定当事人在某事发生后到该机构进行登记,填写所需登记的材料。,5.,实验设计调查法:用于收集测试某一新产品、新工艺或新方法使用效果的资料的方法。,随着科技的发展,上述各种方法都可以与网络相结合,形成网络调查。,三、,统计调查的具体形式,统计调查的形式是指组织收集数据信息资源的方式方法。,按调查范围分类:,1,)全面调查:对调查对象的所有单位一一进行调查。,2,)非全面调查:对调查对象其中的一部分单位进行调查。,三、,统计调
32、查的具体形式,按时间标志分类:,1,)连续性(经常性)调查:指随着研究现象的变化,连续不断地进行调查登记。,2,)不连续性(一次性)调查:指间隔一段较长的时间对事物的变化进行一次性调查。,按组织形式分为:定期报表和专门调查,三、,统计调查的具体形式,下面介绍几种常用具体调查形式:,(一)普查,普查是专门组织的一种全面调查,它主要是用以收集某些不能或不宜用定期报表收集的统计资料。,普查有主要特点:,第一,它是非经常性的调查。,第二,它是一种全面调查,可获得大量详细、全面的资料。,三、,统计调查的具体形式,(二),定期统计报表,定期统计报表是依照国家有关法规,自上而下地统一布置,以一定的原始记录为
33、依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。,统计报表的主要特点:,第一,资料的来源是各个基层单位的原始记录。,第二,逐级上报和汇总的。,第三,属于经常性(连续性)调查,调查项目相对稳定。,三、,统计调查的具体形式,(三)抽样调查,抽样调查是一种非全面调查,是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算或检验调查对象总体的数量特征。,抽样调查特点:,第一,样本单位按随机原则抽取,排除了主观因素对选样的影响。,第二,根据部分调查的实际资料对调查对象总体的数量特征作出估计或检验。,第三,抽样误差可以
34、事先计算并加以控制。,三、,统计调查的具体形式,抽样调查的适用范围:,第一,不可能或不必要进行全面调查的社会现象。,第二,对普查资料进行必要的修正。,抽样调查应遵循的原则:,第一,随机原则,第二,最大抽样效果原则,三、,统计调查的具体形式,(四)重点调查,重点调查是指在调查对象中,选择一部分重点单位进行的非全面调查。,(五)典型调查,典型调查是一种专门组织的非全面调查。根据调查的目的,在对所研究的对象进行初步分析的基础上,有意识地选取若干具有代表性的单位进行调查和研究。,四、,统计调查体系,统计调查方法体系:建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和
35、少量的全面报表综合运用的统计调查方法体系。,在新的统计调查体系中,还要采用科学的推算方法,包括静态推算和动态推算。,五,、现有统计资料的主要来源,现有的统计资料的主要来源有:,(一)统计年鉴,(二)有关期刊,(三)有关网站,(四)数据库,第二节,数据整理,一,数据整理的意义和内容,二,统计分组,一、,数据整理的意义和内容,(一)统计数据整理的意义,既是统计调查阶段的继续和深入,又是统计分析阶段的基础,起着承前启后的作用。,(二)数据整理的内容,1,)统计资料的审核,2,)资料的分组和汇总,3,)编制统计表或绘制统计图,描述整理的结果。,二、,统计分组,(一)统计分组的概念,根据统计研究的目的和
36、客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的部分。,(二)统计分组的原则,穷尽原则,互斥原则,二、统计分组,(三)统计分组的种类,按分组标志的多少:分为简单分组和复合分组。,按分组的标志的性质不同:分为品质分组(或称属性分组)和数量分组(或称变量分组)。,按分组的作用和任务不同:分为类型分组、结构分组和分析分组。,二、统计分组,(四)统计分组的方法,1.,品质分组,2.,数量分组,(,1,)单项式分组与组距式分组,(,2,)间断组距式分组和连续组距式分组,(,3,)等距分组与异距分组,等距分组:标志值在各组保持相等的组距,异距分组:各组的组距不相等。主要用于
37、:,第一:标志值分布很不均匀的场合,第二:标志值相等的量具有不同意义的场合,第三:标志值按一定比例发展变化的场合,(三)组距式分组中相关指标的计算,1.,组距:在组距式分组中,组距是上下限之间的距离。,(,1,)连续式分组的组距计算公式:,组距,=,本组上限,本组下限,(,2,)间断式分组的组距计算公式:,组距,=,本组上限,本组下限,+1,2.,组数:组距的大小直接关系到组数的多少,组距大,组数就少;组距小,组数就多。,三、组距式分组中相关指标的计算,组数和组距的经验公式(斯特杰斯公式):,其中:,n,为组数,,N,为总体单位数,,d,为组距,,R,为全距,即最大变量值与最小变量值之差。,3
38、.,组中值:上下限之间的中点数值称为组中值,组中值的计算公式为:,4.,开口组的组距与组中值,在编制组距式变量数列时,使用“,以上”或“,以下”这样不确定组距的组,称为开口组,开口组的组距:以相邻组的组距为本组的组距。,三、组距式分组中相关指标的计算,第三节 频数分布,一、频数分布的基本概念,(一)频数分布,在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,称为频数分布,或次数分布。,(二)分布数列的两个要素,1.,总体按某标志所分的组,2.,各组所出现的单位数,即频数,亦称次数。,二、变量数列的编制,(一)编制方法,(二)相关指标的计算,1.,频率。频率即各组频数与总体单位总和之比
39、,它映了各组频数的大小对总体所起的作用的相对强度。,它的计算公式:,fi,:第,i,组频数,各单位标志值在各组间的分布状况,使杂乱无章的原始数据显示出一定的规律性。,二、变量数列的编制,2.,频率的性质,(,1,)任何频率都是界于,0,和,1,之间的一个分数,即:,(,2,)各组频率之和等于,1,,即:,3.,频数密度与频率密度,频数密度,=,频数,/,组距 频率密度,=,频率,/,组距,各组频数密度与各组组距乘积之和等于总体单位数,各组频率密度与各组组距乘积之和等于,1,。,三、累计频数与累计频率,累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。,(一)向上累
40、计,向上累计频数表明某组上限以下的各组单位数之和是多少;,向上累计频率表明某组上限以下的各组单位数之和占总体单位数比重的大小。,(二)向下累计,向下累计频数表明某组下限以上的各组单位数之和是多少;,向下累计频率表明某组下限以上的各组单位数之和占总体单位数比重的大小。,累计频数分布具有如下两个特点:,(,1,)第一组的累计频数等于第一组本身的频数;,(,2,)最后一组累计频数等于总体单位数。,累计频率同样也具有两个特点:,(,1,)第一组的累计频率等于第一组本身的频率;,(,2,)最后一组的累计频率等于,1,。,第四节 统计图与统计表,一、统计表,(,一,),统计表的结构,1.,从表式上看,统计
41、表是由纵横交叉的线条组成的一种表格。,2.,从内容上看,统计表由主词栏和宾词栏两个部分组成。,(,二,),统计表的分类,1.,按主词的结构分类:简单表、分组表、复合表,2.,按宾词设计分类:,(,1,)宾词简单排列,(,2,)宾词分组平行排列,(,3,)宾词分组层叠排列,第四节 统计图与统计表,(,三,),统计表的设计,总的要求:简练、明确、实用、美观,便于比较,注意事项:,1.,线条的绘制,2.,合计栏的设置,3.,标题设计,4.,指标数值,5.,计量单位,6.,注解或资料来源,第四节 统计图与统计表,二,.,统计图,运用统计图形可以直观地描述次数分布的类型特征。,常用的图形有以下三种:,(
42、,一,),直方图,(,二,),折线图,(,三,),曲线图,(,四,),累计曲线图,1.,累计曲线图的绘制,2.,洛伦茨曲线,美国洛伦茨博士,(Dr.M.O.lorenz),把累计频数,(,或频率,),分布曲线运用于研究社会财富、土地和工资收入的分配是否公平,第四节 统计图与统计表,三,.,频(次)数分布图的类型,各种不同性质的社会经济现象的次数分布的类型,概括起来,大致有三种:,(一)钟型分布,特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。,(,),(,),(,),第四节 统计图与统计表,10 20 30 40 50 60 70 80,50,40,30
43、,20,10,0,死,亡,率,年龄,某地区人口 死亡率,(二),U,型分布,U,型分布的形状与钟型分布相反,靠近中间的变量值分布 次数少,靠 近两端的变量值分布次数多,形成“两头大,中间小”的,U,型分布。,人口按年龄死亡率的分布图,第四节 统计图与统计表,正,J,型图,反,J,型图,(三),J,型分布,J,型分布有两种类型,一种是次数随着变量的增大而增多,另一种呈反,J,型分布,即次数随着变量增大而减少,如下图:,第一节,分布集中趋势的描述,第二节,分布离散程度的度量,第三节,分布的偏度和峰度,第三章 统计数据分布特征的统计描述,第四节,EXCEL,在统计描述中的应用,第一节,分布集中趋势的
44、描述,一,描述分布集中趋势的主要指标和作用,二,平均数,三,众数与中位数,一、描述分布集中趋势的主要指标和作用,描述统计分布集中趋势的指标又称平均指标,主要包括:平均数、众数和中位数。,这些指标的作用主要有:,1.,反映总体各单位变量分布的集中趋势和一般水平。,2.,便于比较同类现象在不同单位间的发展水平。,3.,能够比较同类现象在不同时期的发展变化趋势或规律。,4.,用于分析现象之间的依存关系。,二、平均数,平均数是根据统计数列中的全部数据计算得到的代表值。,平均数的特点是:统计数列中任何一项数据的变动,都会在一定程度上影响到平均数的计算结果。,平均数可分为以下几种:,1.,简单算术平均数,
45、(一)算术平均数,1.,简单算术平均数,式中,代表算术平均数,代表各单位标志值,,N,代表总体单位数。,简单算术平均数适用于未分组的资料,2.,加权算术平均数,2.,加权算术平均数,或,式中,,fi,为各组标志值出现的频数(次数),,为频率。,加权算术平均数适用于原始资料已经分组,并得出次数分布的场合。,(一)算术平均数,权数有两种表现形式:绝对数形式和相对数形式。,用各组的次数做为权数,即绝对数形式;,用各组的频率做为权数,即相对数形式。,特别地:当,f1=f2=f3=fn,时:,因此,可以说,简单算术平均数实际上是加权算术平均数的特例。,3.,是非标志的平均数,在总体中,具有某种性质的单位
46、占总体的比率为,p,,不具有该种性质的单位占总体的比率为,q,p+q=1,以,1,作为具有某种性质的单位的标志值,以,0,作为不具有该种性质的单位的标志值:,p,也称为总体中具有某种属性的单位成数,是是非标志的平均数。,4.,算术平均数的数学性质,(,1,)算术平均数与标志值个数的乘积等于各标志值的总和。,(,2,)各个标志值与其算术平均数的离差之和等于零。,(,3,)各标志值与算术平均数离差的平方和为最小值。,(,4,)对被平均的变量实施某种线性变换后,新变量的算术平均数等于对原变量的算术平均数实施同样的线性变换的结果。,(,5,)对于任意两个变量,x,和,y,,它们的代数和的算术平均数等于
47、两个变量的算术平均数的代数和。,(,二,),调和平均数,1.,简单调和平均数:,标志值的倒数的算术平均数的倒数。,式中,,H,代表调和平均数,N,为总体单位数。,适用场合:各标志值对应的标志总量为,1,个单位,(,或相等,),。,2.,加权调和平均数,计算公式:,式中,,m,表示各单位或各组的标志值对应的标志总量。,适用场合:各标志值对应的标志总量不为,1,个单位,(,或不相等,),(,二,),调和平均数,在权数选择合适时(,m1=m2=m3=mn,),加权调和平均数实际上是加权算术平均数的变形:,简单调和平均数是加权调和平均数的特例。,(,三,),几何平均数,几何平均数:是,n,项标志值连乘
48、积的,n,次方根。,分类:,1.,简单几何平均数:是,n,个标志值,x,i,连乘积的,n,次方根。计算公式为:,式中,G,表示几何平均数,,x,i,表示各项标志值。,(,2,)加权几何平均数,加权几何平均数是各标志值,f,i,次方的连乘积的次方根,计算公式为:,(,四,),幂平均数,设有一组变量求各变量,k,次方的和:,以幂平均代替各具体变量,x,i,其数值总和不变,则,称为,k,阶幂平均数,当,k,取不同的整数值时,幂平均数就给出不同的数值平均数计算公式。,(,四,),幂平均数,当,k,=1,时,,,为算术平均数计算公式。,当,k,=-1,时,,,为调和平均数计算公式。,当,k 0,时,,,
49、为几何平均数计算公式。,幂平均数的是关于,k,阶的递增函数,当,k,1,0,时为正偏斜;当,0),(,0,时,表示频数分布比正态分布更集中,分布呈尖峰状态,,0,),(,=0),(,0,),第四节,EXCEL,在统计描述中的运用,编制分布数列,计算有关的描述统计指标,一、编制分布数列,【,例,3-19】,某地区进行农产量抽样调查,抽取,50,个单位构成样本。样本资料如下,要求:,(,1,)编制次数分布数列(进行组距为,100,的等距分组),并绘制次数分布图;,(,2,)分别向上累计和向下累计并绘制累计分布图。,表,3-13,农作物亩产量数据,单位:公斤,240,440,400,375,500,
50、528,412,425,320,400,520,600,485,600,588,412,444,430,342,364,450,455,465,500,580,345,340,320,300,403,445,360,517,390,410,360,422,428,520,400,425,385,440,380,548,304,448,605,325,500,(一)用,直方图,工具进行分析,主要步骤如下:,1,输入数据。,A,列输入亩产量(数据未完成显示),,B,列为分组组限,C,列为对应的分组标志。,参见,Excel,文件。,2,调出,直方图,对话框,并按图所示填写。,3.,单击,确定,按钮,