1、第一节 统计整理概述一、概念 原始统计资料综合统计资料二、统计整理的作用统计整理是一项重要的工作,既是统计调查的必然继续,又是统计分析的基础和前提条件,起着承前启后的作用。三、统计整理的步骤(一)对调查资料的审核:1、对原始资料的审核 完整性审核:检查应调查的单位或个体是否有遗漏;所有的调查项目或指标是否填写齐全。准确性审核:逻辑检查:检查数据是否真实反映客观实际情 况,内容是否符合实际。计算检查:检查数据是否有错误,计算是否正 确等。2、对第二手资料的审核:(1)适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要(2)时效性审核应尽可能使用最新的统
2、计数据(3)确认是否必要做进一步的加工整理(二)统计分组:分类将统计总体按照一定的标准分成若干类(或组),这是分类法在统计中的具体应用。统计分组是统计整理的基础,分组科学与否直接影响到统计整理工作的质量。(三)统计汇总:加总,求合计数在分组的基础上采用适当的汇总组织形式和技术方法,按分组要求对原始资料进行汇总综合,计算各组及总体的单位数和标志总量。统计汇总是统计整理的中心内容(四)编制统计表以简明扼要的表格形式表述统计汇总的结果,反映社会经济现象在数量方面的具体表现和有关联系。统计表成为统计整理的有效表现形式 第二节 统计分组一、统计分组的概念 1、概念:总体 各组统计整理的首要步骤就是对调查
3、得到的原始资料进行分组。统计分组就是根据统计研究的目的和任务,按照选定的变异标志将总体划分为若干部分或组别的一种统计方法。社会产品按其经济用途分为生产资料消费资料工业企业按年产量或投资总额可分为大型、中型、小型企业;居民按居住地区,一般可分为城市农村从总体的角度看,将总体划分为若干性质不同的组成部分,使不同组的单位之间具有明显的差别,是“分”的过程;另一方面,从个体的角度看,把性质相同的总体单位组合起来,使同组内各单位具有相对的同质性,是“合”的过程。2、统计分组的原则:(1)周延性:即一个不漏(又称穷举原则)(2)互斥性:即能重复(又称互斥原则)即:要求保持组内资料同质性和组间资料的差异性二
4、、统计分组的作用(一)区分社会经济现象的类型社会经济现象是极其复杂多样的,客观上存在着各种不同类型,各种不同类型的现象在规模、水平、速度、结构、比例关系等方面的数量表现有所不同或具有差异,利用统计分组就能根据统计研究的目的,将总体区分为各种性质不同的类型,来研究各类现象的数量差异和特征以及相互关系。(二)研究总体的内部结构利用统计分组,计算出各组数值在总体中所占比重,对社会经济现象的内部结构进行研究,可说明现象总体的基本性质和特征。对现象内部结构的变化进行动态研究,还可以反映现象总体发展变化的过程、趋势和规律表3.1 某厂近几年老、中、青职工所占比重表(%)年份老年职工中年职工青年职工 合计2
5、0002001200220032004403830252035363840382526323542100100100100100从表中资料可以看出,该厂通过近几年职工队伍的调整,初步形成了以中、青年职工为主体的年轻化的职工队伍。(三)研究现象之间的依存关系社会经济现象之间都存在着不同程度的相互联系、相互制约的依存关系,例如,施肥量与亩产量,原材料消耗量与产品单位成本,商品销量与价格之间都存在着一定的依存关系。利用统计分组,将性质上相关的分组资料联系起来分析,就可以揭示现象之间的联系和依存关系。表表3.2 3.2 某年某地区部分商品水平流通费用率表某年某地区部分商品水平流通费用率表按商品流转额分
6、组(万元)商店数(个)商品流通费用率(%)100以下10020020040040060060080080010001000以上25801307540181011.210.59.86.55.85.04.8通过表中分组资料分析,可以看出商品流通费用率与商品流转额之间存在负相关的依存关系为:即随着商品流转规模的扩大,其流通费用率相应降低。三、分组标志(分组标准)(一)分组标志的概念:即分组的依据统计分组的关键在于正确选择分组标志,这是统计分组的核心问题。分组标志就是将总体划分为若干部分或组别的标准或根据如工业企业按生产资料所有制形式分组,则所有制形式就作为分组的标准成为分组标志。如果分组标志选择不当
7、,分组结果就难以正确反映总体的特征。(二)分组标志的选择:任何事物都有许多标志,要在许多可供选择的标志中选取能反映总体性质特征的标志作为分组标志,必须遵循以下三个基本原则:1、根据统计研究的目的选择 2、选择具有本质性的重要标志(抓主要矛盾)3、结合现象所处的具体条件四、统计分组的种类(一)按分组标志的性质不同分 1、按品质标志分组 如:学生按性别分组,企业按所有制性质分组等工业部门分类目录、主要商品目录等,以统一全国的分类口径,便于各部门掌握和使用。2、按数量标志分组 按数量标志分组的结果,形成变量数列。如:学生按年龄分组,企业按产值分组等要从各组的量的变化中研究、确定各组的数量特征,其中涉
8、及到变量的类型、变量值多少、变化范围大小等问题,以及如何相应地确定组数、组距和组限等问题,在第三节中详细叙述。(二)按分组标志的多少不同分 1、简单分组:对总体只按一个标志分组。例:对企业这个总体按所有制性质、规模大小分别分组。(1)(2)全民所有制 大型 企业 集体所有制 企业 中型 其他 小型 若干个相互联系的简单分组构成平行分组体系2、复合分组:对同一总体按照两个或两个以上的标志层叠起来进行分组 例:大型 全民所有制企业 中型 小型 大型 企业 集体所有制企业 中型 小型 大型 其他经济类型 中型 小型 在复合分组方法下形成复合分组体系五、统计分组的方法(一)按品质标志分组 1、选择品质
9、标志作为分组标志 2、确定组数并表示出各组(根据品质标志的具体表现)3、把各单位归入相应的组汇总出各组的单位数(次数)有的很简单,如人口按性别分组。有的很复杂(如人口按职业分组),可查相应的专业分类目录。(二)按数量标志分组 1、选择数量标志作为分组标志 2、确定组数、划定各组的界限(较复杂)3、把各单位归入相应的组汇总得出各组的单位数(称 为次数或频数;也可用相对数表示,称为频率)六、分组结果的表示方法 分组后的结果通常用如下形式来表示:这种形式称为分布数列(或次数分布或频率分布)所分得的各组 各组次数(或频率)合 计 总 次 数第三节 分布数列一、分布数列1、概念:在统计分组的基础上,将总
10、体的各单位按组归类整理,形成总体单位在各组间的分布。这种表明总体单位数在各组分配情况的资料称为次数(频率)分布,又称分布数列。2、分布数列的构成:由两部分构成:(1)各组 (2)各组次数(或频率)3、分布数列的种类:根据分组标志的不同可分为:品质分布数列:可用条形图、圆形图等表示 数量分布数列:简称为变量数列(1)品质分布数列按品质标志分组编制的分布数列,简称品质数列。如性别人数(万人)比率(%)男性女性65 35561 22851.6348.37合计126 583100.00(2)数量分布数列:重点二、变量数列(数量分布数列)1、概念按数量标志分组编制的分布数列。如我国第五次人口普查我国大陆
11、人口年龄分布:人口按年龄分组人口数(亿人)比率(%)14岁以下 2.8979 22.89 15 64 8.8793 70.15 65岁以上 0.8811 6.96 合 计 12.6583 100.00变量数列由两部分构成:变量数列由两部分构成:一是由变量值所形成的各个组,用一是由变量值所形成的各个组,用 表示;表示;二是总体单位在各组中出现的次数。二是总体单位在各组中出现的次数。有两种表现形式:有两种表现形式:一是用绝对数表示的次数,又叫频数,用一是用绝对数表示的次数,又叫频数,用 表示;表示;二是用相对数表示的次数,即各组次数占二是用相对数表示的次数,即各组次数占总次数的比重,称为频率或比率
12、,总次数的比重,称为频率或比率,用用 表示。表示。变量数列按变量类型不同,可分为连续型变量离散型变量变量数列按各组表示方式不同可分为单项变量数列组距数列 1、单项变量数列:每组用一个数表示。适合于离散变量 适合于变量值较少的情况 工人按日产量(件)分组 工人数(人)2 5 3 10 4 32、组距数列:适合于连续变量 适合于变量值较多的情况 可采用等距分组,也可采用不等距分组 学生按成绩分组学生数(人)60以下 3 6070 7 7080 20 8090 8 90以上 2 合 计 40三、组距数列中的有关概念(一)组限:表示每组的界限。有:上限():每组的最大值 下限(L):每组的最小值 1、
13、组限的表示方法有:(1)重叠组限:如:10 20 20 30 在统计每组的次数时应遵循“上限不在内”原则 (2)不重叠组限:如:10 20 (只适用于离散变量)21 30 2、组的表示方法:(1)闭口组:上、下限都有 (2)开口组:上、下限有一缺一(二)组距1、概念:每组中最大值与最小值之间的差距2、计算公式:组距(i)=上限 下限3、种类:根据各组组距是否相等,组距数列可分为:(1)等距数列 (2)异距数列:一般用次数密度表示,它是次数与组距之比。4、组距的确定与表示方法:一般用5、10、20、50、100等类似数字表示。5、全距:所有变量值中最大值与最小值之间的差距 全距(R)=最大变量值
14、 最小变量值(三)组中值 概念:每组中点的数值 计算公式:对于开口组,需先假定其所缺的上限或下限(假设开口组的组距与其相邻组的组距相等)。如:各 组 组 中 值 60以下 55 6070 65 7080 75 8090 85 90以上 95(四)组数(K)组数、组距、全距之间存在如下关系:可用经验公式来确定:K=1+3.322lgn四、变量数列的编制1、排序:将原始数据条理化 排序后 :(1)求出全距 R (2)确定变量数列的种类 (等距数列或不等距数列)2、确定组距和组数3、划定各组的界限:确定组限4、汇总得出各组单位数(次数)5、将结果用分布数列的形式表示出来课堂练习:某工厂同工种的50名
15、工人完成生产定额百分数(%)资料如下:83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 根据上述资料编制变量数列解:1、将原始资料按其数值大小重新排列82 83 86 87 88 93 101 101 103 105105 107 108 108 110 110
16、 113 114 115 116 117 117 118 118 119 120 121 123 123 125 125 125 126 126 127 127 131 132 135 136 137 138 138 141 142 142 146 151 158 163全距R=163-82=812、确定变量数列的形式采用等距数列3、确定组距和组数组数K=1+3.22lg50=1+3.22 1.69=6.44组距I=全距R/组数K=81/6.44=12.57取组距I=104、确定组限(上限不在内)分组分组次数次数比重(比重(%)100以下612100-110816110-1201122120-
17、1301122130-140714140-15048150以上36合计50100第四节 分布数列的表示方法一、表示法:用表格的形式表示学生按成绩分组组中值学生数(人)比率(%)向上累计向下累计工人数比率工人数比率60以下552 5.025.040100.060 7065615.0820.03895.070 80751332.52152.53280.080 90851537.53690.01947.590100954 10.040100.0410.0合计40100.0计算累计次数方法:1、向上累计:由变量值小的组向大的组累计,累计次数表示该组上限以下(比该组上限小)的组的次数的总和,所以又称为较
18、小制累计。2、向下累计:由变量值大的组向小的组累计,累计次数表示该组下限以上(比该组下限大)的组的次数的总和,所以又称为较大制累计。补充例题1有有27个工人看管机器台数如下:个工人看管机器台数如下:5 4 2 4 3 4 3 4 42 4 3 4 3 2 6 4 42 2 3 4 5 3 2 4 3试编制分布数列。试编制分布数列。解:解:【分析分析】“工人看管机器台数工人看管机器台数”是离是离散型变量,变量值变动范围很小,变量值散型变量,变量值变动范围很小,变量值项数也很少,应编制单项变量数列。项数也很少,应编制单项变量数列。编制结果如下:编制结果如下:按看管机器台数分组按看管机器台数分组看管
19、机器台数看管机器台数工人数工人数工人数的比重(%)2345667112122264174合计27100补充例题2某厂工人日产量资料如下:(单位:公斤)某厂工人日产量资料如下:(单位:公斤)162 158 158 163 156 157 160 162 168 160164 152 159 159 168 159 154 157 160 159163 160 158 154 156 156 156 169 163 167试根据上述资料,编制组距式变量数列,试根据上述资料,编制组距式变量数列,并计算出频率。并计算出频率。解:将原始资料按其数值大小重新排列。解:将原始资料按其数值大小重新排列。152
20、 154 154 156 156 156 156 157 157 158 158 158 159 159 159 159 160 160 160 160 162 162 163 163 163 164 167 168 168 169最大数最大数=169,最小数,最小数=152,全距,全距=169-152=17n=30,分为分为6组组工人按日产量分组表工人按日产量分组表工人按日产量分工人按日产量分组(公斤)组(公斤)工人数(人)工人数(人)比率(频率)比率(频率)(%)152-154155-157158-160161-163164-166167-169361151410.0020.0036.60
21、16.703.3013.30合计合计30100.00补充例题补充例题3某企业某企业50个职工的月工资资料如下:个职工的月工资资料如下:113 125 78 115 84 135 97 105 110 130105 85 88 102 101 103 107 118 103 87116 67 106 63 115 85 121 97 117 10794 115 105 145 103 97 120 130 125 127122 88 98 131 112 94 96 115 145 143试根据上述资料,将试根据上述资料,将50个职工的工资编制成等距个职工的工资编制成等距数列,列出累计频数和累计
22、频率。数列,列出累计频数和累计频率。解:将原始资料按其数值大小重新排列。解:将原始资料按其数值大小重新排列。63 67 78 84 85 85 87 88 88 94 94 96 97 97 97 98 101 102 103 103 103 105 105 105 106 107 107 110 112 113 115 115 115 115 116 117 118 120 121 122 125 125 127 130 130131 135 143 145 145按工资额分组按工资额分组按工资额按工资额分组(元)分组(元)工人数工人数向上累计向上累计向下累计向下累计频数频数频率频率%频数频
23、数频率频率%频数频数频率频率%60-7070-8080-9090-100100-110110-120120-130130以上以上216711106742121422201214239162737435046183254748610050484741342313710096948268462614合计50100二、图示法常用图形有:变量数列:次数分布直方图 次数分布折线图 次数分布曲线图 累计次数图品质数列:条形图 饼状图(圆形图)例:某车间例:某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下1101141151
24、19120124125129130134135以上以上358141064610162820128合计合计50100根据上述资料可绘制如下图形A、直方图和折线图105105 110110 115115 120120 125125 130130 135135 140140日加工零件数(个日加工零件数(个日加工零件数(个日加工零件数(个)频频频频频频数数数数数数(人人人人人人)我一眼就看我一眼就看出来了,大出来了,大多数人的日多数人的日加工零件数加工零件数在在120120125125之间之间!直方图下的面直方图下的面积之和等于积之和等于1 1例:时间数列数据绘制折线图0200400600199119
25、92199319941995199619971998城镇居民农村居民收收入入(元)(元)图图3-14 3-14 城乡居民家庭人均收入城乡居民家庭人均收入B、累计次数折线图例:例:乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530 8.036.031.015.010.0 24132225270300 8.0 44.0 75
26、.0 90.0100.03002761687530100.092.056.025.010.0合计合计300100.0根据上表资料可绘制如下累计次数折线图:243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向下累积向下累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积 乙城市家庭对住房状况评价的累积频数分布图乙城市家庭对住房状况评价的累积频数分布图乙城市家庭对住房状况评价的累积频数分布图乙城市家庭对住房状况评价的累积频数分布图C、曲线图:几种常见类
27、型:钟型分布、J型分布、U型分布 对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU对称(正态)分布对称(正态)分布对称(正态)分布对称(正态)分布对称(正态)分布对称(正态)分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU
28、UU钟型分布最常见,有以下几种类型:品质数列可绘制的图形 某城市居民关注广告类型的频数分布表某城市居民关注广告类型的频数分布表 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001.000100.0例:例:例:例:为研究广告市场的状况,一家广告公司在某城市随机抽取为研究广告市场的状况,一家广告公司在某城市随机抽取200200人就广告问题做了
29、邮寄问卷调查,其中的一个问题是人就广告问题做了邮寄问卷调查,其中的一个问题是“您比较关心您比较关心下列哪一类广告?下列哪一类广告?”1 1商品广告商品广告 2 2服务广告服务广告 3 3金融广告金融广告 4 4房地产广告房地产广告 5 5招生招聘广告招生招聘广告 6 6其他广告其他广告1、条形图人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广告告类类型型 某城市居民关注不同类型广告的人数分布图某城市居民关注不同类型广告的人数分布图2、圆形图(饼形图)其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5
30、%服务广告25.5%招生招聘广告5.8%某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成第五节 统计汇总一、概念 在分组的基础上,将总体各单位分别归入各组,计算各组及总体的单位数,各组及总体的标志总量,使原始统计资料转化为综合统计资料的工作过程。即加总合计的过程。二、组织形式1、逐级汇总:自下而上逐级汇总 就是按照一定的统计管理体制,自下而上逐级汇总调查资料。我国现行的国民经济统计报表就是采用这种组织形式。优点:能满足各地区、各部门对统计资料的需要;同时便于就地审核和订正原始资料。缺点:汇总的层次多,反复转录资料,发生差错的可能性较大,而且费时,从而影响资料的时效性。如
31、:班组 到 车间 再到 厂部2、集中汇总:集中起来,一次汇总 厂部 车间 班组就是将全部调查资料集中到组织调查的最高一级机关统一汇总,直接得出汇总的结果。优点:可以大大缩短资料汇总的时间,提高时效性,减少汇总差错。十分重要的或要求时效性较高的调查,往往采用这种汇总方式。这种方式最适用于快速普查、快速电讯报告等资料的汇总。缺点:资料如有差错,不能就地更正;同时,汇总结果有时不能及时满足各地区、各部门的需要。3、综合汇总:以上两种方式结合使用就是将逐级汇总和集中汇总结合起来形成的汇总形式。一方面对一些最基本的统计指标实行逐级汇总,另一方面对全部原始资料实行集中汇总,这样兼有上述两种组织形式的优点。
32、案例:我国全国人口普查就采用了这种组织形式进行汇总的,这样既保证了必要人口资料的及时使用,又保证了对人口情况进行深入分析研究的需要。但这种形式往往要花费大量人力、物力和财力。三、技术方法选择合适的汇总统计资料的技术方法,可以提高汇总工作的效率和质量。在我国统计汇总工作中采用的统计汇总技术主要有手工汇总和电子计算机汇总。1、手工汇总:常用的有 划记法 过录法 折叠法 卡片法2、计算机汇总(一)手工汇总是以手工操作方式对统计资料进行汇总,目前仍是普遍采用的一种方式。常用的手工汇总方法有划记法、过录法、折叠法和卡片法。1、划记法又叫点线法,就是用点、线等记号代表每一个总体单位,根据总体单位所属的组别
33、,直接在汇总表相应的组中记一个点或划一短线,最后计算各组中的点或线的数目,即得出各组的单位数。典型案例:选举唱票时采用划“正”字的方法。这种方法简便易行,但只适用于总体单位不多,而且只要求汇总单位数而不需汇总标志值的情况下。2、过录法就是将需要汇总的调查资料先过录到事先设计好的汇总表中,然后计算加总出各组及总体的单位数和标志总量,再将计算结果填入正式的统计汇总表。采用这种方法汇总的内容多,且便于比较核对,但过录工作量大,费时费力,一般只适用于总体单位不多且分组较简单的汇总工作。3、折叠法 就是将所有调查表或报表中需要汇总的项目和数值全部折在边上,并一张接一张地叠放在一起,然后直接汇总同一纵栏或
34、同一横行中的数字。这种方法简便易行,不需要过录,省时省力,报表汇总中常用此法。其缺点就是一旦出现差错,不易查明原因,往往要从头返工。4、卡片法就是将调查资料先摘录在特制的卡片上,一张卡片为一个调查单位,然后利用卡片进行分组归类、汇总计算。卡片法无论进行多少次分组,各单位资料只需进行一次过录,检查也较容易,一般运用于大规模的专门调查和分组较复杂的资料整理工作,比上述三种手工汇总方法更为简便准确。(二)电子计算机汇总 随着科技的发展和计算机的普及,利用电子计算技术和数据传输系统进行统计资料的汇总和计算工作是统计汇总技术发展的新方向,也是实现统计工作现代化的根本手段和标志。电子计算机汇总统计资料的主
35、要步骤是:首先是编制程序,即根据汇总方案用计算机语言对汇总工作进行全面系统的安排。这是非常重要的环节,一般在统计工作中有已编好的软件可供选用,常用的统计软件有数据库管理软件、录入软件、编辑整理软件、统计制图软件和分析评价用软件等。其次,将编好的程序和原始数据输入计算机,输入的速度和质量要有保证,否则会影响数据处理的最终结果;最后,电子计算机按照规定的程序进行读数、分类、计算等运算,并按设计好的格式通过输出装置输出汇总结果。应用电子计算机汇总统计资料,其主要特点是速度快,准确性高,在程序控制下自动工作,进行逻辑判断,并能存储大量的数据信息。第六节 统计表 经过统计分组和统计汇总,将原始统计资料转
36、化成了综合统计资料,最后一步就是把整理后的结果用合理的形式表现出来。一、统计表的结构(一)概念:1、广义:统计中的所有表格,包括调查表、整理表、分析表等。2、狭义:即将汇总结果按一定顺序排列在由横行、纵列交叉结合而成的表格中,这种表现统计资料的表格称为统计表。统计表能使大量统计资料系统化、条理化,简明易懂,一目了然,它是统计整理结果的重要表现形式;易于检查统计资料的完整性和准确性;通过统计表,可以对社会经济现象从多方面进行对照比较,了解现象或过程的内在联系,实际工作中被广泛采用。(二)结构从统计表的外 形上看,主要是由总标题、横行标题、纵栏标题和数字资料四部分构成。总标题:就是统计表的名称,放
37、在表的顶端中央横行标题(或横标目):是每一行的名称,一般写在表的左方,说明统计研究的对象,即统计总体,可能是经过分组的,即将所分得的各组按一定的顺序排列下来;也可能没有经过分组,即将各个总体单位按一定的顺序排列下来。纵栏标题(或纵标目):是每一列的名称,一般写在表的上方,是用来说明统计的研究对象的,也就是用来说明总体的一些标志或指标的名称。数字资料:与每一行、每一列对应的,即标志或指标的具体取值。附注:有时,需要对表格中的有些内容进行补充说明的,可在表格下方加“附注”。从统计表的内容来看,包括主词和宾词两部分。主词:就是统计表所要说明的对象或总体,它可以是各个总体单位的名称、总体的各个组或总体
38、单位的全部,通常列在表的左方,即横行部分。宾词:就是用来说明主词的,即用到的标志或指标的名称及其具体表现,通常列在表的右方。如:19971998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1997年年 1998年年 一、调查户数一、调查户数 二、平均每户家庭人口数二、平均每户家庭人口数 三、平均每户就业人口数三、平均每户就业人口数 四、平均每人全部收入四、平均每人全部收入 五、平均每人实际支出五、平均每人实际支出 消费性支出消费性支出 非消费性支出非消费性支出 六、平均每人居住面积六、平均每人居住面积户户人人人人元元元元元元元元平方米平方米 37890 3.19 1.8
39、3 5188.54 4945.87 4185.64 755.94 11.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40 资料来源:中国统计摘要1999,中国统计出版社,1999,第79页。总标题(表名)横行标题纵栏标题数字资料附注主词宾词二、统计表的种类根据主词是否经过分组及分组方法不同,可分为:1、简单表:主词未分组 2、简单分组表:主词经过简单分组 3、复合分组表:主词经过复合分组 即主词的三种设计方法1简单表是指表的主词未经任何分组,仅列出总体各单位的名称或按时间顺序简单排列的统计表。表3.9 人口普查中三个市的人口城市人口
40、数(人)A市B市C市6 800 0078 500 4325 408 698合计20709137简单表一般可以用来比较各单位、地区、国家的社会经济现象和情况,或者说明某些现象的发展情况。2简单分组表是指表的主词按某一标志进行简单分组的统计表。其主词可按品质标志分组,也可按数量标志分组。利用分组表可以揭示不同类型现象的特征,分析现象的内部结构和现象之间的依存关系。某地2009年全年就业人数及其构成按产地分组就业人数绝对数(万人)比重(%)第一产业第二产业第三产业 150 30 150 30 200 40合计 500 1003复合分组表是指表的主词按两个以上的标志进行复合分组的统计表。利用复合分组表
41、可以揭示被研究现象因受多个因素的共同影响而产生的变化情况,用来分析较复杂事物的特征及其规律性。国内生产总值及其分组表国内生产总值按产业和行业分组国内生产总值(亿元)比重%第一产业第二产业 工业 建筑业第三产业 交运仓储邮电通信业 批发和零售贸易餐饮业10050040010040020020010504010402020合计1 000100三、统计表的设计 统计表的设计主要是指对宾词的设计,亦即按照分析研究的需要,对宾词指标进行分组整理,通常称为宾词指标的设计。一般有两种设计方法。1简单设计就是按不同的分组标志对宾词指标进行简单分组,然后将各不同的分组在表中纵栏部分平行排列。简单设计通过几种平行
42、的分组,直接说明指标的内容,以便对总体进行进一步分析。各地区社会商品零售总额 (单位:亿元)地区 商品性质和用途城乡经济类型社会消费品零售总额农业生产资料销售额城镇 农村 国有 民营 外资 其他北京天津合计2复合设计就是将宾词指标按两个或两个以上的分组标志进行复合分组,作层叠的排列。复合分组把几种分组结合起来,可以深入说明总体的特征。但应注意的是如果分组标志过多,则宾词指标的栏数会成倍增加,使统计表过于复杂庞大,反而不易反映总体的规律性。究竟采用简单设计还是复合设计,根据统计研究的任务和要求全面加以考虑。2008-2012年农村劳动力的发布情况表劳动力产业年份人数第一产业第二产业第三产业合计男
43、 女 合计男 女 合计男 女 合计男 女20082009201020112012合计四、编制统计表时应注意的问题统计表设计总的要求是:简练、明确、实用、美观、便于比较。(一)统计表式设计注意事项1统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间保持适当的比例。2线条的绘制。表的上下端应以粗线绘制,表内纵横以细线绘制。表格的左右两端一般不划线,采用“开口式”。3合计栏的设置。统计表各纵列若需合计时,一般用将合计列在最后一行;各横行若需合计时,可将合计列在最前一栏或最后一栏。4栏数的编号。如果栏数较多,应当按顺序编号,习惯上主词栏部分分别编以“甲、乙、丙、丁”等序号,宾词栏编以“(1)、(
44、2)、(3)、(4)”等为序号。(二)统计表内容设计注意事项1.标题设计统计表的总标题,横行、纵栏标题要简明扼要,以简练而准确的文字表述统计资料的内容、资料所属的时间和空间范围。2指标数值表中数字应该填写整齐,对准位数,同一栏应精确到小数点后同一位。当数字因数值太小可忽略不计时,可写上“0”;当缺某项数字时,可用符号“”表示;不应有数字时用符号“”表示。3计量单位统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写表头的右上方。如果表中各栏的指标数值计量单位不同,可在横行标题后添一列计量单位。4注解或资料来源为了保证统计资料的科学性和严肃性,在统计表下,应注明资料来源,以备查
45、考。必要时,还可在统计表下加上注解或说明 本章习题1、某工厂同工种的50名工人完成生产定额百分数(%)资料如下:83 88 123 110 118 158 121 146 137 120 163 125 136 127 142 118 123 126 138 151 101 86 82 113 142 108 101 105 125 116 132 138 117 103 114 131 108 87 119 127 105 115 126 125 110 107 141 135 117 93 要求:(1)根据上述资料编制变量数列 (2)根据(1)的结果绘制直方图、次数折线图 和累计次数折线图
46、。第三章第三章 统计整理统计整理一、目的与要求一、目的与要求 本章阐述统计整理的理论与方法,包括本章阐述统计整理的理论与方法,包括统计分组、资料汇总和统计表的设计。本统计分组、资料汇总和统计表的设计。本章的教学要求:章的教学要求:1、明确统计整理在统计研、明确统计整理在统计研究中承前启后的地位;究中承前启后的地位;2、掌握统计分组的、掌握统计分组的方法和汇总技术;方法和汇总技术;3、掌握次数分布的编制;、掌握次数分布的编制;4、学会统计表的编制并能熟练地运用。、学会统计表的编制并能熟练地运用。二、重点与难点二、重点与难点(一)深刻理解统计分组的含义和作用(一)深刻理解统计分组的含义和作用根据统
47、计研究任务的要求和现象总体的内根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为在特点,把统计总体按照某一标志划分为若干性质不同又有联系的几个部分,称为若干性质不同又有联系的几个部分,称为统计分组。统计分组。总体的变异性是统计分组的客观依据。统总体的变异性是统计分组的客观依据。统计分组有计分组有“分分”和和“合合”两层意思:对总两层意思:对总体而言是体而言是“分分”,即将统计总体按照某个,即将统计总体按照某个标志划分为若干个性质不同的组成部分;标志划分为若干个性质不同的组成部分;对个体而言是对个体而言是“合合”,即把具有某个相同,即把具有某个相同性质上的总体单位归在同一组
48、内。性质上的总体单位归在同一组内。统计分组是总体内进行的一种定性分类,统计分组是总体内进行的一种定性分类,它把总体划分为一个个性质不同的范围更它把总体划分为一个个性质不同的范围更小的总体。统计分组具有区分现象的质的小的总体。统计分组具有区分现象的质的差别、反映现象总体内部结构和分析现象差别、反映现象总体内部结构和分析现象之间的依存关系等三个主要作用。之间的依存关系等三个主要作用。(二)掌握如何选择分组标志(二)掌握如何选择分组标志分组标志的选择是统计分组的关键。分组分组标志的选择是统计分组的关键。分组标志,即将同质总体区分为不同组的标准标志,即将同质总体区分为不同组的标准或依据。分组标志一旦选
49、定,就必然突出或依据。分组标志一旦选定,就必然突出了总体在该标志下的性质差别。分组标志了总体在该标志下的性质差别。分组标志选择不当,不但无法显示现象的根本特征,选择不当,不但无法显示现象的根本特征,甚至会混淆事物的性质,歪曲社会经济的甚至会混淆事物的性质,歪曲社会经济的真实情况。正确选择分组标志,必须根据真实情况。正确选择分组标志,必须根据统计研究的任务目的,抓住现象本质区别统计研究的任务目的,抓住现象本质区别和内在联系的标志作为分组标志。和内在联系的标志作为分组标志。(三)掌握统计分组的方法(三)掌握统计分组的方法1、品质标志分组方法、品质标志分组方法品质标志分组一般较简单,分组标志一旦品质
50、标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也确定,组数、组名、组与组之间的界限也就确定。有些复杂的品质标志分组可根据就确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。统一规定的划分标准和分类目录进行。2、数量标志分组方法、数量标志分组方法按数量标志分组的目的并不是单纯确定各按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的组在数量上的差别,而是要通过数量上的变化来区分各组的不同类型和性质。变化来区分各组的不同类型和性质。数量标志分组方法从以下几个方面来说明:数量标志分组方法从以下几个方面来说明:(1)单项式分组和组距式分组)单项