资源描述
第第4章章 调查数据的整理与显示调查数据的整理与显示2l第一节、定类数据的整理与显示第一节、定类数据的整理与显示l第二节、定序数据的整理与显示第二节、定序数据的整理与显示l第三节、定量数据的整理与显示第三节、定量数据的整理与显示v 在获得原始数据资料之后,需要使用一定的方法对在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映调查资料的主要和使用。表格和图形是整理和反映调查资料的主要工具。工具。v重点:了数据整理的全过程,掌握分组方法及变量数列编制重点:了数据整理的全过程,掌握分组方法及变量数列编制的原则,灵活设计调查表和调查图。的原则,灵活设计调查表和调查图。v难点:针对不同类型的数据进行图、表的设计,区分不同图、难点:针对不同类型的数据进行图、表的设计,区分不同图、表的应用。表的应用。调查数据的整理l要弄清所面对的数据类型,因为不同类型的数据,要弄清所面对的数据类型,因为不同类型的数据,所采取的处理方式和方法是不同的所采取的处理方式和方法是不同的l对定类数据和定序数据主要是做分类整理对定类数据和定序数据主要是做分类整理l对定距数据和定比数据则主要是做分组整理对定距数据和定比数据则主要是做分组整理l适合于低层次数据的整理和显示方法也适合于高层适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整理和显示方法并次的数据;但适合于高层次数据的整理和显示方法并不适合于低层次的数据不适合于低层次的数据第一节、定类数据的整理与显示第一节、定类数据的整理与显示 v1。定类数据整理:。定类数据整理:v列出各类别列出各类别 计算各类别的频数计算各类别的频数 制作频数分布表制作频数分布表 用用图形显示数据图形显示数据v频数和频数分布频数和频数分布v(1)、频数)、频数/次数次数Frequency:落在某特定类别(或组):落在某特定类别(或组)中的数据个数中的数据个数v(2)、比例)、比例Proportion:某一类别数据占全部数据的比:某一类别数据占全部数据的比值值v(3)、百分比)、百分比Percentage:将对比的基数作为:将对比的基数作为100而计而计算的比值算的比值v(4)、比率)、比率Ratio:不同类别数值的比值:不同类别数值的比值v(5)、频数分布)、频数分布Frequency Distribution:把各个类:把各个类别及落在其中的相应频数全部列出,并用表格的形式表现出别及落在其中的相应频数全部列出,并用表格的形式表现出来。来。【例例1】v为研究广告市场的状况,一家广告公司在某城市随为研究广告市场的状况,一家广告公司在某城市随机抽取机抽取200人就广告问题做了邮寄问卷调查,其中人就广告问题做了邮寄问卷调查,其中的一个问题是的一个问题是“您比较关心下列哪一类广告?您比较关心下列哪一类广告?”1商品广告;商品广告;2服务广告;服务广告;3金融广告;金融广告;4房房地产广告;地产广告;5招生招聘广告;招生招聘广告;6其他广告。其他广告。某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 2、定类数据的图示、定类数据的图示v(1)条形图(图(bar graphbar graph)v条形图是用宽度相同的条形的高度或长短来表示数据变动的图形,在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率v绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图。(2)圆形图)圆形图(pie chart)v也称饼图,是用圆形及园内扇形的面积来表示数值也称饼图,是用圆形及园内扇形的面积来表示数值大小的图形。主要用于表示总体中各组成部分所占大小的图形。主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用。的比例,对于研究结构性问题十分有用。v例如,关注服务广告的人数占总人数的百分比为例如,关注服务广告的人数占总人数的百分比为25.5%例:某商店顾客购买计算机频数分布表公司频数 比重(%)苹果1326康柏1224贝尔510盖特威 918IBM1122合计5010050次购买计算机的频数分布条形图 购买饮料品牌【例例例例】一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边边边就就就就是是是是记记记记录录录录的的的的原原原原始始始始数据数据数据数据绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品购买饮料品牌条形图购买饮料品牌饼图第二节第二节 定序数据的整理与显示定序数据的整理与显示v1、定序数据的整理(1)相关概念(可计算的指标):v、累计频数cumulative frequencies:各类别的频数逐级累加得到的频数。v、累计频率cumulative percentages:将各类别的频率(百分比)逐级累加。v(2)编制累计频数分布表v【例3.2】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?v非常不满意;2不满意;3一般;4满意;5非常满意 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布 2、定类数据的图示、定类数据的图示环形图环形图 v环形图中间有一个环形图中间有一个“空洞空洞”,总体中的每一部分数,总体中的每一部分数据用环中的一段表示据用环中的一段表示v环形图与圆形图的区别:环形图与圆形图的区别:v、圆形图只能显示一个总体中各部分所占的比例、圆形图只能显示一个总体中各部分所占的比例v、环形图则可以同时绘制多个总体的数据系列,、环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环每一个总体的数据系列为一个环v、环形图可用于进行比较研究、环形图可用于进行比较研究 v、环形图可用于展示定类和定序的数据、环形图可用于展示定类和定序的数据甲乙两城市住房状况评价 图图3-4 3-4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价8%36%31%15%7%33%26%21%13%10%第三节、数值型数据的整理与显示第三节、数值型数据的整理与显示v1、分组方法:、分组方法:v(1)单变量值分组)单变量值分组v 、适合于离散变量;、适合于离散变量;v 、适合于变量值较少的情况。、适合于变量值较少的情况。v(2)组距分组(等距分组和异距分组)组距分组(等距分组和异距分组)v 、将变量值的一个区间作为一组;、将变量值的一个区间作为一组;v 、适合于连续变量;、适合于连续变量;v 、适合于变量值较多的情况;、适合于变量值较多的情况;v 、必须遵循、必须遵循“不重不漏不重不漏”的原则;的原则;v 、可采用等距分组,也可采用不等距分组、可采用等距分组,也可采用不等距分组。等距分组与异距分组等距分组与异距分组v等距分组:标志值在各组保持相等的组距,即各组等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。变动比较均匀的场合。v异距分组:各组的组距不相等异距分组:各组的组距不相等。单变量值分组单变量值分组v 以某一变量值分组以某一变量值分组(单项数列)。v 适用于取值不多的离散型变量。适用于取值不多的离散型变量。v例:某企业职工家庭人口分组调查表:某企业职工家庭人口分组调查表 简单分组和复合分组简单分组和复合分组v按分组标志的多少,可分为简单分组和复合分组。按分组标志的多少,可分为简单分组和复合分组。v简单分组:就是对研究现象按简单分组:就是对研究现象按一个标志一个标志进行分组。进行分组。v复合分组:用两个或两个以上标志分组,即先按一复合分组:用两个或两个以上标志分组,即先按一个标志分组,在此基础上再按第二个标志分小组,个标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成更小的组,这称为复又再层叠地按第三个标志分成更小的组,这称为复合分组。合分组。(多个变量值)多个变量值)例:2002年1月比特啤酒公司v 60个销售点的啤酒销售量个销售点的啤酒销售量(单位:桶单位:桶)比特公司啤酒销售量的分组调查比特公司啤酒销售量的分组调查 分组调查整理后,分组调查整理后,将杂乱无章的将杂乱无章的 60 个原始数据个原始数据压缩到压缩到8组,清晰地反映了更多的有用信息。组,清晰地反映了更多的有用信息。比特公司啤酒销售量的分布特征图1.1 比特公司啤酒销售量的频数分布 我国电视观众调查按品质标志分组的频数分布表v例:某企业职工人数调查表某企业职工人数调查表 异距分组v每组包含某一区间内的变量值每组包含某一区间内的变量值。v适用于连续型变量和取值很多的离散型变量。适用于连续型变量和取值很多的离散型变量。v组距数列是最重要的频数分布表。组距数列是最重要的频数分布表。v 例:某企业职工工资的分组调查 组距数列中的几个基本概念v、下限:一个组的最小值v、上限:一个组的最大值v、组距:上限与下限之差v、组中值:下限与上限之间的中点值v组中值=(上限值+下限值)/2v下限开口组组中值=上限值-邻组组中值/2v上限开口组组中值=下限值+邻组组中值/2组距数列中的几个基本概念v在编制组距数列时,需要解决如何分组、分组在编制组距数列时,需要解决如何分组、分组数量、组距、组限等问题。数量、组距、组限等问题。v重叠组限相邻组的上下限重合。相邻组的上下限重合。v适用于连续型变量。但各组上、下限中有一个适用于连续型变量。但各组上、下限中有一个不包含再内。通常按不包含再内。通常按“上限不在内上限不在内”处理,即组处理,即组区间是区间是 a,b)的形式。的形式。l不重叠组限相邻组的上下限不重合。相邻组的上下限不重合。l适用于离散型变量。适用于离散型变量。l 离散型变量的分组(不重叠组限)比特公司啤酒销售量的分组调查比特公司啤酒销售量的分组调查 连续型变量的分组连续型变量的分组(重叠组限:重叠组限:上限不在内上限不在内)某企业职工工资的分组调查某企业职工工资的分组调查 例:按雇工人数分组的私营企业规模调查 v有些现象中各类型的数值差异很大,其标志值呈几有些现象中各类型的数值差异很大,其标志值呈几何级数变化,则组距就应按几何级数确定。何级数变化,则组距就应按几何级数确定。v例:某市零售商店年营业额分组调查 分组数量和组距的确定分组数量和组距的确定v分组的数量和组距应根据对象的特点和分析的需要决定。分组的数量和组距应根据对象的特点和分析的需要决定。v第一,确定组数。斯特格斯第一,确定组数。斯特格斯(Sturges)经验公式:经验公式:k=1+3.322lgNv第二,确定组距。组距第二,确定组距。组距=(最大值(最大值-最小值)最小值)/组数组数v第三,确定组限。第三,确定组限。v一个组的最小值叫下限一个组的最小值叫下限v一个组的最大值叫上限一个组的最大值叫上限v分组过多则难以反映总体的数量分布特征;分组过多则难以反映总体的数量分布特征;v分组过少则会丢失许多重要的调查信息。分组过少则会丢失许多重要的调查信息。v (3)使用 SPSS 制作频数分布表v利用利用Analyze=Descriptive Statistics=FREQUENCYv功能:返回各组的频数。返回各组的频数。v v调查图可以形象、直观、生动、简洁地显示数据的调查图可以形象、直观、生动、简洁地显示数据的特征。特征。v常用的调查图有以下几种:常用的调查图有以下几种:l1.折线图 l通常用来描述时间序列数据通常用来描述时间序列数据,用以表示某些指,用以表示某些指标的变化趋势。标的变化趋势。l制作折线图时应正确选择坐标轴轴的刻度。对同样制作折线图时应正确选择坐标轴轴的刻度。对同样的调查资料,延伸或压缩某一坐标轴可能传达不同的调查资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。的甚至是误导的印象。l 调查图调查图图1.2 失业人数调查图过分压缩了过分压缩了Y轴轴图1.3 失业人数调查图过分压缩了过分压缩了X轴轴图1.4 各类进口商品的变化情况柱形图示例柱形图示例圆饼图圆饼图v用来表示总体各部分在总体中所占的结构比率用来表示总体各部分在总体中所占的结构比率。已婚孤寡或离婚单身已婚孤寡或离婚单身图1.6 某企业员工的婚姻状况经济管理中几种常见的频数分布曲线l正态分布曲线l这是客观事物数量特征上表现得最为普遍的一这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。类频数分布曲线。l如人的身高、体重、智商,钢的含碳量、抗拉强度,如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。某种农作物的产量等等。图1.7 正态分布曲线偏态曲线图1.8 偏态曲线右偏(正偏)左偏(负偏)例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极少数富豪手中,而多数人则是低收入者。此外,在产品质量管理中也普遍存在这种现象,如多数次品都集中出在少数工人手中;次品也大都出在少数几道工序上。这就要求在管理和控制上需要突出重点、抓住关键因素。按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。J 形曲线v其典型的应用分别是经济学中的供给曲线和需求曲线。其典型的应用分别是经济学中的供给曲线和需求曲线。v供给曲线供给曲线(正正 J 形形)表现为随着价格的增加,供给量以表现为随着价格的增加,供给量以更快的速度增加;更快的速度增加;v需求曲线需求曲线(倒倒 J 形形)表现为随着价格的增加,需求量以表现为随着价格的增加,需求量以更快的速度减少。更快的速度减少。v供给和需求曲线的交点即供求平衡点。供给和需求曲线的交点即供求平衡点。v 正 J 形倒 J 形图1.9 J 形曲线U形曲线v人和动物的的死亡率、设备的故障率等通常都服人和动物的的死亡率、设备的故障率等通常都服从从于于 U 形曲形曲线分布。线分布。v 图1.10 U形曲线 又称生命曲线或浴盆曲线习题1.调查数据分为哪几种类型?各有何特点?2.简述调查数据的分组的方法。内容内容定类数据的整理与显示定类数据的整理与显示1定序数据的整理与显示定序数据的整理与显示2定量数据的整理与显示定量数据的整理与显示3
展开阅读全文