1、1 1第七章第七章调查资料的统计处理与显示调查资料的统计处理与显示 2 2 定定量量资资料料的的来来源源有有两两个个,一一是是实实地地源源,二二是是文文献献源源。前前者者包包括括问问卷卷资资料料、结结构构性性访访问问和和观观察察的的记记录录等等等等,后后者者主主要要是是统统计计资资料料。由由于于统统计计资资料料的的整整理理较较问问卷卷资资料料和和结结构构性性观观察资料要简单,步骤要少。察资料要简单,步骤要少。第七章第七章 调查资料的统计处理与显示调查资料的统计处理与显示3 3 问问卷卷资资料料是是以以定定量量地地把把握握社社会会现现象象和和人人们们的的态态度度为为目目的的而而收收集集的的,因因
2、此此,整整理理要要求求更更细细心心,人人手手更更多多和和没没有有误误差差的的客客观观化化程程序序,其其过过程程通通常常分分为为资资料料审审核核、资资料料编编码码、数数据据输入、数据清理及数据汇总五个阶段。输入、数据清理及数据汇总五个阶段。第七章第七章 调查资料的统计处理与显示调查资料的统计处理与显示4 4第一节第一节 资料审核资料审核 资资料料的的审审核核是是指指研研究究者者对对所所收收集集的的原原始始资资料料(主主要要是是问问卷卷)进进行行初初步步的的审审阅阅,校校正正错错填填、误误填填的的答答案案,剔剔除除乱乱填填、空空白白和和严严重重缺缺答答的的废废卷卷。其其目目的的是是使使得得原原始始
3、资资料料具具有有较较好好的的准准确确性性、完完整整性性和和真真实实性性,从从而而为为后后续续资资料料整整理理录录入入与与统计分析工作打下较好的基础。统计分析工作打下较好的基础。5 5第一节第一节 资料审核资料审核一、资料审核的内容一、资料审核的内容二、资料审核的方式二、资料审核的方式6 6一、资料审核的内容一、资料审核的内容1、资料的完整性审核、资料的完整性审核2、资料的准确性审核、资料的准确性审核3、资料的真实性审核、资料的真实性审核7 71、资料的完整性审核、资料的完整性审核 对对资资料料的的完完整整性性审审核核,主主要要是是检检查查应应该该进进行行调调查查的的单单位位或或个个体体是是否否
4、都都进进行行了了调调查查;检检查查问问卷卷是是否否填填写写完完整整以以及及数数据据质质量量是是否否符符合合要要求求;检检查查所所有有调调查查项项目目或或指指标标是是否否填填写写齐全,是否出现错填、误填、乱填的情况。齐全,是否出现错填、误填、乱填的情况。8 82、资料的准确性审核、资料的准确性审核 主主要要检检查查那那些些含含混混不不清清的的、不不具具体体的的以以及及相相互互矛矛盾盾的的资资料料。为为此此可可采采用用以以下下方方法法,第第一一,逻逻辑辑检检查查,即即从从资资料料的的逻逻辑辑关关系系来来检检验验其其是是否否正正确确真真实实。第第二二,计计算算检检查查,就就是是通过各种数字运算来检查
5、各项数字的正确性。通过各种数字运算来检查各项数字的正确性。9 93、资料的真实性审核、资料的真实性审核 资资料料的的真真实实性性审审核核包包括括两两个个方方面面的的内内容容:一一是是资资料料来来源源的的客客观观性性,即即调调查查资资料料确确实实是是调调查查者者通通过过实实地地调调查查获获得得的的资资料料,而而不不是是调调查查者者主主观观杜杜撰撰的的东东西西。二二是是资资料料本本身身的的真真实实性问题。性问题。1010二、资料审核的方式二、资料审核的方式1、实地审核、实地审核2、集中审核、集中审核3、审核结果的处理、审核结果的处理11111、实地审核、实地审核 整整个个审审核核工工作作要要经经历
6、历三三个个阶阶段段:第第一一阶阶段段,是是由由调调查查员员进进行行审审查查。第第二二阶阶段段,由由现现场场专专职职的的检检察察员员进进行行检检查查。第第三三阶阶段段,是是在在调调查查结结束束后后由由调调查查组组织织机机关关的的检检查查员员进进行行检检查查,重重点点是是检检查查回回答答登登记记错错误误,计计算算错错误误及及调调查查员员是是否否对对应调查对象进行了调查,有无作弊等。应调查对象进行了调查,有无作弊等。12122、集中审核、集中审核 整整个个审审核核工工作作是是先先将将资资料料全全部部收收回回,然然后后集集中中时时间间进进行行审审核核,主主要要由由调调查查的的组组织织者者进进行行审审核
7、核。优优点点是是便便于于统统一一组组织织安安排排和和管管理理,审核标准一致,检查质量相对好些。审核标准一致,检查质量相对好些。13133、审核结果的处理、审核结果的处理 审审核核结结果果的的处处理理通通常常有有两两种种方方式式:一一种种是是问问卷卷的的回回访访,研研究究者者在在回回收收调调查查资资料料后后,由由其其他他人人对对所所调调查查的的样样本本中中的的一一部部分分个个案案进进行行第第二二次次调调查查,以以检检查查和和核核实实第第一一次次调调查查的的质质量量。另另一一种种是是对对于于审审核核的的结结果果进进行行筛筛选选和和剔除。剔除。1414第二节第二节 资料编码资料编码 编编码码是是给给
8、每每个个问问题题及及答答案案一一个个数数字字作作为为它它的的代代码码。从从资资料料处处理理的的角角度度看看,编编码码就就是是用用阿阿拉拉伯伯数数字字来来代代替替问问卷卷中中每每一一个个问问题题的的回回答答,或或者者说说是是将将问问卷卷中中的的答答案案转转换换成数字的过程。成数字的过程。1515第二节第二节 资料编码资料编码一、编码方式一、编码方式二、答案代码的确定二、答案代码的确定三、编码的具体方法三、编码的具体方法四、编制编码手册四、编制编码手册1616一、编码方式一、编码方式 对对资资料料编编码码的的方方法法,主主要要有有三三种种:预预编编码、后编码和边缘编码。码、后编码和边缘编码。171
9、7一、编码方式一、编码方式 (1)预预编编码码。预预编编码码的的方方法法,是是在在设设计计问问卷卷时时对对回回答答的的每每一一个个种种类类都都指指定定好好其其编编码码值值,并并印印在在问问卷卷上上。预预编编码码主主要要限限于于回回答答类类别别事事先先已已知知的的问问题题,这这些些问问题题主主要要是是封封闭闭性性问问题题,或或回回答答已已经经是是数数字字而而不不需需作作转转换换的的问问题题。如如,调查高中生高考的志愿调查高中生高考的志愿.1818一、编码方式一、编码方式 预预编编码码的的长长处处是是处处理理资资料料时时比比较较简简单单,省省力力省省时时。它它的的缺缺点点显显然然是是无无法法用用于
10、于开开放放性性回答,因为我们无法事先知道回答的种类。回答,因为我们无法事先知道回答的种类。1919一、编码方式一、编码方式 (2)后后编编码码。后后编编码码是是指指对对问问卷卷的的编编码码过过程程是是在在问问卷卷回回收收之之后后进进行行的的,而而不不是是与与问问卷卷设设计同时进行的,多用于开放性问题的编码。计同时进行的,多用于开放性问题的编码。2020一、编码方式一、编码方式 (3)边边缘缘编编码码。边边缘缘编编码码实实际际上上是是一一种种预预编编码码的的方方法法,它它与与前前面面所所讲讲的的预预编编码码的的不不同同之之处处在在于于,这这种种方方法法不不仅仅指指定定了了编编码码值值,而而且且给
11、给出出了了每每个个项项目目记记录录回回答答的的空空间间,现现在在应应用用的最多。的最多。2121二、答案代码的确定二、答案代码的确定 编编码码分分为为两两部部,第第一一步步是是对对回回答答进进行行分分类类,第第二二步步是是建建立立回回答答类类别别与与变变量量数数值值间间的的对应关系。对应关系。对对问问题题进进行行分分类类,指指的的是是在在设设计计问问卷卷时时,每一个指标或变量设置几个选项的问题。每一个指标或变量设置几个选项的问题。2222二、答案代码的确定二、答案代码的确定例:调查问卷:例:调查问卷:A1.您的性别:您的性别:男男 女女 A2.您的婚姻状况:您的婚姻状况:未婚未婚 已婚已婚 离
12、异离异 丧偶丧偶 A3.您是哪一年到该市打工的?您是哪一年到该市打工的?年年 A4.您现在的工作是:您现在的工作是:2323二、答案代码的确定二、答案代码的确定 问问题题的的代代码码分分别别是是A1、A2、A3、A4,问问题题中中每每个个答答案案的的数数字字就就是是答答案案代代码码,A2中中“1”表表示示“未未婚婚”,“2”表表示示“已已婚婚”,“3”表示表示“离异离异”,“4”表示表示“丧偶丧偶”。2424二、答案代码的确定二、答案代码的确定 编编码码时时,除除了了对对指指标标或或变变量量的的答答案案进进行行编编码码外外,问问卷卷编编号号、访访问问员员编编号号等等信信息息一一般般也要进行编码
13、,输入数据库。也要进行编码,输入数据库。2525三、编码的具体方法三、编码的具体方法1、单项选择题的编码、单项选择题的编码2、多项选择题的编码、多项选择题的编码3、开放性问题的编码、开放性问题的编码4、编码常用的规则、编码常用的规则5、答案栏编码的确定、答案栏编码的确定26261、单项选择题的编码、单项选择题的编码 给给出出的的答答案案至至少少有有两两个个,回回答答者者根根据据自自己己的的情情况况选选择择一一个个答答案案作作为为回回答答的的单单项项选选择择题题目目,通通常常直直接接使使用用问问卷卷设设计计时时赋赋予予每每一一个个答答案案的的数数值值作作为为其其代代码码值值,如如前前面面A1、A
14、2题题每每个个答答案案前前面面的的数数字字就就是是其其代代码码值值,编编码码时时直接将这些数字填写在编码栏即可。直接将这些数字填写在编码栏即可。27272、多项选择题的编码、多项选择题的编码(1)不确定选择个数的多项选择题)不确定选择个数的多项选择题(2)确定选择个数的多项选择题)确定选择个数的多项选择题2828(1)不确定选择个数的多项选择题)不确定选择个数的多项选择题 不不确确定定选选择择个个数数的的多多项项选选择择题题指指的的是是在在调调查查时时不不设设定定回回答答者者对对某某一一问问题题的的选选择择答答案案的的数数目目。编编码码一一般般采采用用“0,1”形形式式,如如果果选选择择了了,
15、则则标标记记为为“1”,没没有有选选择择,则则标标记记为为“0”。2929(2)确定选择个数的多项选择题)确定选择个数的多项选择题采用采用“0,1”编码。编码。用答案前的数字作为代码。用答案前的数字作为代码。30302、多项选择题的编码、多项选择题的编码 对对于于问问卷卷中中的的那那些些跳跳答答/不不适适用用的的题题目目一一般般用用9,99,999等等固固定定的的代代码码。应应该该填填答答而而没没有有填填答答的的题题目目用用0或或空空格格来来表表示示,在在录录入入的的过过程程中中,可可直直接接空空过过去去,以以免免与与其其他他有有意意义义的数字代码相混淆。的数字代码相混淆。31313、开放性问
16、题的编码、开放性问题的编码 如如果果针针对对的的是是定定距距或或定定比比变变量量,可可以以直直接用填答的数字进行编码。接用填答的数字进行编码。32323、开放性问题的编码、开放性问题的编码 而而对对于于非非数数值值型型的的题题目目,则则先先制制作作编编码码本本,为为其其中中的的每每一一个个选选项项设设计计一一个个代代码码,再再进进行行编编码码,如如“您您的的专专业业是是?”,调调查查完完成成之之后后,可可以以根根据据随随机机抽抽取取的的一一些些样样本本的的情情况况设设定定代代码码,如如“1=社社会会学学,2=经经济济学学,3=教育学教育学”进行编码,并录入。进行编码,并录入。33334、编码常
17、用的规则、编码常用的规则 (1)使用统一的编码表和编码手册。)使用统一的编码表和编码手册。(2)对对答答案案完完整整的的有有问问题题的的编编码码,可可以以根根据据编码表直接进行编码。编码表直接进行编码。(3)对对选选择择答答案案,有有笔笔误误和和错错别别字字,但但不不影影响内容的判别时,也根据编码表直接编码。响内容的判别时,也根据编码表直接编码。34344、编码常用的规则、编码常用的规则 (4)对对答答案案不不明明确确,或或者者回回答答者者答答非非所所问问,不不合合逻逻辑辑的的答答案案,一一般般不不要要进进行行编编码码,而而是是记记录录下问卷编号、题号等,告知负责人统一处理。下问卷编号、题号等
18、,告知负责人统一处理。(5)当当一一个个意意见见在在编编码码表表上上找找不不到到合合适适的的编编码码时时,编编码码员员不不得得私私自自加加新新码码,应应向向编编码码督督导导询询问处理办法。问处理办法。35354、编码常用的规则、编码常用的规则 (6)在在编编码码时时还还经经常常会会遇遇到到半半开开放放型型题题目目“其其他他”选选项项中中的的答答案案的的处处理理,这这是是需需要要确确认认写写在在“其其他他”位位置置的的内内容容是是否否已已出出现现在在问问卷卷所所列列出出的的选选项项中中,若若已已有有,则则用用答答案案中中已已有有的的代代码码进进行行编编码码,若若没没有有,才才按按其其它它选选项项
19、另另作处理。作处理。36365、答案栏编码的确定、答案栏编码的确定 每每个个问问题题答答案案代代码码的的位位数数通通常常称称为为编编码码的的宽宽度度。栏栏码码则则是是在在数数据据转转录录到到登登记记表表上上或或者者录录入入数数据据库库时时每每个个变变量量所所处处的的位位置置,它它是是根根据据每每个个指指标标或或问问题题答答案案代代码码的的位位数数,确确定定该该项项目目或或问问题题所所占占的的宽宽度度,再再根根据据前前后后顺顺序序来来确确定定其其在在整整个个数数据据排排列中所处的位置,从前依次往后排列。列中所处的位置,从前依次往后排列。3737四、编制编码手册四、编制编码手册 无无论论哪哪一一种
20、种编编码码方方法法,都都必必须须制制作作编编码码簿簿,用用以以指指示示每每个个编编码码的的意意义义和和变变量量的的位位置置。编编码码簿簿可可以以作作为为编编码码工工作作的的指指南南;它它可可以以使使研研究究者者在在分分析析过过程程中中便便于于查查找找变变量量及及各各个个编编码码所所代代表表的的意意义义。编编码码簿簿包包括括以以下下五五个个主主要要项目:项目:3838四、编制编码手册四、编制编码手册 (1)问问题题号号码码。是是在在调调查查表表或或问问卷卷上上的的问问题题的的题题号号,有有了了题题号号就就可可以以知知道道这这一一题题目目在在资资料卡片上的哪几列。料卡片上的哪几列。3939四、编制
21、编码手册四、编制编码手册 (2)变变量量号号码码。变变量量号号码码是是研研究究者者自自己己为为各各变变量量所所编编的的号号码码,有有了了变变量量号号码码后后,研研究究者者可可知知变变量量的的代代号号,以以利利分分析析计计划划的的拟拟订订,在在分分析析时时直直接接引引用用变变量量号号码码而而不不必必提提及及变变量量名名称。称。4040四、编制编码手册四、编制编码手册 (3)项项目目名名称称。又又称称变变量量名名称称,用用概概括括性性的的语语言言表表明明项项目目的的含含义义,使使研研究究者者对对于于该该变变量量的含义一目了然。的含义一目了然。(4)编编码码的的内内容容说说明明。即即给给出出每每一一
22、项项问问题题答答案的分类以及分配给每一类别的数字。案的分类以及分配给每一类别的数字。4141四、编制编码手册四、编制编码手册 (5)列列序序号号。即即每每一一项项目目应应当当占占哪哪几几列列。在在每每个个个个案案是是由由两两个个或或两两个个以以上上横横行行的的数数据据组组成成的的情情况况下下,常常设设有有横横行行序序号号一一栏栏,表表明明变变量的横行位置。量的横行位置。4242第三节第三节 数据输入数据输入一、人工输入数据一、人工输入数据二、其他输入方式二、其他输入方式4343一、人工输入数据一、人工输入数据 人人工工输输入入数数据据的的方方式式主主要要有有两两种种:一一是是直直接接从从问问卷
23、卷上上将将编编好好码码的的数数据据输输入入计计算算机机;另另一一种种是是先先将将问问卷卷上上编编好好码码的的数数据据转转录录到到专专门门的的登登录录表表上上,然然后后再再从从登登录录表表上上将将数数据据输输入入计计算算机机。一一般般都都是是直直接接将将编编好好码的数据输入计算机。码的数据输入计算机。44441、SPSS软件简介软件简介 SPSS软软件件是是世世界界上上著著名名的的统统计计分分析析软软件件之之一一。它它使使用用Windows的的窗窗口口方方式式展展示示各各种种管管理理和和分分析析数数据据方方法法的的功功能能,使使用用对对话话框框展展示示工工作作功功能能选选择择项项。它它的的基基本
24、本功功能能包包括括数数据据管管理理、统统计计分分析析、图图表表分分析析、输输出管理等。出管理等。45451、SPSS软件简介软件简介 SPSS软软件件操操作作简简单单,双双击击SPSS图图标标,进进入入SPSS数数据据编编辑辑器器窗窗口口。SPSS软软件件具具有有菜菜单单功功能能和和窗窗口口功功能能,包包括括文文件件、编编辑辑、视视图图、数数据据、转转换换、统统计计分分析析、图图形形、工工具、窗口转换、帮助十项菜单功能。具、窗口转换、帮助十项菜单功能。46462、数据输入、数据输入(1 1)变量名)变量名)变量名)变量名(2 2)变量数据类型)变量数据类型)变量数据类型)变量数据类型(3 3)
25、变量宽度)变量宽度)变量宽度)变量宽度(4 4)小数点位数)小数点位数)小数点位数)小数点位数(5 5)变量名标签)变量名标签)变量名标签)变量名标签(6 6)变量值标签)变量值标签)变量值标签)变量值标签(7 7)缺失值设置)缺失值设置)缺失值设置)缺失值设置(8 8)变量值的宽度和排列方式)变量值的宽度和排列方式)变量值的宽度和排列方式)变量值的宽度和排列方式(9 9)变量类型)变量类型)变量类型)变量类型4747二、其他输入方式二、其他输入方式1、计算机辅助数据输入、计算机辅助数据输入2、光电输入、光电输入48481、计算机辅助数据输入、计算机辅助数据输入 计计算算机机辅辅助助系系统统转
26、转换换主主要要用用在在电电话话访访问问中中,也也就就是是采采用用“计计算算机机辅辅助助电电话话调调查查系系统统”收收集集资资料料时时,通通过过计计算算机机和和转转化化软软件件可可以以直直接接将将调调查查员员在在电电话话访访问问过过程程中中输输入入电电脑脑中中的数据转化为数据文件。的数据转化为数据文件。49492、光电输入、光电输入 光光电电输输入入包包括括光光电电扫扫描描和和条条形形码码判判读读两两种种方方式式。光光电电扫扫描描是是指指将将登登陆陆到到专专门门的的光光电电扫扫描描纸纸上上的的编编好好码码的的数数据据,用用扫扫描描仪仪器器扫扫描描到计算机中。到计算机中。50502、光电输入、光电
27、输入 条条形形码码判判读读是是指指利利用用条条形形码码判判读读器器将将问问卷卷上上与与答答案案编编码码相相对对应应的的条条形形码码直直接接扫扫描描到到计计算算机机中中。使使用用这这种种方方法法需需要要先先将将与与问问题题的的每每一一个个答答案案相相对对应应的的编编码码设设置置成成条条形形码码,在在印刷问卷的时候,一起印在问卷上。印刷问卷的时候,一起印在问卷上。51512、光电输入、光电输入 输输入入数数据据时时,先先编编写写相相应应的的输输入入程程序序,然然后后再再将将选选中中的的答答案案的的条条形形码码逐逐一一扫扫描描进进计计算算机机即可。即可。5252第四节第四节 数据清理数据清理一、有效
28、范围清理一、有效范围清理二、逻辑一致性清理二、逻辑一致性清理三、数据质量抽查三、数据质量抽查5353一、有效范围清理一、有效范围清理 有有效效范范围围清清理理的的逻逻辑辑是是:问问卷卷中中任任何何一一个个变变量量,其其有有效效编编码码值值往往往往都都有有某某种种范范围围,而而当当数数据据中中的的数数字字超超出出这这一一范范围围时时,可可以以肯肯定这个数字一定是错误的。定这个数字一定是错误的。5454一、有效范围清理一、有效范围清理 产生这种错误的原因,主要是因为:产生这种错误的原因,主要是因为:1、原始问卷中的答案出现了问题。、原始问卷中的答案出现了问题。2、错误发生在编码员的编码上。、错误发
29、生在编码员的编码上。3、错错误误发发生生在在计计算算机机输输入入人人员员输输入入数数据据的的过过程中。程中。5555二、逻辑一致性清理二、逻辑一致性清理 逻逻辑辑一一致致性性清清理理的的基基本本思思路路是是:依依据据问问卷卷中中的的问问题题相相互互之之间间存存在在的的某某种种逻逻辑辑联联系系,来检查前后数据之间的合理性。来检查前后数据之间的合理性。5656三、数据质量抽查三、数据质量抽查 数数据据质质量量抽抽查查是是从从样样本本的的全全部部个个案案中中,抽抽取取一一部部分分个个案案,对对这这些些个个案案参参照照原原始始问问卷卷逐逐一一进进行行校校对对。用用这这一一部部分分个个案案校校对对的的结
30、结果果,来来估估计计和和评评价价全全部部数数据据的的质质量量。根根据据样样本本中中个个案案数数目目的的多多少少,以以及及每每份份问问卷卷中中变变量量数数和和总总数数据据的的多多少少,研研究究者者往往抽取往往抽取2%-5%的个案进行校对。的个案进行校对。5757第五节第五节 数据汇总数据汇总 所所谓谓汇汇总总,就就是是根根据据研研究究的的目目的的,对对分分类类后后的的各各种种数数据据进进行行计计算算和和加加总总,汇汇集集到到有有关关的的表表格格之之中中,以以集集中中系系统统地地反反映映调调查资料总体内部的数量情况。查资料总体内部的数量情况。5858第五节第五节 数据汇总数据汇总 汇汇总总的的目目
31、的的是是:(1)初初步步了了解解数数据据的的分分布布情情况况;(2)为为编编制制次次数数分分布布表表做做准准备备;(3)为为深深入入的的统统计计分分析析做做准准备备;(4)便便于保存调查资料。于保存调查资料。5959第五节第五节 数据汇总数据汇总 汇汇总总的的结结果果通通常常是是用用汇汇总总表表的的形形式式给给出出。制制作作汇汇总总表表时时,一一般般地地应应将将封封闭闭型型问问题题放放在在汇汇总总表表的的左左侧侧,然然后后是是半半封封闭闭性性问问题,最右侧是开放性问题。题,最右侧是开放性问题。6060第五节第五节 数据汇总数据汇总一、记录排序一、记录排序一、记录排序一、记录排序二、行列转置二、
32、行列转置二、行列转置二、行列转置三、数据格式转变三、数据格式转变三、数据格式转变三、数据格式转变四、文件合并四、文件合并四、文件合并四、文件合并五、数据汇总五、数据汇总五、数据汇总五、数据汇总六、记录拆分六、记录拆分六、记录拆分六、记录拆分七、记录筛选七、记录筛选七、记录筛选七、记录筛选八、记录加权八、记录加权八、记录加权八、记录加权九、九、九、九、DataData菜单中的其他命令菜单中的其他命令菜单中的其他命令菜单中的其他命令十、生成新变量十、生成新变量十、生成新变量十、生成新变量十一、对变量值重新编码十一、对变量值重新编码十一、对变量值重新编码十一、对变量值重新编码6161一、记录排序一、
33、记录排序 选选Data菜菜单单的的Sort Cases命命令令项项,弹弹出出对对话话框框,在在变变量量名名列列框框中中选选一一个个需需要要按按其其大大小小排排序序的的变变量量,点点击击 按按钮钮使使之之Sort by框框,然然后后在在Sort Order框框中中确确定定是是按按升升序序或或降降序序进进行行排排序序,点点击击Ok按按钮钮即即可可,就就可可以以看看到到排排序序的的变变量按要求进行了升序或降序的排列。量按要求进行了升序或降序的排列。6262二、行列转置二、行列转置 Transpose过过程程的的对对话话框框中中,左左侧侧为为候候选选变变量量框框,右右侧侧上上方方为为Variable框
34、框,用用于于选选入入需需要要转转置置的的变变量量,一一般般应应选选入入除除名名称称变变量量外外的的所所有有其其他他变变量量,如如果果有有变变量量未未选选入入,则则转转置置时会被自动放弃。时会被自动放弃。6363二、行列转置二、行列转置 右右侧侧下下方方为为Name Variable框框,用用于于指指定定原原数数据据文文件件中中记记录录转转置置后后变变量量名名的的字字符符变变量量,但但不不是是必必需需的的,此此时时系系统统会会将将新新变变量量自自动动按按var001、var002的顺序命名。的顺序命名。6464三、数据格式转变三、数据格式转变 选选择择Restructure后后,系系统统会会弹弹
35、出出数数据据重重排排向向导导,在在向向导导中中提提供供了了三三种种数数据据重重排排功功能能:将将宽宽型型数数据据重重排排成成长长型型格格式式;将将长长型型数数据据重重排排成成宽宽型型格格式式;数数据据转转置置,选选中中该该项项便便结结束束向导,直接调用向导,直接调用Ttanspose过程过程。6565四、文件合并四、文件合并1、合并个案、合并个案2、合并变量、合并变量66661、合并个案、合并个案 利利用用数数据据连连接接功功能能可可以以将将两两个个或或两两个个以以上上的具有相同变量格式的数据文件连在一起。的具有相同变量格式的数据文件连在一起。67671、合并个案、合并个案 利利利利用用用用数
36、数数数据据据据连连连连接接接接功功功功能能能能可可可可以以以以将将将将两两两两个个个个或或或或两两两两个个个个以以以以上上上上的的的的具具具具有有有有相相相相同同同同变变变变量量量量格格格格式式式式的的的的数数数数据据据据文文文文件件件件连连连连在在在在一一一一起起起起。打打打打开开开开需需需需要要要要合合合合并并并并的的的的数数数数据据据据,点点点点击击击击DataData菜菜菜菜单单单单的的的的Merge Merge FilesFiles命命命命令令令令项项项项,选选选选Add Add CasesCases项项项项,弹弹弹弹出出出出Add Add CasesCases:Read Read
37、FileFile对对对对话话话话框框框框,“*”“*”表表表表示示示示当当当当前前前前工工工工作作作作文文文文件件件件的的的的变变变变量量量量,“+”+”表表表表示示示示要要要要合合合合并并并并文文文文件件件件的的的的变变变变量量量量,新新新新生生生生成成成成的的的的数数数数据据据据包包包包括括括括namename、x1x1和和和和x2x2三三三三个个个个变量,点击变量,点击变量,点击变量,点击OKOK按钮进行合并。按钮进行合并。按钮进行合并。按钮进行合并。68682、合并变量、合并变量 利利用用数数据据连连接接功功能能还还可可以以将将两两个个或或两两个个以以上上的的具具有有相相同同观观察察单
38、单位位的的数数据据文文件件连连在在一一起。起。69692、合并变量、合并变量 点点击击Data菜菜单单的的Merge Files命命令令项项,选选Add Variable项项,弹弹出出Add Variable:Read File,点点击击要要合合并并的的文文件件,对对话话框框中中分分别别列列出出了了两两个个要要合合并并文文件件中中的的变变量量名名,“*”表表示示当当前前工工作作文文件件的的变变量量,新新生生成成的的数数据据包包括括name、x1、x2、x3、x4五个变量,点击五个变量,点击OK按钮进行合并。按钮进行合并。7070五、数据汇总五、数据汇总 首首先先,要要指指定定分分类类变变量量和
39、和汇汇总总变变量量;然然后后,SPSS自自动动根根据据分分类类变变量量的的取取值值将将记记录录数数据据分分成成若若干干类类,并并对对每每类类记记录录分分别别计计算算汇汇总总变变量量的的描描述述统统计计变变量量;最最后后,将将分分类类汇汇总总的的计算结果保存到一个计算结果保存到一个SPSS数据文件中。数据文件中。7171五、数据汇总五、数据汇总 例例如如,先先选选Data菜菜单单的的Aggregate命命令令项项,弹弹出出Aggregate Data对对话话框框,在在变变量量名名列列框框中中选选group变变量量,点点击击 按按钮钮使使之之进进入入Break Variable框。框。7272五、
40、数据汇总五、数据汇总 选选x1变变量量进进入入Aggregate Variable框框。因因为为x1要要作作平平均均值值汇汇总总,因因此此点点击击Function按按钮钮,弹弹 出出 Aggregate Data:Aggregate Variable 对对话话框框,选选Mean of values项项后后,点点击击Continue按钮返回。按钮返回。7373五、数据汇总五、数据汇总 选选x2变变量量进进入入Aggregate Variable框框。因因为为x2要要作作求求和和汇汇总总,因因此此点点击击Function按按钮钮,弹弹出出Aggregate Data:Aggregate Varia
41、ble 对对话话框框,选选Sum of values项项后后,点点击击Continue按钮返回;再点击按钮返回;再点击OK按钮即可得到最终结果。按钮即可得到最终结果。7474六、记录拆分六、记录拆分 在拆分分析中,有三种分析形式:在拆分分析中,有三种分析形式:(1)Analyze all cases:不拆分文件。:不拆分文件。(2)Compare groups:按按所所选选变变量量拆拆分分文文件件,各组分析结果紧挨在一起便于比较。各组分析结果紧挨在一起便于比较。(3)Organize output by groups:按按所所选选变变量量拆拆分文件,各组分析结果单独放置。分文件,各组分析结果单
42、独放置。7575六、记录拆分六、记录拆分 选选Data菜菜单单的的Split File命命令令项项,弹弹出出Split File对对话话框框,选选Repeat analysis for each group表表示示此此后后都都按按指指定定的的分分组组方方式式作作相相同同项项目目的的分分析析,用用户户可可从从变变量量名名列列框框中中选选1个个或或多多个个变变量量点点击击 按按钮钮使使之之进进入入Groups based on对话框,以此变量作为分组依据。对话框,以此变量作为分组依据。7676六、记录拆分六、记录拆分 统统计计分分析析的的结结果果将将根根据据分分组组变变量量进进行行分分析析。若若在
43、在数数据据分分割割之之后后要要取取消消这这种种分分组组,可可选选Analyze all cases项,则系统恢复如初。项,则系统恢复如初。7777七、记录筛选七、记录筛选 选选Data菜菜单单的的Select Cases命命令令项项,弹弹出出Select Cases对话框,其中,对话框,其中,(1)All cases:表表示示所所有有的的个个案案数数都都被被选选择择,这是系统默认选项。这是系统默认选项。7878七、记录筛选七、记录筛选 (2)If condition is satisfied:表表示示按按指指定定条条件件选选择择,点点击击If按按钮钮,弹弹出出Select Cases:If对对
44、话话框,先选择变量,然后定义条件。框,先选择变量,然后定义条件。7979七、记录筛选七、记录筛选 (3)Random sample of cases:表表示示对对观观察察单单位位进进行行随随机机抽抽样样,点点击击Sample按按钮钮,弹弹出出Select Cases:Random sample对对话话框框,有有两两种种选选择择方方式式:一一种种是是大大概概抽抽样样,即即键键入入抽抽样样比比例例由由系系统统按按比比例例随随机机抽抽取取,另另一一种种是是精精确确抽抽样样,即要求从第几个观察值起抽取多少个。即要求从第几个观察值起抽取多少个。8080七、记录筛选七、记录筛选 (4)Bases on t
45、ime or case range:表表示示顺顺序序抽抽样样,点点击击Range按按钮钮,弹弹出出Select Cases:Range对对话话框框,用用户户定定义义从从第第几几个个观观察察值值抽抽到到第几个观察值。第几个观察值。8181七、记录筛选七、记录筛选 (5)Use filter variable:表表示示指指定定的的变变量量作作过过滤滤,用用户户先先选选择择1个个变变量量,系系统统自自动动在在数数据据管管理理器器中中将将该该变变量量值值为为0的的观观察察单单位位标标上上删删除除标标记记,系系统统对对有有删删除除标标记记的的观观察察单单位位不不作作分分析。析。8282七、记录筛选七、记
46、录筛选 若若 用用 户户 在在 Select Cases对对 话话 框框 的的Unselected Case Are框框中中选选Deleted项项,则则系系统将删除所有被标上删除标记的观察单位。统将删除所有被标上删除标记的观察单位。8383七、记录筛选七、记录筛选 (6)调调用用Select Cases命命令令完完成成定定义义后后,SPSS将将在在主主窗窗口口的的最最下下面面状状态态行行中中显显示示Filter Cases字字样样;若若调调用用该该命命令令后后的的数数据据库库被被用用户户存存盘盘,则则当当这这个个数数据据文文件件再再次次打打开开使使用用时时,仍仍会会显显示示Filter Cas
47、es字字样样,意意味味着着数数据据选选择择命令依然有效。命令依然有效。8484八、记录加权八、记录加权 选选Data菜菜单单的的Weight Cases命命令令项项,可可对对指指定定的的数数值值变变量量进进行行加加权权。在在弹弹出出的的Weight Cases对话框中:对话框中:(1)Do not weight cases:表表示示不不做做加加权权,也可用于对做过加权的变量取消加权。也可用于对做过加权的变量取消加权。8585八、记录加权八、记录加权 (2)Weight cases by:根根据据选选择择的的变变量量进进行行加权。加权。8686九、九、Data菜单中的其他命令菜单中的其他命令 (
48、1)Define Dates:用用于于自自动动生生成成时时间间变变量量,主要用于时间序列模型。主要用于时间序列模型。(2)Insert Variable:在在当当前前列列自自动动插插入入新新变量。变量。8787九、九、Data菜单中的其他命令菜单中的其他命令 (3)Insert cases:在当前行自动插入新记录。:在当前行自动插入新记录。(4)Go to Cases:到到达达指指定定记记录录号号的的记记录录,在奇异值的查找中,也可以采用这一命令。在奇异值的查找中,也可以采用这一命令。8888十、生成新变量十、生成新变量 选选Transform菜菜单单的的Compute命命令令项项,弹弹出出C
49、ompute Variable对对话话框框,将将要要生生成成的的变变量量名名写写在在Target Variable窗窗口口,根根据据计计算算的的条条件件将将其其放放入入Numeric Expression窗窗口口,点点击击OK按钮,即在数据的最后生成一个新的变量。按钮,即在数据的最后生成一个新的变量。8989十一、对变量值重新编码十一、对变量值重新编码 选选Transform菜菜单单的的Record命命令令项项,包包括括两种变量值重新编码的形式:两种变量值重新编码的形式:(1)Into same variables:覆覆盖盖掉掉原原来来的的变变量。量。(2)Into different var
50、iables:重重新新生生成成新新的的变量。变量。9090十一、对变量值重新编码十一、对变量值重新编码 点点击击Into same variables和和Into different variables,分分别别生生成成 Into same variables 和和Into different variables对对话话框框,点点击击Old and New Values对变量取值进行重新设置。对变量取值进行重新设置。9191 第七章第七章调查资料的统计处理与显示调查资料的统计处理与显示 9292第二节第二节 定性资料处理定性资料处理一、定性资料及其特点一、定性资料及其特点二、定性资料分析的过程