spss中数据管理.ppt_咨信网zixin.com.cn

资源描述

第三部分数据管理 SPSS的主菜单Edit和Data能够建立数据文件、进行数据编辑，具有很强的数据管理功能。主要包括：定义变量属性（Define Variable Properties）、插入变量(Insert Variable)、插入个案(Insert Case)、个案排序(Sort Cases)、合并数据文件(Merge Files)、拆分数据文件（Splite Files)、汇总数据(Aggregate Data)、识别重复个案(Identify Duplicate Cases)及加权个案(Weight Cases)等.1数据管理分为四部分一、变量管理二、个案管理三、数据文件管理四、变量的变换和计算2一、变量管理1、插入变量或删除变量建立数据集后，可在Data View或Varible View中插入新变量。具体方法如下：方法1：在Data View中插入新变量将光标移至想要插入的位置单击右键或Data菜单Insert Variable，即可在当前光标所在的变量前插入一个VAR00001的新变量。双击该变量名，即可自动切换到Varible View中，可以对该变量名进行编辑，并且定义其属性。3方法2：在Varible Viewer下，将光标移至想要插入的位置单击右键或Data菜单Insert Variable，即可在当前光标所在的变量前插入一个VAR00001的新变量。可以对该变量名进行编辑，并且定义其属性。注意：插入或删除个案类似例3.1 调入数据文件02_1.sav2、定义变量属性（Define Variable Properties）定义变量属性（Define Variable Properties）可为用户在建立变量（定性变量、定序变量、定距变量）的描述性变量标识过程中提供帮助。例3.2 调入数据文件02_1.sav DataDefine Variable Properties4选中表示Unlabled5二、个案管理1、插入个案（Insert Case）2、个案定位（GoTo Case）3、个案排序（Sort Case）4、识别重复个案(Identify Duplicate Cases)5、选择个案（Select Case）6、个案加权(Weight Cases)61、插入个案（Insert Case）或删除个案例3.3 在数据文件02-1.sav的第10 个个案前插入一个名为“王蒙”（1975年2月28日出生，体检正常）的个案，将第5个个案删除.操作：将光标移到第10个个案，选择EditInsert Case，即在第10个个案前插入一空行，也可右键快捷菜单操作。2、个案定位（GoTo Case）使用GoTo Case功能，可以方便、快捷的在大量数据中查找到指定的个案，以便对其进行编辑修改或在其前插入新个案。7例3.4 在数据文件cesd.sav中，把第268个案的性别由“女”改为“男”。选择EditGoTo Case，在Case Number框中输入268，OK3、个案排序（Sort Case）Sort Case能将数据文件中的数据（或字符）进行排序，排序的方法可以依据变量作为排序关键词，递增或递减排序。（大小顺序或字典顺序）。操作如下：用鼠标选择“Data Sort Cases”，会弹出以下对话框（图2-12）。选中“考试成绩”，单击中间的黑三角，把这个变量移至右面的矩形框中（这个过程也可以通过双击“考试成绩”完成）。再选择排序方式（升序或降序），点击“OK”就可以了。8例3.5 数据文件hong1.sav,试对体重从小到大排序。注意：排序变量可以为多个，具体步骤如下：1、选择var1作为第一排序变量。2、按照var1降或升如选降排列。3、选择var2作为第二排序变量。4、按照var1降或升如选升排列。5、单击OK，新数据覆盖原数据。94、识别重复个案(Identify Duplicate Cases)用户在进行大样本量的调研工作中，可能重复访问某个被访对象或重复录入某份试卷，造成数据文件中包含重复个案，引起偏倚。利用识别重复个案(Identify Duplicate Cases)，用户可以对重复个案进行查找，并且进行剔除。操作：Data-Identify Duplicate Cases出现以下对话框101、定义个案配对变量2、配对组中的排序变量：用户可选择1或多个变量作为排序依据，顺序可选升或降。3、新建变量：原始个案指示器:1表示原始个案0表示匹配个案每组最后一个个案为原始个案每组第一个个案为原始个案根据个案指示器的数值进行过滤（自动划出重复个案）114、对每组的匹配个案进行连续计数（创建一个顺序号为0-n的数值变量，其中0表示不匹配）5、将匹配个案移至文件的最上方6、显示新建变量的频数表例3.5 在数据文件Identify.sav中查找id重复的个案，并且进行剔除。125、选择个案（Select Case）在SPSS中，用户可按一定准则选择个案，然后进行统计分析（Analyze）或作图(Graphs)。可以通过定义变量值或范围、日期、数学表达式、逻辑表达式或函数设定选择个案的准则。例3.6：对数据文件hong1.sav，用3种准则选择满足指定条件的部分个案并且进行频数分析。准则一：对数据文件hong1.sav中满足条件2.01=x63.00的体重（x6）的婴儿，对血红蛋白x5进行频数分析。操作：Data-Select CaseIf condition is satisfied 输入2.01=x6 and x6=80的为一组，60=语文成绩80的为一组，低于60的是一组。1、打开数据文件test.sav2、选择“Transform”菜单的“Compute Variable”项，弹出如图所示的“Compute Variable”（计算变量）对话框。3、在该对话框中的“Target Variable”框中输入变量名group。4、在数值表达式框中输入“1”如图示。5、打开标签输入变量标签“语文分组”。6、打开if37如图操作，continueok重复这一过程，对目标变量grounp分别定义60=语文成绩80的为一组，低于60的是一组的情况。38产生计数变量（count）Count过程用于标识某个值或某些值在某个变量的取值中是否出现。在统计分析中，有一项特定变量值计算功能，它可以计数在一个观测值中满足特定要求的那些变量值出现的次数，并将结果记录在一个新变量中。例3.15：统计一下数据文件test_1.sav中每个个案语文、数学、物理、化学4门课成绩有几门80分以上。1、打开数据文件test_1.sav2、选择TransformCount Value within Cases 弹出如下对话框39打开Define Values对话框Continue-ok40例：在某次调查中，有10个问题供调查者回答，回答正确为1，错误为0，请计算每个调查对象回答正确的题目数。数据文件为count.sav.1、打开数据文件为count.sav.2、选择TransformCount Value within Cases 3、目标变量定义为“正确题数”4、数值变量列表：q1,q2q105、define values value 1-add6、continues-ok41变量重新赋值变量重新赋值功能是指将数据文件中的原变量按照某种一一对应的关系生成新变量值，可以用这个新变量值替代原变量值，也可以生成一个新变量的过程。这种操作只适用于数值型变量.在“Transform”菜单中的有“Recode Into Same Variables”和“Recode Into Different Variables”两种赋值方法供选择。选择命令“Recode Into Same Variables”时，系统将产生新变量值直接替代原变量值。执行“Recode Into Different Variables”命令，系统将为产生的新变量值赋给一个新变量。例：要求在“Employee data.sav”文件中，将原变量educ中的值教育的年数重新赋值为新变量edulever（教育的等级），系统缺失值仍为缺失值，教育年数为8的转化为第1等级，教育年数为1215之间的转化为第2 等级，教育年数为1619的转化为第3等级，教育年数为19年以上的转化为第4等级。42具体操作如下：Input VariableOutput Variable框：educOutput Variable:Name:eduleverLable:教育的等级单击change按钮单击old and new values按钮Old new Sysmis-sysmis8112 thru 15-216 thru 18-319 thru highest-4单击continue按钮-ok4344 注意：在上述两种赋值情况下，用户均可通过单击“If”按钮指定条件，来确定参与重新赋值的个案。与前面根据已存在的变量建立新变量方法不同的是：变量的重新赋值Recode不能进行运算，只能根据指定变量值作数值转换，且这种转换是单一数值的转换。变量的自动赋值（Automatic Recode）变量的自动赋值可以将字符型、数字型数值转变成连续的整数，并将结果保存在一个新的变量中，其中字符型数据按照字母的顺序排序。在SPSS中的的许多模块中，分类编码不连续会产生空白的统计格子，从而导致效能降低，增加内存的需要。如：gender用二分类变量，用f表示女，用m表示男。这是字符型数据，当转成1女2男时化为连续的数值型。例：将字符型变量“gender”自动重新赋值为数值型变量，新变量名“sex”。45 具体操作步骤如下：1、打开数据文件 Employee data.sav2、Transform Automatic Recode3、varible-new varible:gender4、new name:sex 单击“add new name”5、recode starting from:lowest value(从最小值开始)ok46注：由自动重新编码产生的变量将保留变量的定义及值标识。对于无值标识的值，则将原值作为重新编码值的标识，并产生一个新旧值及值标识的对应表。47变量定义信息的查询在SPSS数据编辑窗口中的“Variable View”标签中可以看到变量的定义信息，在其中还可以进行修改。在SPSS的“Utilities”菜单下的Varible命令中还提供了变量信息的查询功能。在对话框左边的变量列表中选择某个变量，右边的“variable information”框中就会显示该变量的数据类型、变量标签、缺失值规定，变量值标签等信息。单击“go to”按钮，将会自动转移到数据编辑窗口或变量编辑窗口中该变量所在位置。48变量集的定义和使用在SPSS的统计过程中，有时候收集到的变量会有很多个。在进行各种数据处理和统计分析时，所有变量都会显示在各个处理对话框的变量列表框中供用户选择。在众多变量中选择几个变量进行处理以及分析是很麻烦的，尤其是对于某几个经常需要进行操作的变量。SPSS提供了变量集（Variable Set）的概念，可以很好地解决上面所提出的问题。所谓变量集是指一些变量的集合。比如我们收集了某班级同学众多科目的成绩，可以把这些科目分为理科、文科、自然科学等，这其实就是变量集的概念。SPSS变量集有两类：系统变量集和用户自定义变量集。系统变量集是SPSS系统已经定义好的，它包括以下两个集合。ALL VARIABLES:存放数据编辑窗口中所有的变量。NEW VARIABLES:存放数据编辑窗口中所有尚未保存的新定义变量。1、变量集的定义49 用户自定义变量集是用户根据实际数据分析需要定义的，它可以有许多个。一般把需要经常处理的、处理过程类似的若干个变量存放在一个用户自定义变量集中。2、定义用户变量集要将数学、物理、化学归到一个用户定义变量集中，名称为理科，具体操作的过程如下：1）打开数据文件test_1.sav2)选择“Uitilities”菜单下的“Define Variable Set”命令，弹出如下对话框3）单击“Add set”-close503、用户变量集的使用如果仅仅定义用户变量集，而没有指定SPSS使用该变量集，那么这个定义的用户变量集是不会自动发生作用的。也就是说用户应该告知SPSS系统要使用哪个变量集。SPSS默认使用系统变量集，也就是说，SPSS默认在数据处理中，屏幕上列出数据文件所有的变量。如指定SPSS使用用户定义的变量集，那么在分析时，屏幕上就会只列出用户变量集中的那几个变量，从而简化了变量的选择过程。具体操作如下：1)选择“Uitilities”菜单下的“use Variable Set”命令，弹出如下对话框2）若只选理科，数据文件只出现“理科”中的变量，见下图。可对其进行统计分析。5152532024/5/8 周三54

展开阅读全文