第二章-SPSS数据文件的建立和管理.ppt

资源描述

第二章第二章SPSS数据文件数据文件建立与管理建立与管理2-1 SPSS数据文件数据文件一、一、SPSSSPSS数据文件的特点数据文件的特点 1、SPSS数据文件的扩展名是.sav；2、SPSS数据文件是一种有结构的数据文件。（结构内容）二、二、SPSSSPSS数据的基本组织方式数据的基本组织方式1、原始数据的组织方式如果待分析的数据是一些原始的调查问卷数据，或是一些基本的统计指标，那么这些数据就可按原始数据的方式组织。打开住房状况调查：桌面培训-住房状况调查一行为一个个案一列为一个变量二、计数数据的组织方式有时所采集的数据不是原始的调查问卷数据，而是经过分组汇总后的计数数据。在研究职称和年龄的关系时汇总得到如表所示的数据。其中职称的分组值分别为14，年龄段的分组值为13。职称年龄段35岁以下（1）3649岁（2）50岁以上（3）教授（1）0158副教授（2）10201讲师（3）20101助教（4）3520频数数据举例2-2 数据文件的结构和定义方法数据文件的结构和定义方法一、变量名二、数据类型三、变量名标签四、变量值标签五、缺失数据六、计量尺度 SPSS数据的结构是对SPSS每列变量及其相关属性的描述，它的定义是通过数据编辑窗口中的变量视图实现的。一、变量名（一、变量名（Name）变量名是变量存取的惟一标志。在定义SPSS数据文件结构时应首先给出每列变量的变量名。为了方便记忆，变量名最好与代表的数据含义相对应。变量名一般的起名规则：1、变量名的字符个数不多于8个；变量名不区分大小写字母。允许汉字作为变量名，汉字总数不能超过4个；2、首字符应以英文字母开头，后面可以跟除了！，？，*之外的字母或数字。下划线、圆点不能为变量名的最后一个字母；3、变量名不能与SPSS内部特有的具有特定含义的保留字相同，如ALL，BY，NOT，OR等；SPSS有默认的变量名，它以字母“VAR”开头，后面补足5位数字，如VAR00001，VAR00012等。二、数据的类型、宽度、小数位数二、数据的类型、宽度、小数位数 Type、Width、Decimals 数据类型是指每个变量取值的类型。SPSS中有三种基本数据类型，分别为数值型、字符型和日期型。相应的类型会有默认的列宽或小数位数等。1、数值型、数值型数值型是SPSS最常用的数据类型，通常由阿拉伯数字（09）和其他特殊符号（如美元符号、逗号、圆点）等组成。SPSS中数值型有以下五种不同的标识方法：（1）标准型（Numeric）（2）科学记数法型（Scientific Notation）（3）逗号型（Comma）（4）圆点型（Dot）（5）美元符号型（Dollar）SPSS变量类型默认长度小数位数显示方式标准型Numeric82标准格式数值变量，圆点表示小数点数值科学记数法型Scientific Notation82科学记数法逗号型Comma82圆点做小数点，逗点做三位分隔符的数值圆点型Dot82逗点做小数点，圆点做三位分隔符的数值美元符号型Dollar82有效数值前带$，以逗点为分隔符字符型String8无一串字符日期型Datedd-mmm-yyyy、mm/dd/yyyy 等等2、字符型（、字符型（String）3、日期型（、日期型（Date）字符型也是SPSS较常用的数据类型，由一串字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。日期型用来表示日期或者时间数据，如生日、成立日期等变量可以定义为日期型。三、变量名标签三、变量名标签（Label）1、变量名标签是对变量名含义的进一步解释说明，它可增强变量名的可视性和统计分析结果的可读性。2、变量名标签可用中文，总长度可达120字符，但在统计分析结果的显示中，一般不可能显示如此长的变量名标签信息。3、变量名标签这个属性是可以省略的，但建议最好给出变量名的标签。四、变量值标签（四、变量值标签（Values）变量值标签是对变量取值含义的解释说明信息，对于定类型和定序型数据尤为总要。例，用数值1表示男，用数值2表示女。可见，变量值标签对于定序数据（如收入的高、中、低）和定类数据（如民族、性别）来说是必不可少的，它不但明确了数据的含义，也增强了最后统计分析结果的可读性。变量值标签可以用中文。五、缺失数据（五、缺失数据（Missing）数据中明显错误或明显不合理的数据以及漏填的数据都可看做缺失数据。例，在某项客户满意度的问卷调查数据中，某个被调查者的年龄是213岁。这个数据显然是一个不符合实际情况的失真数据。例，在某项客户满意度的问卷调查数据中，某个被调查者的年收入没有填，是空缺的。SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方式是：首先，在遗漏的数据处填入某个特定的标记数据，例，将遗漏的年收入数据用特定的标记数据（如9999999）来替代；然后，再指明这个特定的标记数据（如9999999）或那些明显的失真的数据（如213）等为用户缺失值。这样，在进行统计分析时，SPSS就能将这些用户缺失值与正常的数据区分开来，并依据用户选择的处理策略对其进行处理或分析等。SPSS用户缺失值用户缺失值是：对字符型或数值型变量，用户缺失值可以是13个特定的离散值。对一个数值型变量，用户缺失值可以在一个连续的闭区间内并同时附加一个区间以外的离散值。SPSS系统缺失值：系统缺失值：是用一个圆点表示，它不等于0或.00，通常出现在数值型变量数据中。六、计量尺度（六、计量尺度（Measure）定距型数据（定距型数据（Scale）：）：通常是指诸如年龄、身高、体重、血压等连续数值型数据，也包括“人数”、“商品件数”等离散数值型数据；定序型数据（定序型数据（Ordinal）：）：具有内在固有大小或高低顺序，一般可以用数值或字符表示，它取值的大小能够表示观测对象的某种顺序关系（等级、方位或大小等），但是相邻级别之间的差距是不相等。例如，职称变量可以有低级、中级、高级三个取值，可分别用1,2,3表示。年龄段变量可以有老、中、青三个取值，分别用A、B、C表示等。定类型数据（定类型数据（Nominal）：）：是指没有内在固有大小或高低顺序，而只是一种名义上的指代，一般以数值或字符表示的分类数据。如性别变量中的男、女取值，可以分别用1，2表示。民族变量中的各个民族，可以分别用汉、回、满等字符表示。单击单击Variable View 进入；进入；定义定义变量变量名名定义变定义变量类型量类型定义变量名标签定义变量名标签变量值变量值标签标签定义度量尺度定义度量尺度定义显定义显示宽度示宽度定义定义对齐对齐方式方式定义变量类定义变量类型对话框型对话框定义变量值标定义变量值标签对话框签对话框定义变量缺省值定义变量缺省值对话框对话框变量结构定义的基本操作变量结构定义的基本操作2-3 SPSS数据的录入与编辑数据的录入与编辑一、一、SPSS数据的录入数据的录入 SPSS数据的录入操作在数据编辑窗口中的数据视图中实现。其操作方法与Excel基本类似，也是以电子表格的方式进行录入。二、二、SPSS数据的编辑数据的编辑1、SPSS数据定位数据定位（1）人工定位：）人工定位：指通过人工浏览数据，确定当前数据单元，适用于数据量较少的情况。用户只需要用鼠标拖动数据编辑窗口右边的滚动钮，或按键盘上的Page Up,Page Down 键就可以完成数据的浏览和定位。（2）自动定位：）自动定位：指SPSS按照用户给出的定位条件自动寻找满足条件的第一个数据单元，并设置它为当前数据单元，适用于数据量较大的情况。定位条件可以是一个个案的号码，也可以是某个变量的变量值。A、按个案号码自动定位将当前单元定位在任何单元中。选择菜单：编辑-转至个案-输入个案号码B、按变量值自动定位将当前单元定位在要查找的变量的任何一条个案上。选择菜单：编辑-查找-输入定位变量值2、插入和删除一条个案、插入和删除一条个案（1）插入一条个案：在数据编辑窗口的某条个案前插入一条新个案。将当前数据单元确定在一条个案上。选择菜单：编辑-插入个案（2）删除一条个案：即删除数据编辑窗口中的某条个案。在要删除的个案号码上单击左键，于是待删除的个案数据全部反色显示。单击右键，从弹出菜单中选择 cut选项。3、插入和删除一个变量、插入和删除一个变量（1）插入一个新变量：即在数据编辑窗口的某个变量前插入一个新变量。将当前数据单元确定在某变量上选择菜单：编辑-插入变量（2）删除一个变量：即删除数据编辑窗口中的某列变量。在要删除列的变量名上单击左键，于是待删除列的数据全部反色显示。单击右键，从弹出菜单中选择 cut选项。4 4、数据的移动、复制和删除、数据的移动、复制和删除数据的移数据的移动、复制和、复制和删除：与一般的除：与一般的应用程序相同用程序相同（1）选择操作对象（变量、个案、若干连续单元等）（2）剪切：Edit+Cut(Ctrl+X)复制：Edit+Copy(Ctrl+C)粘贴：Edit+Paste(Ctrl+V)恢复删除或修改前数据恢复删除或修改前数据 Edit+Undo插入与删插入与删除变量除变量插入与删除个案插入与删除个案数据的剪数据的剪切、粘贴切、粘贴与复制与复制 1.插入变量插入变量在添加处单击Var，单击右鼠标键出现右侧对话框,单击Insert Variables2.删除变量删除变量1.插入个案插入个案在添加处单击观测量，单击右鼠标键出现右侧对话框,单击Insert Case2.删除个案删除个案剪切剪切复制复制粘贴粘贴若想恢复，打开若想恢复，打开Edit-Undo2-4 读取其他格式的数据文件读取其他格式的数据文件一、直接读入其他格式的数据文件一、直接读入其他格式的数据文件基本操作步骤如下：（1）选择菜单：文件-打开-数据（2）选择数据文件的类型，并输入数据文件名。注意：注意：如果读入的是Excel格式文件，SPSS默认将它的所有数据读到SPSS数据编辑窗口中，也可以指定读取工作表中某个区域内的数据（A5:B10，表示仅读取以A5单元为左上角，B10单元为右下角的矩形区域内的数据）。工作表上的一行数据为SPSS的个案。如果Excel工作表文件第一行或指定读取区域内的第一行上存储了变量名信息，则应选择读取变量名选项。二、使用文本导向读入文本文件（1）选择菜单：文件-检索数据间如何分割数据文件的第一行上是否有变量名数据部分从文本文件的第几行开始个案数据在文本文件中是如何安排的指定文本文件的分割符号字符型数据表示方法2-5 SPSS数据文件合并数据文件合并一、纵向合并数据文件纵向合并数据文件就是将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行首尾对接，即将一个SPSS数据文件的内容追加到数据编辑窗口中当前数据的后面，依据两个数据文件中的变量名进行数据对接。纵向合并SPSS数据时，通常要注意以下两个问题：两个待合并的SPSS数据文件的内容合并起来应是有实际意义的。换句话说，如果两份完全不相干的数据，虽然操作上能够实现他们的纵向合并，但却是毫无意义的。为方便SPSS数据文件的纵向合并，在不同数据文件中数据含义相同的数据项最好用相同的变量名，且数据类型也最好相同，利于SPSS对变量的自动匹配。例有两份关于职工基本情况的SPSS数据文件，文件名分别为“职工数据.sav”和“追加职工.sav”。两份数据文件中的数据项不尽相同，且同一数据项的变量名也不完全一致。现需要将这两份数据合并到一起。纵向合并数据文件的基本操作步骤纵向合并数据文件的基本操作步骤1、在数据编辑窗口中打开一个需要合并的SPSS数据文件。2、选择菜单：数据-合并文件-添加个案 3、新的活动数据集中的变量：框中显示的变量名是两个数据文件中的同名变量，SPSS默认它们有相同的数据含义，并将它们作为合并后新数据文件中的变量。如果不接受这种默认，可以按按钮将它们剔除到非成对变量框中。*表示该变量是当前数据编辑窗口中的变量，表示该变量是指定的要追加的磁盘的数据文件中的变量。4、非成对变量：框中显示的变量名是两个文件中的不同变量。SPSS默认这些变量的含义不同，且不放入合并后的新文件中。如果不接受这种默认，可选择其中的两个变量名并按指定配对，表示虽然它们的名称不同，但数据含义是相同的。可进入合并后的数据文件中。或者，对某变量按改名后再指定配对。纵向合并数据文件的基本操作步骤纵向合并数据文件的基本操作步骤 5、如果希望在合并后的数据文件中看出哪些个案来自合并前的哪个SPSS数据文件，可以选项。于是合并后的数据文件中将自动生产一个名为源01取值为0或1的变量。可以省略。0表示个案来自第一份数据文件，1表示来自第二份数据文件。纵向合并数据文件的基本操作步骤纵向合并数据文件的基本操作步骤二、横向合并数据文件横向合并数据文件就是将数据编辑窗口中的数据与另一个SPSS数据文件中的数据进行左右对接，即将一个数据文件的内容拼到数据编辑窗口中当前数据的右边，依据两个数据文件中的个案进行数据对接。横向合并数据文件时，通常要注意以下三个问题：两个数据文件必须至少有一个名称相同的变量，该变量是两个数据文件横向拼接的依据，称为关键变量。两个数据文件都必须事先按照关键变量进行升序排列。为方便SPSS数据文件的横向合并，不同数据文件中数据含义不相同的数据项，变量名不应相同。例有两份关于职工基本情况的SPSS数据文件，文件名分别为“职工数据.sav”和“职工奖金.sav”。这里，两份数据文件中职工号的变量名是相同的，第二份数据中只有部分职工的奖金数据。现需要将这两份数据文件合并。横向合并数据文件的基本操作步骤横向合并数据文件的基本操作步骤（1）在数据编辑窗口中打开一个需要合并的SPSS数据文件。（2）选择菜单：数据-合并文件-添加变量个案由两个文件共同组成个案由当前窗口确定个案由第二个窗口确定（3）两个待合并数据文件中的所有变量名均显示在新的活动数据集框中，SPSS默认这些变量均以原有变量名进入合并后的新数据文件中。用户如果不接受这种默认，可以按将它们剔除到已排除的变量框中，或者剔除后按将变量改名，然后再按将它们从已排除的变量框中重新以新名选回到新的活动数据集框中，否则，可以省略。（*）表示该变量是数据编辑窗口中的变量，表示该变量是指定的磁盘数据文件中的变量。（4）如果两个待合并的数据文件中的个案数据是按顺序一一对应的，则可以直接完成合并工作。否则，进入第（5）步。横向合并数据文件的基本操作步骤横向合并数据文件的基本操作步骤（5）两个待合并数据文件中共有的变量名会自动显示在已排除的变量框中，选择项，并从已排除的变量框中选出作为关键变量到关键变量框中。（6）指定提供合并数据的方式。（7）如果希望在合并后的数据文件中看出哪些个案来自合并前的哪个SPSS数据文件，可以选项。于是合并后的数据文件中将自动生产一个名为源01取值为0或1的变量。可以省略。0表示个案来自第一份数据文件，1表示来自第二份数据文件。横向合并数据文件的基本操作步骤横向合并数据文件的基本操作步骤

展开阅读全文