1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,SPSS,数据分析 教程,作者:李洪成 姜宏华,1,第,2,章 数据文件的 建立和管理,2,目录,2.1,数据管理的特点,2.2,SPSS,数据编辑器简介,2.2.1,开始,SPSS,2.2.2,SPSS,的数据编辑器界面,2.3,新建数据文件、数据字典,2.4,保存文件,2.5,读入数据,2.5.1,读入,Excel,数据,2.5.2,读入文本数据,2.5.3,读入数据库数据,2.6,数据文件的合并,2.6.1,添加个案,2.6.2,添加变量,2.7,数据文件的拆分,3,本章学习目标,理解信息、数据与数据
2、处理的基本概念;,了解,SPSS,数据编辑器的特点,熟悉,SPSS,的变量视图和数据视图,掌握,SPSS,常用的工具按钮;,掌握数据录入,SPSS,软件的方法;,掌握把电子表格、数据库、文本文件等格式的数据文件读入,SPSS,软件的方法;,掌握,SPSS,数据集的数据字典;,学习合并两个数据文件的方法;,明确分割,SPSS,数据文件的方法。,4,2.1 SPSS,数据管理的特点,SPSS,数据管理器与,Excel,电子表格十分相似,所见即所得。,SPSS,数据文件的默认格式为*,.sav,。,SPSS 16,以及更高版本输出的结果文件的默认格式为*,.spv,。,SPSS,统计分析的结果可以用
3、文件的形式保存下来。,5,SPSS,的数据形式,SPSS,数据编辑器的每一行数据称为一个个案(,Case,),对应一个对象的记录。,每一列数据代表个体的属性,即变量(,Variable,),6,SPSS,数据文件是一种有结构的数据文件,:,年级 性别问题,1,问题,n,1,1,.,4,2,2,2,.,3,1,1,文件结构,数据,个案,case,变量名,2.2 SPSS,数据编辑器简介,7,7,数据编辑器(,1,),-,数据视图,8,数据编辑器,用户可以直接在数据视图中对数据进行修改。,可以直接在数据视图中进行复制、粘贴,也可以直接修改某个个案的属性值,删除某一行或者某一列,添加一列(插入变量)
4、,添加一行(插入个案);,可以进行查找、(批量)查找替换等,。,9,数据编辑器(,2,),-,变量视图,10,SPSS,常用工具按钮,11,2.3,新建数据文件,刚刚完成一项调查或者试验,可以把数据直接输入到,SPSS,软件中,建立,SPSS,数据文件。,把数据输入,SPSS,以前,先定义数据文件的结构。,12,数据的定义,数据文件的建立,13,13,数据的输入操作(,1,),对,12,个参加减肥活动的人做了一项调查。每个被调查者有一个,ID,,然后调查他们的身高、参加活动以前的体重、参加活动以后的体重、性别、政治派别以及,8,个有关性格的问题。我们把这些收集到的调查问卷结果输入,SPSS,中
5、。,14,数据的输入操作(,2,),ID,号,(id),性别,(sex),:,1,:男;,2,:女,1,2,1,2,2,1,2,1,1,1,2,2,身高,(height),76,,,59,,,67,,,65,,,63,,,72,,,70,,,68,,,69,,,74,,,68,,,63,参加活动以前的体重,(before),185 113 145 156 109 191 155 165 175 180 135 118,参加活动以后的体重,(after),176 90 140 135 100 184 130 158 165 172 120 102,15,数据的输入操作(,3,),政治派别,(pa
6、rty),2 1 1 1 1 2 2 2 1 1 2 2,8,个有关性格的问题,(,分别记为,e1,到,e8),16,输入数据时候应该注意问题,字符型数据,在,SPSS,中,字符型数据值是区分大小写的,小写的,m,和大写的,M,是不一样的。,字符型数据也可以设置值标签。例如,,“,sex,”,变量的两个取值为,M,,,F,,他们的值标签分别为,Female,Male,。,如果值标签为英语,可以单击,“,拼写,”,进行拼写检查,以检查值标签的英文拼写。,缺失值处理,如果有数据缺失,,SPSS,对于字符型数据和数值型数据有不同的处理方式。,对于数值型数据,缺失值默认为,“,.,”,;对于字符串型数
7、据,系统默认值为空。,17,2.4,保 存 文 件,在数据输入过程中,要经常注意保存数据,而不要等到所有数据输入完成之后再进行保存。这样可以避免例如计算机故障或者突然断电造成的不必要的的数据丢失。,SPSS,可以对变量有选择地进行保存。可以选择你需要的变量进行保存。,可以选择不同的格式对,SPSS,数据文件进行保存,18,设置文件保存的路径,19,2.5 SPSS,读入数据,20,SPSS,支持的数据文件格式,SPSS,固有的数据文件格式,.sav,便携式文件*,.por,*.sys,SAS,格式文件,Excel,文件,文本文件(有分隔符的文件或者固定宽度的文件),数据库文件(,Acess,,
8、,Oracle,,,MySql,,,Sql Server,等),21,读入,Excel,类型的数据(,1,),选择,【,文件,】【,打开,】【,数据,】,,文件类型选择,Excel,打开数据文件:,Chapter 2 GSS04S.xls,22,读入,Excel,数据:注意问题,从第一行数据读入变量名?,在,SPSS,读入,Excel,文件时,必须先关闭要读入的,Excel,数据文件。,建议在读入,Excel,文件以前,先仔细检查,Excel,文件中的数据,确保格式正确,并删除和数据无关的部分以及空行和空列,然后再运行,SPSS,读入该文件,。,23,读入文本数据(,1,),【,文件,】【,打
9、开,】,,文件类型选择,“,文本文件(*,.txt,,*,.dat,),”,选择,“,Chapter 2 GSS04S.txt,”,24,读入文本数据(,2,):注意问题,一定要正确设定变量间的分隔符才能够保证导入数据的正确性。,在点击,【,下一步,】,之前,要仔细检查数据预览部分,如发现不正确的部分需要找到出错的原因,及并时返回相应的步骤进行修改。,25,读入数据库数据,首先需要建立,ODBC,数据源,读入,Access,数据库文件,Chapter 2 GSS04.mdb,26,建立,ODBC,数据源,(1),在,Windows XP,中,选择,“,开始,”,菜单,“,设置(,S,),”,“
10、,控制面板(,C,),”,“,管理工具,”,“,数据源(,ODBC,),”,,建立,ODBC,数据源,27,建立,ODBC,数据源,(2),28,建立,ODBC,数据源,(3):,输入数据源名称,29,2.6,数据文件的合并(,1,),有时候,要把多个数据文件合并为一个数据文件。如下面两个例子所示:,一个公司在全国各地有,30,多个分公司,每个月公司总部需要把各分公司的销售人员的销售情况合并到一个数据文件中。,一个学校教务部门每一个学期对学生的成绩建立一个数据文件,在最后学生毕业前,需要把学生四个学年的成绩(,8,个数据文件)进行汇总。,30,数据文件的合并,(2),上述第二个例子中的合并,8
11、,个成绩文件和第一个例子中的合并,30,个子公司的销售情况是不同的。,第一个例子是合并行;第二个例子是合并列。,SPSS,中分别通过添加记录和添加变量来进行。,31,数据文件的合并,(3),针对以上两种不同的情况,合并数据文件分为添加变量(或称为合并变量)和添加个案(或称为合并记录、合并个案)。在,SPSS,中的操作方式分别为添加个案和添加变量两种。,32,2.6.1,添加个案(,1,),33,添加个案示例(,1,),打开两个数据文件,Sales1.sav,和,Sales2.sav,,选择,Sales1.sav,为当前工作数据文件。,选择,【,数据,】【,合并文件,】【,添加个案,】,34,添
12、加个案示例(,2,),SPSS,用,“,(*),”,表示变量来自于当前活动数据文件中的变量,而用,“,(+),”,表示将要和当前数据文件进行合并的数据文件中的变量。,35,添加个案示例(,3,),如果有,3,个或者以上的数据文件需要合并,可以先合并两个,依次进行。这样很繁琐。,可以通过编程来实现一次合并,3,个或者以上的数据文件(至多一次合并,50,个文件)。,36,2.6.2,添加变量(,1,),如果有两个数据文件,它们含有相同的个案,但是不同文件含有的属性不同(即不同的变量),现在需要把这两个文件合并为一个文件。合并这样的数据文件就是添加变量。,如果需要合并的数据文件中都含有同一个变量,该
13、变量用于标识这些数据文件中的个案,并且可以按照该变量来匹配数据文件中的记录,该变量称为关键变量。,37,合并变量分类(,1,),一对一合并,对于两个数据文件,如果进行一对一合并,一个文件中的每个个案只能根据关键变量匹配另一个文件中唯一的个案。反之亦然。,如果一个文件中的某个个案在另一个文件中找不到个案来匹配,则该个案于第二个文件的变量上的取值为缺失值。反之亦然。,如果一个文件中的某个个案在另一个文件中找到两个或者两个以上的个案来匹配,则该个案只取第二个文件中第一个相匹配的个案来连接。反之亦然。,38,合并变量示意图:一对一,39,合并变量分类(,2,),有两个数据文件,一个是国家文件,它含有,
14、3,个变量:国家、地区和变量,1,;另一个数据文件是地区数据,该文件含有两个变量:地区和变量,2,。,国家数据文件中的前,3,个国家的地区变量值都是,1,,因此合并后的数据文件中前,3,个个案都和地区数据文件的第,1,个个案相匹配。,40,合并变量示意图:一对多,41,课堂示例,打开,SPSS,的两个数据文件:,CustomerSurveyA.sav,和,Customer Revenue.sav,。,把,CustomerSurveyA.sav,作为当前工作文件,它记录了对某软件产品,A,进行的客户满意度调查数据。,CustomerRevenue.sav,是基于该产品的历史销售情况,按照工作单位
15、性质和使用,A,产品的时间分类客户统计的年收入。,分析的目的是比较不同收益类型客户的概要特征。,42,先按照关键变量,“,orgntype,”,(客户工作单位的类型)进行合并文件。选择,【,数据,】【,排序个案,】,,首先按照关键变量,“,orgntype,”,排序。,然后选择,【,数据,】【,合并文件,】【,添加变量,】,进行合并。,43,2.7,数据的拆分,在实际数据分析中,有时候需要按照不同的类别或者组来进行分析。这就需要先把数据文件中不同的组分离出来。,用,【,数据,】【,选择个案,】,来分别选出各个组。,用,【,数据,】【,拆分文件,】,方式。,在,SPSS,菜单,【,转换,】【,计算变量,】,的,“,如果,”,部分进行选择,44,练习题,数据文件,Chapter 2 GSS04Intro.sav,为例,变量,“,martial,”,记录了婚姻状况,现在需要对不同婚姻状况的人进行比较分析。,45,集体项目,46,