资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,2,章 数据的基本操作,1,实验一 建立与编辑数据文件,实验目的,理解建立数据文件的原理和方法;,掌握编辑数据文件的菜单功能;,熟练应用,SPSS,软件编辑数据文件。,2,实验一 建立与编辑数据文件,准备知识,测度(,Measurement,)含义,所谓测度是指按照某种法则给现象、事物或事件分派一定的数字或符号、通过测度来刻划事物的特征或属性。一般来说,任何事物或事件都具有直接的或者潜在的可测性,但是可测的程度或者水平是不同的。统计学中,通常将测度分为:,Scale,(定比测度,或比率测度)、,Ordinal,(定序测度、或顺序测度)、,Nominal,(定类测度,或名义测度)。这,3,种测度水平以,Scale,测度的测度水平最高,,Ordinal,测度次之,,Nominal,测度的测度水平最低。,3,实验一 建立与编辑数据文件,准备知识,测度选择的原则,(,1,)取值于一个区间,或者取值为比率的连续型变量应设置为,Scale,测度,如职工收入、身高、体重、价格等。,(,2,)无论数值型变量还是字符型变量,只要资料具有某种内在的顺序分类,如可明显地区分为大、中、小;高、中、低等,则应设置为,Ordinal,测度。,(,3,)如果资料不具有某种内在顺序分类的字符型变量,如公司的部门、地理区域划分等,可以设置为,Nominal,测度。,4,实验一 建立与编辑数据文件,实验步骤,准备工作,在,SPSS l7.0,中单击,“,文件,”,菜单下的,“,新建,-,文件,”,命令,同样,如果在,“,文件,”,菜单下的,“,新建,-,文件,”,选项中,选择,“,语法,”,、,“,输出,”,、,“,脚本,”,,则可分别打开对应窗口,进而分别建立新的,.sps,、,.spo,、,.rtf,、,.sbs,文件。,5,(1),“,文件,”,菜单下的,“,新建,”,选项,6,(,2,)打开,SPSS,左下方的,“,变量视图,”,7,“,变量类型,”,对话框,8,“,值标签,”,对话框,9,“,缺失值,(Missing),”,对话框,10,“,对齐,(Align),”,选项,11,“,度量标准,(Measure),”,选项,12,定义了变量的各种属性后,如图所示,13,单击,“,Date View,”,按钮,回到数据视图中,就可以直接在表中输入数据,如图所示。,14,排序,(,1,)准备工作。在,SPSS l7.0,中打开数据文件,2-1,sav,,执行,“,文件,打开,”,命令将数据调入,SPSSl7.0,的工作文件窗口。,(,2,)选择,“,数据,排序个案,”,命令,打开,“,排序个案,(Sort Cases),”,对话框,如图,2-1-10,所示。,15,(,3,)选择排序变量。从源变量列表中选择一个或几个分类变量,单击中间的箭头按钮将它们移入排序依据框中。本例排序变量为,“,性别,”,和,“,年收入,”,。,(,4,)确定排序顺序。在,“,排列顺序,”,栏中选择一种排序方式。本例选择升序排列,如图所示。,16,排列顺序选项,升序(,Ascending,):排序顺序值由小到大升序排列;,降序(,Descending,):排序顺序值由大到小降序排列。,17,(,5,)单击,“,确定,”,按钮,返回数据窗口,分类排序结果显示数据窗口内,实验结果如图,18,选择个案,(,1,)准备工作。在,SPSS l7.0,中打开数据文件,2-1,sav,,执行,“,文件,打开,”,命令将数据调入,SPSSl7.0,的工作文件窗口。,(,2,)依次选择,“,数据,选择个案,”,命令,打开,“,选择个案,(Select Cases),”,对话框,如图所示。,19,本例在表达式栏里输入选择个案的条件表达式,如输入表达式,“,绩效评分,=80&,绩效评分,=90,”,,即选择,“,绩效评分大于等于,80,且绩效评分小于等于,90,分的个案,”,。单击,“,继续,”,按钮返回主对话框,单击,“,确定,”,执行选择个案,如图所示。,20,选择个案,随机样本,”,大约选项,21,选择个案:范围,”,选项,22,选择个案:范围,”,选项,23,合并数据文件,(,1,)准备工作。在,SPSS l7.0,中打开数据文件,2-1.Sav,和件,2-2.Sav,,执行,“,文件,打开,”,命令将数调入,SPSSl7.0,的工作文件窗口,24,(,2,)执行,“,数据,(Data),合并文件(,Merge Files,),添加个案,(Add Cases),”,命令,打开将,“,个案添加到,”,对话框,如图所示。,25,(,3,)选择添加个案的合并方式,,SPSS,提供了两种方式:,打开的数据文件,:直接从打开的数据文件合并。本例选择直接从打开的数据文件合并。,外部,SPSS Statistics,数据文件,:选中,“,外部,SPSS,数据文件,”,后,单击,“,浏览,”,按钮,,SPSS,将弹出,“,添加个案:读取数据文件,”,对话框。,26,(,4,)选定需要合并的数据文件,单击,“,继续,”,按钮,,SPSS,将弹出,“,添加个案从,”,对话框,如图所示。,27,(,5,)非成对变量配对。选中非成对变量框中欲配对的变量名,单击,“,”,按钮进入,“,新的获得数据集中的变量,”,对话框中,表示题目具有相同的数据含义。用户也可以选择某个变量名,单击,“,更名,”,按钮修改变量名称后,再进行指定配对。本例中,“,员工序号,”,变量与,“,ID,”,变量进行配对,如图所示。,28,(,6,)单击,“,确定,”,按钮,即可实现,“,添加个案,”,的数据文件。实验结果如图所示。,29,横向合并的操作步骤,(,1,)准备工作。在,SPSS l7.0,中打开数据文件,2-1.Sav,和数据文件,2-2.Sav,,执行,“,文件,打开,”,命令将数调入,SPSSl7.0,的工作文件窗口,并按照,“,年收入,”,升序排列,数据文件另存为,2-11.Sav,和,2-21.Sav,。,30,(,2,)选择,“,数据,(Data),”,菜单下的,“,合并文件,(Merge Files),”,命令,单击,“,添加变量,(Add Variables),”,按钮,打开,“,将变量添加到,(Add Variables to),”,对话框,如图所示。,31,(,3,)选择横向合并数据文件的方式。同样地,,SPSS,提供了两种方式供用户选择。,一种是直接从已打开的数据文件中合并,这样就无须将欲合并的数据文件的数据编辑窗口关闭。用户选中,“,打开的数据集,(An open dataset),”,单选框,然后在下方的窗口中单击已打开数据文件的文件名即可。,另一种是从外部的,SPSS,数据文件中合并,即选中,“,外部,SPSS Statistics,数据文件,(An external SPSS data file),”,后,单击,“,浏览,(Browse),”,按钮,,SPSS,将弹出,“,添加变量:读取文件,(Add Variables,:,Read File),”,对话框。,“,添加变量:读取文件,(Add Variables,:,Read File),”,对话框与打开数据文件的对话框相同。用户选中需要合并的数据文件,并单击,“,打开,”,按钮,即可返回,“,将变量添加到,(Add Variables to),”,对话框中。,32,(4),选定需要合并的数据文件后,单击,“,继续,”,按钮,,SPSS,将弹出,“,添加变量从,(,Variables from),”,对话框,如图所示。,33,数据分类汇总,数据分类汇总是按照用户指定的分类变量对个案进行分组,并对每组个案的各变量值计算指定的描述统计量,(,如求和、平均值等,),。通过分类汇总,用户可以针对不同的组别了解每组的大致情况,并可以做出比较。,34,(,1,)准备工作。在,SPSS l7.0,中打开数据文件,2-1.Sav,,执行,“,文件,打开,”,命令将数调入,SPSSl7.0,的工作文件窗口。,35,(,2,)执行,“,数据,(Data),分类汇总(,Aggregate,),”,命令,打开将,“,汇总数据(,Aggregate data,),”,对话框,如图所示。,36,(,3,)选择,“,分组变量,”,与,“,变量摘要,”,。本例中将,“,工作性质,”,移入分组变量,,“,年收入,”,移入变量摘要。,如果要改变系统默认的变量名,可以单击,“,名称,”,按钮,如图,2-1-26,所示。用户可以在对话框内输入汇总变量的名称和标签,定义完毕后,单击,“,继续,”,按钮,即可返回,“,汇总数据,”,对话框。,37,(,4,)选择函数。函数,(Function),用于定义汇总函数,计算指定的描述统计量。单击,“,函数,(Function),”,按钮,弹出汇总数据:汇总函数,(Aggregate Data,:,Aggregate Function),”,对话框,如图所示。,SPSS,提供了三组函数,但每个汇总变量只能选择一个描述统计量进行汇总。,38,(,5,)选择保存分类汇总的方式。分类汇总的结果既可以存入新数据文件,也可以替换当前数据文件。,“,汇总数据,”,对话框提供三种保存分类汇总结果方式。,保存,将汇总变量添加到活动数据集,(Add aggregated variables to active dataset),:,SPSS,将自动定义一个新变量,用以储存分类汇总的结果,新变量将自动添加到当前数据文件中;,创建只包含汇总变量的新数据集,(Create a new dataset comaining only the aggregated variables),:选中该选项,可以单击,“,文件,(File),”,按钮,指定汇总文件的保存路径和文件名,,SPSS,将创建只包含汇总结果的新数据文件;,写入只包含汇总变量的新数据文件,(Write a new data file containing only the aggregated variables),:选中该选项,分类汇总的结果将覆盖当前数据编辑窗口中的数据,原数据将丢失。,39,适用于大型数据集选项,文件已经按分组变量排序,(File is already sorted on break variable(s),一般情况下,特别是个案个数较多的数据文件,在进行分类汇总前,用户需要将个案数据根据中断变量,(,即分组变量,),进行排序:否则,分类汇总无法进行。如果用户已经手动完成排序,即可选择该选项,,SPSS,将忽略排序的步骤,自动开始分类汇总。,在汇总之前排序文件,(Sort file before aggregating),如果用户选择,“,分类汇总,”,前,并未对数据文件中的数据按照中断变量进行排序,也没有关系。,SPSS,提供了汇总之前先对文件进行排序的功能。选择该选项,,SPSS,将先对数据进行排序,然后再进行分类汇总。,40,(,6,)选择完毕后,单击,“,确定,”,按钮,即可实现分类汇总。实验结果如图所示。,41,实验一 建立与编辑数据文件,实验总结,本部分,“,建立与编辑数据文件,”,的实验,主要是,SPSS,软件中的,“,文件,”,与,“,数据,”,菜单部分功能的操作与应用,例如:建立数据文件、变量排序、选择个案、合并数据文件和数据分类汇总。因此,需要理解数字型变量与字符型变量的区别与应用,例如,数据分类汇总中的字符型变量只能作分类变量而不能成为汇总变量。合并数据文件中添加个案时,有时需要对变量进行配对处理等。,42,实验二 数据加工,实验目的,理解,SPSS,内部函数的原理和应用;,掌握数据转换菜单主要功能的操作与应用;,熟练应用,SPSS,软件进行数据加工。,43,实验二 数据加工,准备知识,SPSS,基本运算,SPSS,表达式,SPSS,内部函数,44,实验二 数据加工,SPSS,基本运算,算术运算符号及意义,关系运算符号及意义,逻辑运算符号及意义,+,加法,=,(,EQ,),等于,&(AND),与,-,减法,(GT),大于,|(OR),或,*,乘法,(LT),小于,(NOT),非,/,除法,=(GE),大于等于,*,乘幂,=(LE),小于等于,(),括号,=(NE),不等于,45,实验二 数据加工,SPSS,表达式,逻辑运算,逻辑值,A,1,1,0,0,B,1,0,0,0,A&B,1,0,0,0,A/B,1,1,1,0,A,0,0,1,1,46,实验二 数据加工,SPSS,内部函数,算术函数,统计函数,概率函数,47,实验:应用“计算变量”菜单,计算平均值,(,1,)准备工作。在,SPSS l7.0,中单击,“,文件,”,菜单下的,“,新建,-,文件,”,命令,,48,(,2,)执行,“,转换(,Transform,),计算变量(,Computer Variable,),”,命令,打开,“,计算变量,”,对话框,如图所示,49,(,3,)定义新变量及其类型。在,“,目标(,Target Variable,),”,栏中定义目标变量。单击,“,类型与标签(,Type&Label,)按钮,打开如图所示的类型和标签对话框。,50,“,计算变量:类型和标签,”,,提供了两种定义新变量标签的方法。,标签(,L,),:在框中给目标变量加注标签。,将表达式用作标签(,U,),:,使用计算目标变量的表达式作为标签。,选择确定后,单击,“,继续,”,按钮,返回主对话框。,51,(,4,)输入计算表达式,使用计算器板或键盘将计算表达式输入到,“,数字表达式(,Numeric Expression,),”,栏中,表达式中需要的,SPSS,函数可从,“,函数(,Function,),”,栏中选择,通过双击鼠标左键或单击该栏上方的箭头按钮将选中者移入表达式栏。,本例将,“,生产总值,/,从业人数,”,输入到,“,数字表达式,”,。实验结果如图所示。,52,(,5,)条件表达式(,if,)及其对话框的使用。在,“,计算变量,(Compute Variable),”,对话框的左下方还有一个,“,如果,(1f),”,按钮,单击该按钮,,SPSS,将弹出,“,计算变量:,If,个案,(Compute Variable,:,If Cases),”,对话框。在该对话框中,用户可以设定个案的条件,只有一部分满足某种条件的个案才能进行运算,而不满足条件的个案,其新变量值将显示为缺失。,53,实验结果:,“,从业人数,=3000,”,的人均生产总值,54,实验,2.2,环比发展速度、环比增长速度,应用,“,计算变量,“,菜单功能,计算,“,生产总值,”,的环比发展速度和环比增长速度。,(,1,)准备工作。在,SPSS l7.0,中单击,“,文件,”,菜单下的,“,打开,-,数据,”,命令,如图,2-2-1,所示。,(,2,)执行,“,转换(,Transform,),计算变量(,Computer Variable,),”,命令,打开,“,计算变量,”,对话框。,“,目标变量,”,栏中定义,“,cir_,生产总值,”,;,55,实验,2.2,环比发展速度、环比增长速度,(,3,)计算变量的速度指标。,统计学中定义的现象发展速度有环比发展速度和定基发展速度,如果,Xi(i=0,1,2,n),,代表某指标在第,i,期的发展水平,即第,i,期的变量值,那么各环比发展速度和定基发展速度的计算公式分别为:,第,i,期环比发展速度,=,,,i=0,1,2,;第,i,期定基发展速度,=,,,i=0,1,2,;,此外,第,i,期环比(定基)增长速度,=,第,i,期环比(定基)发展速度,-1,。,根据这些公式,在,SPSS,中可以按以下方法计算发展速度及增长速度。,56,(,4,)单击,“,确定,”,按钮,即可生成新变量。实验结果如图所示。,57,实验,2.3,变量重新编码,(,1,)准备工作。在,SPSS l7.0,中单击,“,文件,”,菜单下的,“,打开,-,数据,”,命令,,(,2,)执行,“,转换(,Transform,),重新编码为相同变量(,Recode into Same Variables,),”,命令,另一个是重新编码为不同变量(,Recode into Different Variables,)命令。选择其中任意一个,打开,“,重新编码,”,对话框。,58,“重新编码为其他变量”对话框,59,“重新编码为其他变量”对话框,60,实验,2.3,变量重新编码,(,3,)输出变量确定新变量名和标签。选择源变量列表中的,“,生产总值,”,变量移入该框中,栏标题改为,“,数字变量,输出变量,”,,同时,输出栏被激活,在这里输出变量,“,生产总值分组,”,,确定新变量和标签。,(,4,)单击,“,如果,”,按钮,打开,“,如果,”,对话框,确定赋值条件。,61,(,5,)单击,“,旧值和新值(,Old and New values,)按钮,打开如图所示的新旧变量对话框。在,“,旧值,”,栏中选中一选项,将原变量的有效值或原值的范围输入被激活的矩形框,在,“,新值,”,栏中,可以对将要给新变量的新值作出如下选择:,62,实验,2.3,变量重新编码,新值,在,“,新值,”,框里键入新值,单击,“,添加:按钮到,“,旧,新,”,显示框中,框里显示出,“,原值(原值的范围),新值,”,系统缺失(,S,),:,单击,“,添加,”,按钮移入,“,旧,新,”,栏,表明原变量的旧值被定义为新变量的系统缺失值。,复制旧值(,P,),:表明在,“,旧值,”,栏中指定的原变量旧值仍作为新变量的值予以保留,而那些没有指定的值将不再包括在新变量的值之中,作为系统缺失值。,输出变量为字符串,:选择此项,无论原变量是数值型或字符型,新变量都赋予值为字符型变量,并在,“,宽度(,W,),”,框中指定新变量的宽度。,将数值字符串移动为数值,(,M,),(,5,5),:当主对话框选择要重新赋值的变量为字符型变量时,这个选项才会被激活,它可以将数值作为字符串的字符型变量转换为数值型变量。,63,(,6,)各选项确定后,单击,“,继续,”,按钮返回主对话框,单击,“,确定,”,执行原变量的重新赋值。实验结果如图所示。,64,实验,2.4,个案排秩,“,秩(,Rank,),”,是数理统计学中的一个重要概念,是非参数统计中常用的统计量。个案的秩是将个案,X1,X2,,,Xn,,按小到大的次序或者从大到小的次序排列后,第,i,个个案,Xi,排在第,Ri,位上,就称,Ri,为,Xi,在个案,X1,X2,,,Xn,中的秩。,(,1,)准备工作。在,SPSS l7.0,中单击,“,文件,”,菜单下的,“,打开,-,数据,”,命令,如图所示。,(,2,)执行,“,转换(,Transform,),个案排秩(,Rank Cases,),”,命令,打开个案排秩对话框。,65,(,3,)从源变量清单中选择一个或几个变量至,“,变量(,V,),”,框,选择,“,生产总值,”,移到,“,变量(,V,),”,栏,系统将对选中变量产生一个新的秩变量,它是在该变量的前面添加,“,r,”,而成,如图所示。,66,实验,2.4,个案排秩,(,4,)求秩顺序选择。将秩,1,指定给选项栏用于指定求秩顺序。,将秩,1,指定给,最小值:从最小值开始按升序对个案排序;,最大值:从最大值开始按降序对个案排序。,67,(,5,)秩类型选择。单击,“,秩的类型,”,按钮,打开,“,个案排秩:秩的类型,”,对话框,如图所示。,68,实验,2.4,个案排秩,秩的类型,秩(,R,):秩变量值为基本秩,系统默认选项;,Savage,得分(,S,):秩变量取值为根据指数分布得到的,Savage,得分;,分数秩(,F,):小数秩,秩变量值为秩除以非缺失的个案权重之和的商;,%,分数秩(,F,):百分秩,秩变量值为秩除以非缺失的个案权重之和的商乘以,100,后的值,个案权重之和(,C,):权重和,秩变量值为各个案权重之和。对同一分组中的所有个案,秩变量取值为一个常数;,Ntiles,:在矩形栏中里填入一个大于,1,的整数,系统将按照输入的数值对个案做百分位数分组,新变量值为百分位数分组的组序号。例如,按系统默认的数,4,作百分位分组,一组大约包含了,25%,的观测值,各组中观测值的秩分别为所在组的组序号。,69,实验,2.4,个案排秩,比例估计(,E,)、正态得分(,O,),比例估计选项栏,选择比例估计选项,并配合选择栏内的一种比例估计格式可以产生基于这些选项的相应秩。,Blom,:公式为(,r+3/8,),/(n+1/4),Rankit,:公式为,(r+1/2)/n,Tukey,:公式为,(r+1/3)/(n+1/3),Van der Waerden,:公式为,r/(n+1),以上各公式中的,n,为个案个数,,r,为各个案从,1,到,n,排序后的秩。,70,(,6,)结(,T,)处秩的确定。结(,Ties,)是指当两个或两个以上的数据相等时秩的处理方式。由于秩与数据排序是一一对应的,当数据相等时,它们对应的秩也相等。在,“,个案排秩:结点,”,对话框中,,SPSS,提供了以下四中处理相同秩的方式,,如图所示。,71,实验,2.4,个案排秩,结(,T,),均值(,M,):,“,结,”,处的秩确定为排序后结处各秩的均值,这是系统默认的,“,结,”,处的秩的处理方式;,低(,L,):将,“,结,”,处的秩确定为排序后结处各秩次序的最小值;,高(,L,):将,“,结,”,处的秩确定为排序后结处各秩次序的最大值;,顺序秩到唯一值(,S,):指各个案的秩从,1,开始连续排列到不同的个案的个数,D,,且,“,结,”,处的秩取第一个出现的秩次值。,72,(,7,)各选项确定之后,单击,“,确定,”,。系统对指定变量、分组变量按所选选项计算秩,并产生新变量保存它们。实验结果如图,所示。,73,第,2,章 数据的基本操作,实验总结,本部分,“,数据加工,”,的实验项目,主要是,SPSS,软件中的,“,转换,”,菜单部分功能的操作与应用,例如:计算变量、变量重新编码、个案排秩。因此,需要理解,SPSS,内部函数的含义,运用,“,计算变量,”,功能和调用,SPSS,内部函数计算算术函数、统计函数、概率函数值。其次,变量重新编码可以将连续型变量进行重新编码,以便变量分组或分类进行数据分析。最后,理解,“,if,”,条件式在,“,计算变量,”,和,“,变量重新编码,”,功能中的原理、操作与应用。,74,Thank You!,75,
展开阅读全文