1、第1章 SPSS软件基础操作SPSS是软件英文名称首字母缩写,全称为:Statistical Package for the Social Sciences,即“社会科学统计软件包”。它是现在世界上流行三大统计分析软件之一(SAS、SPSS及SYSTAT)。在中国,SPSS以其强大统计分析功效、方便用户操作界面、灵活表格式汇报及其精美图形展现,受到了社会各界统计分析人员喜爱。1.1 SPSS基础操作1.1.1 SPSS工作界面认识开启SPSS Statistics 19.0后,系统会自动打开数据编辑窗口(Data Editor)。图 11图 12图 13SPSSOutput(输出)窗口SPSS
2、 Viewer,通常随实施统计分析命令而打开,用于显示统计分析结果、统计汇报、统计图表等内容,许可用户对输出结果进行常规编辑整理,窗口内容能够直接保留,保留文件扩展名为“*.spv”。选择菜单栏中【File(文件)】【New(新建)】【Syntax(语法)】命令,新建一个SPSS语句文件,以下图所表示。选择菜单栏中【File(文件)】【Open(打开)】【Syntax(语法)】命令,打开一个保留语句文件。图 14选择菜单栏中【File(文件)】【New(新建)】【Script(脚本)】命令,新建一个SPSS脚本编辑窗口,以下图所表示。选择菜单栏中【File(文件)】【Open(打开)】【Scr
3、ipt(脚本)】命令,打开一个保留脚本语言文件。图 15菜单栏【File(文件)】用于文件操作,比如文件打开、新建、保留、打印、关闭等。【Edit(编辑)】提供数据管理过程中常见复制、剪切、粘贴、查找等功效。其中【Options(选项)】是一项特殊而复杂命令,它控制SPSS输出结果显示格式、操作统计等。经过合适设置,用户在使用SPSS时能够取得更高效率。【View(视图)】显示状态栏、表格线、变量值标签等,还能够自定义工具栏、字体等。在SPSS使用过程中,假如你在界面上找不到你需要菜单,不妨点击一下这个菜单,看看你需要菜单是不是没有选择显示。【Data(数据)】可插入变量或观察统计对数据排序、
4、转置、分割文件、选择观察统计等。假如你想对你数据进行添加、整理、变动,需要使用该菜单和【Transform(转换)】菜单。注意【Data(数据)】菜单中命令通常是针对整个数据文件进行操作。【Transform(转换)】假如试验或调查数据不能直接用于统计分析,则经过数据转换还能够事后补救,而且不失为一个明智措施。【Transform(转换)】集中了针对变量操作多项命令,能够经过计算、重新编码、换算为等级等方法生成新变量。其中【Compute(计算)】、【Recode(重新编码)】在数据整理过程中比较常见。【Analyze(分析)】该菜单是SPSS中最关键也最常见菜单,提供从最简单描述统计到复杂统
5、计需要多种统计分析命令。每种统计功效通常全部包含多个分析模型。【Graphs(图表)】该菜单提供多种制图工具,比如直条图、直方图、拆线图、散点图。每个已生成统计图还能够作深入编辑。【Utilities(实用程序)】该菜单显示变量信息或文件信息,能够定义变量集合,定义显示菜单项。【Window(窗口)】在使用SPSS过程中,可能会同时打开多个窗口,如数据窗口、程序窗口、结果显示窗口等。全部打开SPSS文件或窗口全部在Window菜单内显示对应文件名,能够选择目前显示哪个窗口。【Help(帮助)】该菜单显示SPSS提供多种帮助工具及版本信息,比如帮助专题、使用指南、统计教练等。在SPSS使用过程中
6、假如碰到困难,能够首先经过该菜单寻求帮助。1.1.2 常见操作新建窗口SPSS开启后,用户能够随时新建多种窗口,也能够打开多个已经存在程序语句文件或结果文件。新建多种窗口菜单以下:新建数据文件窗口【File(文件)】【New(新建)】【Data(数据)】新建程序语句窗口【File(文件)】【New(新建)】【Syntax(语法)】新建输出结果窗口【File(文件)】【New(新建)】【Output(语法)】新建脚本语言窗口【File(文件)】【New(新建)】【Script(脚本)】打开文件SPSS开启后,也能够经过它菜单打开文件:打开数据文件 【File(文件)】【Open(打开)】【Dat
7、a(数据)】打开程序语句文件【File(文件)】【Open(打开)】【Syntax(语法)】打开输出结果文件【File(文件)】【Open(打开)】【Output(语法)】打开脚本语言文件【File(文件)】【Open(打开)】【Script(脚本)】在多个窗口中切换SPSS许可用户在打开数据文件同时打开多个结果文件和程序语句文件,在不一样窗口间切换能够经过菜单操作来实现。单击任何窗口中主菜单【Window(窗口)】,全部已经打开文件名全部会显示出来,单击文件名即切换到对应窗口中。向指定结果窗口中输出新统计结果打开多个结果窗口时,SPSS不会同时向全部结果文件中输出新统计结果。默认输出窗口是最
8、新打开结果文件。假如用户期望SPSS把新统计结果输出到手术室结果文件中,则必需再单击这个文件快捷按钮,随即该按钮变灰,表示许可新统计输入。把菜单操作过程转换为程序语句SPSS 19.0 结果输出中默认为输出每一步菜单操作相对应语句。观察数据文件中全部变量信息单击主菜单【Utilities(实用程序)】,在下拉菜单中选择 【Variiables(变量)】,SPSS将弹出窗口,显示文件所含全部变量信息。改变数据窗口显示格式只需在【View(视图)】主菜单下各项内容上单击,即可显示、隐藏或配置以下设置:l 状态栏l 工具条(工具栏各项快捷按钮)l 字体(窗口内容字体、字号等)l 网格线(数据窗口是否
9、显示为网格)l 变量值标签1.1.3 SPSS数据管理数据窗口SPSS数据有固定结构,用户必需按其固定格式录入并保留:每一列数据是一个变量,比如全部受访者数量对同一个问题回复结果;每一行数据代表一次观察统计,比如一个受访者数量在试验中对全部问题回复结果。在SPSS数据窗口内,只要你输入了数据,这一列数据顶端暗色单元格将出现SPSS默认变量名VAR00001,假如你认为这个变量名对于它所反应意义过于模糊,不利于记忆或分析,你完全能够很方便地给它起一个新有意义名字。在这个变量名上双击,即可进入变量窗口。图 16变量窗口变量窗口许可用户指定每个变量各项属性,包含变量名称、变量类型、长度、小数位数、变
10、量标签、变量值标签、缺失值定义方法、列宽、对齐方法和数据测量类型等。 变量名(Name)是变量存取唯一标志。在定义SPSS数据属性时应首先给出每列变量变量名。变量命名应遵照下列基础规则: SPSS 变量长度不能超出64个字符(32个汉字); 首字母必需是字母或汉字; 变量名结尾不能是圆点、句号或下划线; 变量名必需是唯一; 变量名不区分大小写; SPSS保留字不能作为变量名,比如ALL、NE、EQ和AND等; 假如用户不指定变量名,SPSS软件会以“VAR”开头来命名变量,后面跟5个数字,如VAR00001、VAR00019等。 注意:为了方便记忆,用户所取变量名最好和其代表数据含义相对应。图
11、 17 变量类型是指每个变量取值类型。SPSS提供了三种基础数据类型:数值型、字符型和日期型。 变量格式宽度是指在数据窗口中变量列所占单元格列宽度,通常见户采取系统默认选项即可。值得注意是,假如变量宽度大于变量格式宽度,此时数据窗口中显示变量名字符数不够,变量名将被截去尾部作不完全显示。被截去部分用“*”号替换。 变量名标签(Label)是对变量名含义深入解释说明,它能够增强变量名可视性和统计分析结果可读性。用户有时在处理大规模数据时,变量数目繁多,此时对每个变量含义加以标注,有利于用户搞清每个变量代表实际含义。变量名标签可用汉字,总长度可达120个字符。同时该属性能够省略,但提议最好给出变量
12、名标签。 变量值标签(Values)是对变量可能取值含义进行深入说明。变量值标签尤其对于数值型变量表示非数值型变量时尤其有用。 图 18定义和修改变量值标签,在弹出对话框【Values(值)】文本框中输入变量值,在 【Label(标签)】文本框中输入变量值标签,然后单击【Add(添加)】按钮将对应关系选入下边白框中。同时,能够单击【Change(改变)】和【Remove(移动)】按钮对已经有标签值进行修改和剔除。最终单击【OK(确定)】按钮返回主界面。 在统计分析中,搜集到数据可能会出现这么情况:一是数据中出现显著错误和不合理情形;另一个是有些数据项数据漏填了。双击【Missing(缺失)】栏
13、,在弹出对话框中能够选择三种缺失值定义方法。图 19 【Columns(列)】栏关键用于定义列宽,单击其向上和向下箭头按钮选定列宽度。系统默认宽度等于8。 【Align(对齐)】栏关键用于定义变量对齐方法,用户能够选择Left(左对齐)、Right(右对齐)和 Center(居中对齐)。系统默认变量右对齐。 【Measure(测度)】栏关键用于定义变量测度水平,用户能够选择Scale(定距型数据)Ordinal(定序型数据)和Nominal(定类型数据。 【Role(角色)】栏关键用于定义变量在后续统计分析中功效作用,用户能够选择Input、Target和Both等类型角色。四种取得数据方法
14、在软件中直接录入数据 读入EXCEL数据文件(1) 首先查看Excel文件数据结构是否符合SPSS要求。每一列是一个变量,每一行是一个观察统计。(2) 在SPSS中打开Excel文件。【File(文件)】【Open(打开)】【Data(数据)】,在对话框下方“文件类型”中选择Excel(*.xls,*.xlsx)。目前目录下Excel文件即可显示在对话框中文件列表中。选定目标文件,单击打开按钮,即可进入下一级对话框。图 110(3) 选中复选框“从第一行数据读取变量名”;同时注意SPSS默认打开工作表是Excel文件中第一个工作表。依据需要选择数据所在工作表。图 111(4) 对话框中其它设置
15、不变,单击确定按钮即可读入数据到SPSS中。同时SPSS会开启一个结果输出窗口,显示读入Excel数据过程相关信息比如发生错误和警告等。(5) 检验SPSS数据变量和数量是否丢失。即使SPSS读入了数据,但为了确保安全,提议打开原始Excel文件和现在SPSS数据文件加以对比,关键检验变量和数据是否丢失。 读入纯文本(*.txt)数据文件SPSS提供了专门读取文本文件功效。打开软件后,现在菜单栏中【File(文件)】【Read Text Data(打开文本数据)】命令,弹出【Open Data(打开数据)】对话框。这里用户需要选择需要打开文件名称,而且单击【Open(打开)】按钮进入文本文件向
16、导窗口。图 112 读入数据库文件打开软件后,现在菜单栏中【File(文件)】【Open Database(打开数据库)】【New Query(新建查询)】命令,弹出【Database Wizard(数据库向导)】对话框。经过这个数据库向导窗口,用户能够选择需要打开文件类型,并根据窗口上提醒进行相关操作。图 113数据整理通常情况下,刚刚建立数据文件并不能立即进行统计分析,这是因为搜集到数据还是原始数据,还不能直接利用分析。此时,需要对原始数据进行深入加工、整理,使之愈加科学、系统和合理。这项工作在数据分析中称之为统计整理。 【Data(数据)】菜单中命令关键用于实现数据文件整理功效。 观察量
17、排序(1) 打开SPSS软件,选择菜单栏中【File(文件)】【Data(数据)】【Sort Cases(排序个案)】命令,弹出【Sort Cases(排序个案)】对话框。图 114(2) 在左侧候选变量列表框中选择主排序变量,单击右向箭头按钮,将其移动至【Sort by(排序依据)】列表框中。(3) 在【Sort Order(排列次序)】选项组中能够选择变量排列方案。(4) 单击【OK】按钮,此时操作结束。 数据转置(1) 打开SPSS软件,选择菜单栏中【File(文件)】 Data(数据)】【Transpose(转置)】命令,弹出【Transpose(转置)】对话框。图 115(2) 在左
18、侧候选变量列表框中选择需要进行转置变量,单击右向箭头按钮,将其移动至【Variable(s)(变量)】列表框中。(3) 从左侧候选变量列表框中能够选择一个变量,应用它值作为转置后新变量名称。此时,选择该变量进入 【Name Variable(名称变量)】列表框内即可。假如用户不选择变量命名,则系统将自动给转置后新变量给予Var001、Var002变量名。(4) 单击【OK】按钮,操作结束。注意:数据文件转置后,数据属性定义全部会丢失,所以用户要慎重选择本功效。 文件合并【data(数据)】【Merge Files(合并文件)】菜单中有两个命令选项:【Add Cases(添加个案)】和【Add
19、Variables(添加变量)】。观察量合并要求两个数据文件最少应含有一对属性相同变量,即使它们变量名不一样。具体步骤以下。(1) 选择菜单栏中【File(文件)】【Data(数据)】【Merge Files(合并文件)】【Add Cases(添加个案)】命令,弹出【Add Cases(添加个案)】对话框。图 116(2) 点选【An external SPSS Statistics data file(外部SPSS Statistics数据文件)】单选钮,同时单击【Browse(浏览)】按钮,选中需要合并文件,并指定文件路径,然后单击【Continue(继续)】按钮。(3) 选择合并方法。图
20、 117(4) 单击【OK】按钮,操作结束。变量合并要求两个数据文件必需含有一个共同关键变量(Key Variable),而且这两个文件中关键变量还含有一定数量相同观察量数值。(1) 打开变量合并对话框。(2) 选择合并文件。(3) 选择合并方法。(4) 单击【OK】按钮,操作结束。 数据分类汇总对数据进行分类汇总就是按指定分类变量值对全部观察量进行分组,对每组观察量变量求描述统计量,并生成份组数据文件。比如,将一个工厂数据资料,根据该工厂各个部门进行分组,并统计各个部门人员年纪均值、方差等,这些工作就属于数据分类汇总范围。分类变量(Break Variable):它是对样本数据进行分类变量,
21、如按性别、民族、行业性质等进行分类汇总。这种变量能够为数值型或字符型变量。汇总变量(Aggregate Variable):利用源数据文件中变量和对应汇总函数产生新变量名称及其表示式。这种变量必需要求为数值型变量。比如,按性别统计年收入平均值,此时“性别”是汇总变量,“每人年收入”是源变量,“不一样性别年收入均值”就属于汇总变量。(1) 打开数据汇总对话框打开SPSS软件,选择菜单栏中【File(文件)】【Data(数据)】【Aggregate(分类汇总)】命令,弹出【Aggregate Data(汇总数据)】对话框。图 118(2) 选择分类变量在左侧候选变量列表框中选择一个或多个变量作为分
22、类变量,将其移入【Break Variable(s)(分组变量)】列表框中。(3) 选择汇总变量在左侧候选变量列表框中选择一个或多个变量作为汇总变量,将其移入【Summaries of Variable(s)(变量摘要)】列表框中。(4) 选择汇总函数在【Summaries of Variable(s)(变量摘要)】列表框中能够选择对应汇总变量,此时能够单击下方【Function(函数)】按钮,打开以下图所表示对话框。图 119(5) 添加变量标签在【Summaries of Variable(s)(变量摘要)】列表框中能够选择对应汇总变量,此时能够单击下方【Name and Label(变量
23、名和标签)】按钮,弹出对话框,设置变量标签。图 120(6) 选择汇总结果保留方法在【save(保留)】选项组中能够选择汇总结果保留方法。(7) 大规模数据排序选择勾选【Options for Very Large Datasets(适适用于大型数据集选项)】复选框,能够对含有大规模数据数据文件进行汇总而言之前排序工作,这么能使得后续操作更有效率。(8) 完成上述操作后,单击【OK(确定)】按钮,操作结束。 数据文件拆分(1) 打开SPSS软件,选择菜单栏中【File(文件)】【Data(数据)】【Split File(拆分文件)】命令,弹出【Split File(拆分文件)】对话框。图 12
24、1(2) 选择数据拆分方法。(3) 选择拆分变量 。(4) 单击【OK(确定)】按钮,操作结束。注意:拆分后文件在保留以后,下次调用该文件时,拆分结果仍然有效。当不需要分组时,能够按上述操作,点选【Analyze all cases,do not create groups(分析全部个案,不创建组)】单选钮。 选择数据(1) 打开SPSS软件,在菜单栏中选择【File(文件)】【Data(数据)】【Select Cases(选择个案)】命令,弹出【Select Cases(选择个案)】对话框。(2) 在【Select Cases(选择个案)】对话框【Output(输出) 】选项组中能够选择变量
25、输出方法。(3) 单击【OK(确定)】按钮,操作结束。图 122 数据加权权重是数据分析中一个关键概念,它是一个相正确概念。权重大小描述了该指标在整体评价中相对关键程度。在数据处理中,常需要对数据进行加权处理。在统计有大量数据文件中,可能同一观察量值会反复出现,如性别、民族等。假如在建立数据文件时能定义一个频数变量,也称为权重变量,用它来代表相同观察量出现次数,这么后续统计分析工作就会极大简化。打开SPSS软件,选择菜单栏中【File(文件)】【Data(数据)】【Weight cases(加权个案)】命令,弹出【Weight cases(加权个案)】对话框。图 123数据转换在数据分析中,常
26、常要依据部分已知数据变量计算新变量。比如,依据历年产量数据资料计算产量发展速度,依据人口数据计算人口出生率、死亡率等。不仅如此,还需要进行不一样类型变量之间转换,如将数值型变量转化为字符型变量。这些工作全部需要利用【Transform(转换)】菜单中相关命令。 经过数据计算生成新变量变量计算是数据分析中关键内容之一。有些时候,搜集到原始数据并不能直接提供给我们很多有用信息,此时,我们需要将原始数据进行计算变换,生成有用新变量。比如,依据职员基础工资、各类保险、公积金等,计算职员实际月收入;依据购房用户贷款总额和按揭方案评价用户潜在风险等。(1) 打开SPSS软件,选择菜单栏中【File(文件)
27、】【Transform转换】【Compute(计算)】命令,弹出 【Compute(计算)】对话框。图 124(2) 在【Target Variable(目标变量)】文本框中用户需要定义目标函数名,它能够是一个新变量名,也能够是已经定义变量名。单击下方【Type&Label(类型和标签)】按钮,弹出类型和标签对话框。(3) 能够使用计算器板或键盘将计算表示式输入到【Numeric Expression(数值表示式)】文本中。假如用户需要调用函数,能够从右侧【Function(函数)】列表中选择,系统提供了数学函数、逻辑函数、日期函数等。(4) 条件样本选择图 125(5) 单击【OK(确定)】
28、按钮,此时操作结束。 对已经有变量值重新编码SPSS【Transform(转换)】菜单中有【Recode into Same Variable(重新编码为相同变量)】和【Recode into Different Variable(重新编码为不一样变量)】两个命令能够实现重新赋值功效,它们分别表示重新赋值到同一变量或不一样变量。 下面以【Recode into Different Variable(重新编码为不一样变量)】命令为例说明重新赋值功效。(1) 选择菜单栏中【File(文件)】【Transform(转换)】【Recode into Different Variable(重新编码为不一
29、样变量)】命令,弹出以下图所表示对话框。图 126(2) 在候选变量列表框中选择要重新赋值变量,将其移入【Input Variable-Output Variable(输入变量-输出变量)】列表框中,同时在【Output Variable(输出变量)】选项组中填写输出变量名称【Name(名称)】及标签【Label(标签)】,单击【Change(更改)】按钮进行赋值转换。 (3) 【Old and New Value(旧值和新值)】按钮被激活,单击此按钮,弹出以下图所表示对话框。(4) 假如用户不是对全部候选变量进行赋值,而是选择其中符合一些条件变量值进行赋值操作,此时需要单击【If(假如)】按
30、钮进行操作。根据具体要求指定观察量选择条件进行操作。(5) 最终单击【OK(确定)】按钮,此时操作结束。 计算指定变量值出现次数,并保留为新变量数据分析中,常常需要计算部分变量在同一个观察量中满足要求特定变量值出现次数。比如在进行产品市场调查时,要了解在全部调查用户中有多少人使用过该产品,这就能够采取变量值计数功效来实现。(1) 打开SPSS软件,选择菜单栏中【File(文件)】【Transform(转换)】【Count Values within Cases(对个案内值计数)】命令,弹出【Count Occurrences of Values within Cases(计算个案内值出现次数)
31、】对话框。图 127(2) 在【Target Variable(目标变量)】文本框中输入需要计数变量名称,同时在【Target Label(目标标签)】文本框中填写计数变量标签,便于注释说明。(3) 在左侧候选变量列表框中选择计数变量,将其移入右侧【Variables(变量)】列表框中。需要注意,凡移入该列表框变量必需含有相同类型,当移入变量为数值型变量时,该栏标题改为“数值型变量”;当移入变量为字符型变量时,标题改为“字符串变量”。(4) 进行上述操作后,【Define Values(定义值)】按钮被激活,单击此按钮,弹出以下图所表示对话框。(5) 假如用户不是对全部候选变量进行计数,而是选择其中符合一些条件变量值才进行计数操作,此时需要单击【If(假如)】按钮,根据具体要求指定观察量选择条件进行操作。(6) 最终单击【OK(确定)】按钮,此时操作结束。