spss概述及基本知识.ppt_咨信网zixin.com.cn

资源描述

Spss概述1统计软件概述从20世纪60年代开始，统计软件（statistical software）在数量和质量上均有了很大的发展。纵观统计软件的发展历程，开发较早、应用范围较广并一直在不断改进完善并日臻成熟的大型商业统计软件，当属美国SAS研究公司研制的SAS(statistical analysis system)，美国加利福尼亚大学研制的BMDP(biomedical computer programs),和美国SPSS研究公司研制的SPSS。2统计软件概述这三种软件，由于开发时间长，经历了众多用户在不同机型上的考验，用户与开发商以及用户与用户之间均建立了广泛的交流，开发上投入了大量的人力、物力专门进行维护和更新，因此功能越来越强，使用越来越方便，性能更趋于完善。美国还有SYSTAT、STATA等软件，中国和其他国家也有许多统计软件面世，原上海医科大、华西医科大、第四军医大都编制过一些面向基层人员、操作灵活、简便、实用的统计软件。3SPSS介绍 SPSS公司总部位于美国芝加哥，创立于1975年，一直以经营统计软件产品开发为主业。1994年-1998年，SPSS公司得到了很大的发展，陆续购并了systat公司、BMDP软件公司、Quantum公司、ISL公司等，并将各公司的主打产品收纳SPSS旗下，从而使SPSS公司由原来的单一统计产品开发销售转向为企业、教育科研及政府机构提供全面信息统计决策支持服务，成为最新的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。4SPSS软件是SPSS公司赖以起家的产品，目前也仍然是该公司的主打产品之一，是国际上最流行并具有权威性的统计分析软件之一，软件由fortran语言写成，升级速度很快。目前的最新版本为18.0。5SPSS的英文名称原为Statistical Package for Social Sciences,意为社会科学统计软件包。后来，随着SPSS产品服务领域的扩大和服务深度的增加，2002年英文全称更改为Statistical Product and Service Solutions，意为统计产品与服务解决方案。6在近30年的发展中，虽然竞争对手不断出现，但SPSS却始终以其鲜明的特色鼎立于统计学软件之中，现在和SAS被并称为当今最权威的两大统计软件。学习重点：根据统计结果作出解释和统计结论7 一、SPSS软件的基本特点 1、功能强大2、兼容性好3、易用性强8功能强大囊括了各种成熟的统计方法与模型，为统计分析用户提供了全方位的统计学算法，为各种研究提供了相应的统计学方法。自由灵活的表格功能，使得制表变得更加简单和直接提供了各种常用的统计学图形，如线图、条图、饼图、直方图、散点图等多种图形，并且可以将表格图形直接拷贝到word文档、幻灯片中，直接进行结果的展现。9兼容性好在数据方面，不仅可以在spss中作数据录入工作，还可将日常工作中常用的excel表格数据、文本格式数据导入spss中进行分析，不仅节省了相当大的工作量，并且避免了因拷贝粘贴可能引起的错误。在结果方面，spss的表格、图形结果可直接导出为word、文本、网页、excel格式等，也可以将表格、交互式图形作为对象选择型粘贴到word、powerpoint等中，并在其中再利用spss对他们进行编辑。10易用性强 Spss之所以有广大的用户群，不仅因为它是权威的统计学工具，提供了强大的统计功能，也因为它是一种非常简单易用的软件。界面友好，操作简单。另外，spss也向一些高级用户提供了编程功能，使分析工作变得更加节省时间和精力。11第二节视窗界面一、软件的启动与退出启动：（1）在Windows开始菜单中选择开始程序SPSS for WindowsSPSS for Windows，如图1.1（2）在快捷工具栏单击SPSS 19.0图标，1213退出：选择菜单FileExit，或者直接关闭窗口，即可！Spss运行后，可见一个运行对话框，初次进入spss系统时会出现一个导航对话框，单击右下方的cancel按钮，即可进入spss的主界面，14 SPSS运行对话框 15二、SPSS的5个窗口1、数据编辑窗口（SPSS Data Editor）：以“sav”为扩展名，是spss数据文件2、结果管理窗口（SPSS Output Viewer）：以“spo”为扩展名，是spss的结果文件3、草稿结果窗口（SPSS Draft viewer）以“rtf”为扩展名，是spss草稿文件4、语法编辑窗口（SPSS Syntax Editor）：以“sps”为扩展名，是spss语法文件5、脚本窗口（spss script editor）：以“sbs”为扩展名，是spss脚本文件常用的是数据编辑窗口和结果管理窗口。16数据编辑窗口1、数据编辑窗口（SPSS Data Editor）：此窗口类似于Excel窗口，SPSS处理数据的主要工作都在此窗口进行。它分为两个视图：(1)数据视图：如图1.3（a），显示具体的数据，一行代表一个观测个体（SPSS中称为Record），一列代表一个属性（SPSS中称为Variable）(2)变量视图：如图1.3（b）。专门显示有关变量的信息：包括变量名称，每个变量的各种属性、格式等等。17图1.3（a）数据视图18图1.3（b）变量视图1920菜单栏21打开新的数据编辑窗口，当没有输入任何数据时，所有行、列的标号都是灰色的。见图。注意，第一行第一列的单元格边框为深色，表明该数据单元格为当前单元格。222、结果管理窗口（SPSS Output Viewer）：又称结果视图，用于存放分析结果，如图。类似于windows的资源管理器，整个窗口分为两个区。左边：目录区是spss分析结果的一个目录右边：内容区。是与目录一一对应的内容2324 3、草稿管理窗口（SPSS Draft viewer）：草稿结果是结果的一种简化文本格式。实际上就是word所兼容的rtf超文本格式，因此可以在没有安装spss的电脑上使用文字编辑软件打开。25草稿管理窗口（SPSS Draft viewer）264、语法编辑窗口（SPSS Syntax Editor）：spss最大的优势在于简单易用，即菜单对话框式的操作，除此之外，spss还提供了语法方式或程序方式进行分析。这个方法既是对菜单功能的一个补充，也可以使繁琐的工作得到简化，尤其适用于高级分析人员。27语法编辑窗口（SPSS Syntax Editor）285、脚本窗口：spss脚本是用sax basic 语言写的程序，可以像spss宏一样构建和运行spss命令，而且脚本可以在命令中利用当前数据文件的变量信息，还可以对结果进行编辑或者构建一些新的自定义的对话框。脚本可用于使spss内部操作自动化，使结果格式自定义化，实现spss新功能以及将spss与VB和VBA兼容应用程序连接。2930第二章数据录入与数据获取第一节数据格式概述一、用于分析的数据资料有两种：1、原始资料。如调查问卷中的数据，录入SPSS软件，建立数据文件。2、已经被录入为其他数据格式的资料，需要将其内容直接读入SPSS中。31二、统计软件中数据的录入格式1、同一观察对象的数据应当独占一行2、同一个指标的测量数值都应当录入到同一个变量中去，即每一个测量指标或影响因素只能占据一列的位置，32数据库是一个二维表结构（行列表结构），列是变量（variable）；行为个体（case,record）；数据表中的一个格子（叫做cell，要记住）,一个格子放一个数据（可以是数值或字符）。33三、建立数据库的步骤1、定义变量（变量名、变量属性）：就是给每个指标起个名字，再对每个指标的一些统计特性作出制定。2、输入数据：即把每个被访者的各指标取值录入为电子格式。因此这里首先介绍一下变量的各种属性问题。34 进入SPSS数据编辑窗口以后，单击左下方的Variable View(变量表)，进入变量视图，我们可以看到spss会为每一个变量指定10种变量属性四、定义变量（defined variable）351、Name：变量名。在该选项下方的方格中，单击定位后，双击激活方格，进入编辑状态，输入变量名，10.0版本最大可输入8个英文字符，4个中文字符。系统默认值为VAR000011、Name：变量名36如果不对变量进行定义直接输入的话，就会出现这样的情况：37从Spss12.0开始，变量名在8个字符之内的这个限制已经被取消了，最多可以有64个字符。但出于兼容性的考虑，变量名的定义还有一些限制，即1、不能以数字开头；2、中间不能有空格；3、一个数据文件中不能有相同的变量名等。当然，我们只要在使用中尝试即可，不必记那么多规则。382、Type：变量类型 SPSS中，变量有三种基本的类型,分别是：数值型、字符型和日期型。根据不同的显示方式，数值型又被细分了5种，所以SPSS中的变量类型共有8种。系统默认值为数值型（Numeric）。39单击Type单元格，方格的右侧会出现按钮，单击该按钮，会弹出变量类型对话框。40 在以上三大类变量类型中，数值型是spss中最常用的变量类型，因而默认为数值型。数值型的数据是由0-9的阿拉伯数字和其他特殊符号，比如美元符号，逗号或圆点（小数点）组成。如工资、年龄、成绩等变量都可以定义为数值型数据。41在选定了变量类型以后，通常在对话框右侧还有选项供选择，比如，如果选择数值型，如上图，则会出现width和decimal.Width：用于定义数值位数。系统默认为8位，根据需要可以进行修改。注意：小数点要占1位。Decimal：用于定义小数位数。系统默认为2位，根据需要可以进行修改。（试试宽度8位改2位，小数位数2位改0位）42 日期型如下：日期型数据主要在时间序列分析中比较有用。在较为简单的分析问题中完全可以用普通数值型数据来代替。43美元数值型如下：44String：字符型数据，也比较常用。默认宽度为8个字符位，它区分大小写字母，并且不能进行数学运算。字符型数据在SPSS的数据处理过程（比如在计算生成新变量时）中是用一对引号引起来的。需要注意的是，在输入数据时不应输入引号，否则，双引号将会作为字符型数据的一部分。Characters：定义字符串长度。系统默认为8位。一个中文字符占2位。453、width：数值位数相当于type对话框中的width选项。单击选项下的方格定位后，方格右方会出现上下按钮，单击可增加或减少位数，或双击后直接在方格中填入位数。464、decimals：小数位数4、decimals：小数位数。相当于type对话框中的decimal选项，单击选项下的方格定位后，方格右方会出现按钮，单击可增加或减少位数，或双击后直接在方格中填入位数。475、labels：变量名标签5、labels：变量名标签。即变量说明，对变量名（name）的含义进行进一步解释说明，该标签会在结果中代替变量名，输出，以方便阅读，增强变量名的可视性和统计分析结果的可读性。具体操作是：单击定位后，双击激活方格，进入编辑状态，输入变量标签。4849从Spss12.0开始，变量名在8个字符之内的这个限制已经被取消了，最多可以有64个字符。但出于兼容性的考虑，变量名的定义还有一些限制，即1、不能以数字开头；2、中间不能有空格；3、一个数据文件中不能有相同的变量名等。当然，我们只要在使用中尝试即可，不必记那么多规则。506、values：数值标签6、values：数值标签，用于定义变量值，是对变量取值含义的解释说明信息。数值标签对于分类变量来说，是必不可少的，它不但使分类变量的数据录入变得更加方便，而且明确了数据的含义，也同样增强了分析结果的可读性。5152注意：第一行表示你赋予的变量值（数值），也就是编码，第二行，是标签，表达的是它代表的真实含义。5354 点击add按钮，最后单击ok按钮，数值标签就设置完成了。此时做任何分析，在结果中都有相应的标签出现。5556做任何分析，在结果中都有相应的标签出现。如果现在就想看效果，切换回data view界面，然后选择菜单view-value labels，就会看到下述结果。57操作后界面将变成下面这样58 每个变量值被变量标签所替代，在单元格中，多了一个下拉按钮，可以通过选择进行修改。597、missing：定义缺失值Missing项是一个重要的，而且容易被忽视的选项，它用于定义变量缺失值。Spss中缺失值有两大类，一类是用户自定义缺失值，一类是系统缺失值60 对于数值型的数据，系统缺失值用一个圆点“.”表示，而字符型变量默认就是空字符串。如果在问卷调查中，有些数据项漏填了，则数据录入时只能跳过，那么相应的单元格就会被系统自动当作缺失值来处理。例如：61用户自定义缺失值 62自定义缺失值：往往出现在一些设计比较严格的大型调查中，在一些题目选项处有的会给出这样的选项：不知道或拒答。相应的代码可能用9或者99来表示。那么显然，这里的99不是一个真实的答案，仅仅是缺失值代码，需要告知spss这个特定的标记数据，让他在统计分析的时候区别对待缺失值和正常的分析数据。63discrete missing values：指定离散的缺失值，最多可以定义3个值最后一行：指定缺失值所在的区间范围，并可以同时指定一个离散值。648、columns：列宽。用于调整数据表中各列的显示宽度。系统默认为8位。9、align：定义字符排列方向。分别为左对齐、右对齐、居中。系统默认为右对齐。6510、measure：数据量度选项Scale：定量变量Ordinal：有序分类变量Nominal：名义变量（分类变量）66 就数据录入这部分内容而言，变量属性的设置是最重要的一部分工作，属性的设置不仅涉及对错，还有一个设置好坏的问题，属性设置的好，会简化后边的数据分析工作，所以不可小看这部分工作。67 第二节数据的直接录入在spss中，新建一个数据文件非常容易，只要打开spss，系统就已经生成了一个空数据文件，用户只要按自己的需要：定义变量输入数据保存，即可。68练习：某医生观察了一组住院病人，完成了其中24名患者的资料收集，指标包括：观察编号，住院号（inno），入院日期（indate），年龄（age），性别（sex），身高（xl，单位：cm），体重（x2，单位：kg），血压（收缩压x3，舒张压x4，单位：mmHg），空腹血糖（x5，单位：mmol/L）和胰岛素样生长因子-1水平（igf-1，x6，单位：ng/mL），并根据临床情况将患者的病情分为五级（x0，1为正常，2为一级，3为2级，4为3级，5为4级）。原始数据见表（简单）请建立数据库！69编号编号innoinnoindateindateageagesesex xx x0 0 x1x1x2x2x3x3x4x4x5x5x6x6155155174417442 21996-10-1996-10-21 21 2323男男3 316616652.552.510810878788.98.9185.6185.63 3172172455445549 91999-3-3 1999-3-3 71.171.1女女4 415115161.561.5150150909015.815.8145.9145.97 7195195312531257 71998-1-81998-1-857.357.3女女2 2143.143.5 541.541.5152152888813.513.53 30 011811836361997-6-24 1997-6-24 65.665.6男男3 31621625252166166707017.717.79 9180.4180.4701、定义变量名：定义所有的变量名单击name选项下第一单元格，输入“编号”，再单击下面第二个定位，输入“inno”，依次输入其它变量名。最后回车或者单击任意方格，所有变量的其它选项激活，为默认设定。在绝大多数情况下，spss给出的默认数据类型和数据精度可以满足需要，如果默认值满足分析的需要，变量定义就到此结束了，否则就需要对不满足条件的选项进行进一步的设置 71722、定义Type选项前边两个都是数值型数据，默认状态即可，第三个变量“入院日期”是日期型数据，默认状态为numeric，需要更改下，更改步骤为：73设定为日期型变量后，我们发现变量表中width和decimals选项变成了灰色.74变量“性别（sex）”为字符变量，有一个中文字符。进入type，选择string，单击characters右侧编辑栏，将数字改为2，ok返回，可见变量视图中width 和decimals选项会自动显示为2和0，753、定义中width 和decimals选项根据具体情况进行更改，有两种方法：以身高（x1）为例166.0，单击变量x1的decimals选项，单击上下按钮，由于小数位数是一位，因而将2改为1，或者双击进入编辑状态，输入1。然后单击width选项，我们看身高的字符宽度是5位（小数点算一位），那么就将8改成5。单击其它任意方格或者回车，完成!单击变量x1的type选项，进入type对话框，将右侧width数值栏8改成5，decimals数值栏，2改成1，ok，返回注意：先改小数位数，再改宽度，避免矛盾，如将宽度改为2，此时小数位数默认为2，就会提示出现错误。可以试验一下，请大家完成764、定义label选项和values选项这两个选项分别为变量标签和数值标签。理论上，所有变量均可以定义变量标签。数值标签只用于分类变量的说明（1）单击变量x0的label选项，输入“病情分级”，回车确认变量标签完成（2）单击变量x0的values选项方格，单击省略号按钮77785、定义missing选项第三条的最后一个单元格，数值为0 方法:单击x6的missing那个选项，单击省略号按钮，进入缺失值定义对话框，选定discrete missing values选项，单击下方的数值栏，输入0，ok即可。设定后，数值0缺失。79806、定义columns，align选项：为数据窗口的显示格式，可取默认设定。7、定义measure选项：数据量度选项Type为numeric时，默认为scaleType为string时，默认为nominal.本例，原始数据中，病情分级为有序分类变量，应选择ordinal。8182二、输入数据完成变量定义后，单击左下方data view 标签，激活数据窗口。输入数据，回车，如果想查看变量标签，将鼠标箭头指向某变量名，就会出现所定义的变量标签。83注意：输入数据时，回车之前，数据单元格内左对齐显示，表示该单元格为第一次录入数据，同时数据栏内同步显示出输入的数值。84如果想在一个界面中显示更多数据列，可调整列宽，方法：1、直接缩小列宽，与excel操作相同。2、返回变量表，调整columns位数，一般columns的位数应大于width的位数。否则显示不完整。注意：不得不提醒大家，数据录入过程中，要随时注意保存，如果突然断电或者死机，辛苦工作的成果将付之东流。85三、变量标签和数值标签的意义定义变量标签后，在其它调用该数据库的操作中，变量标签会与变量名同时显示。在输出结果中，会以标签代替变量名，非常直观。数值标签与变量标签的作用相似。注意一点：在对数值进行编码时，尽量用数值代码+值标签这种录入方式，尽量不采用字符代码+值标签这种录入方式。86例如：比较不同病情分级的收缩压水平。Analyzecompare meansmeans87变量名和数值都是用标签来显示的。收缩压（而不是x3），病情分级（而不是x0）正常、一级、二级、三级（而不是1，2，3，4）88第三节数据编辑1、数据修改：在单元格内，或在编辑栏修改即可2、数据的复制和粘贴：选定，右键copy-paste，或者在编辑器菜单栏中选择editcopypaste893、数据删除：单元格内数据删除（1）选定单元格，delete键（2）单击右键，clear（3）在编辑器菜单栏中选择editclear 整条记录删除：在序号栏上，选定要删除的序号，delete，clear904、变量删除：（1）在数据窗口，选定某一个变量所在的列，delete，或clear（2）在变量窗口，单击变量所在的序里号（行），delete，或clear91第四节数据保存、转换和读取1、数据保存、转换在Spss建立的数据库，默认以spss文件格式报春，后缀名为（*.sav）。保存已建立的数据库，有两种方式（1）以spss文件格式（*.sav）保存：filesave，确认，或单击快捷栏上保存按钮（2）以其它文件格式保存或换名保存：filesave as，确认，可转换成（excel，,dbf等多种格式，）92如果要保存一个新的未命名或未保存过的数据库，都会进入save data as 对话框。练习：1、把刚才建立的数据库保存，命名为sample.sav2、将文件名改为data1.sav，保存；并另存为同名的excel格式文件93942、数据库读取(1)打开spss文件（.sav格式）1）在spss运行对话框中，选中open an existing data source,选中要打开的数据库文件，如果没有，选中more files，ok。2）菜单栏，fileopendata，确定。进入open file对话框，单击搜索栏的下拉按钮，选择要开打的文件。952、数据库读取(2)打开excel文件96(2)打开excel文件Spss可以读入许多非spss默认类型的数据文件，方式主要有三种：A 直接打开B 利用文本向导读入文本数据C 利用数据库ODBC接口读取数据。下面将以常见的Excel格式的数据、文本数据为例，介绍spss获取数据的功能。97步骤：Fileopendata（或单击快捷工具栏上的“打开文件”按钮）弹出open file 对话框，单击文件类型，选择所需的文件类型，然后选中打开的数据文件。练习：98选中文件后出现下面的对话框：99100首先要了解excel文件的结构：1、包括几个数据表（工作表），具体应当打开哪个表2、如果不需要所有数据，只需读入一部分，这时需要了解读入的数据的精确位置，如单元格A2:F5。3、第一行是否是变量名101数据全部导入102导入部分数据A1:C101031041051062024/5/22 周三107数据读入的优点：1、这种直接读取的方法优于“拷贝+粘贴”，可以顺利地进行变量名的转化；2、可以直接读取字符型变量，如果用“拷贝+粘贴”地方法，字符型变量就全部变成缺失值了；3、操作简单，不容易出错，就和读取spss自己的文件一样方便。1083、读入文本文件109110111112练习：读入文本格式的病人基本资料113114115116定义在数据预览窗口中所选择的变量：顾名思义，在这个对话框中，用户可以在数据预览窗口中选择某一列变量，更改其变量名和类型。117118变量类型等属性需要重新设置。119第三章结果输出一、结果窗口概述作为功能强大的统计分析工具，为了能够使得分析结果更为美观易读，更好地满足用户的需求，spss一共提供了4种格式的统计分析结果：表格、文本、标准图和交互图1201、表格格式1、绘制表格用于表述数据，2、大部分分析结果也都以专用表格的形式展示，这些表可以是二维表，也可能是多维表。3、二维表、多维表都可以作为“spss pivot table”对象而粘贴到其他应用程序（如word,excel,powerpoint）中，并且依然利用spss对这些表格进行编辑。Spss的指标功能非常强大，能很好地满足用户各种情况下的要求。1211222、文本格式随着版本的增加，文本输出已经越来越少了。这些文字可以随意进行拷贝粘贴、格式设定等操作。3、标准图与交互图 123注意：结果是单独的一个文件，不会保存在数据库里边，因而要赋予名称进行保存。练习：继续前面的例题：比较不同病情分级的收缩压水平并作条图。124步骤：1、比较收缩压水平：AnalyzeCmopare MeansMeans,进入Means过程对话框，将变量“收缩压（x3）”和“病情分级（x0）”分别放入dependent list栏和independent list栏ok1251261272、作图。步骤：Graphsbar,进入Bar charats对话框：单击simple 单击summaries for groups of cases define（定义，对即将作图的变量进行选择）进入define simple bar 对话框，单击 other summary function 选项，变量“收缩压（x3）”和“病情分级（x0）”分别放入variabe栏和category Axis栏ok,128129130作图结果就加入到了当前已打开的接过文件中，请大家注意，看左边的目录区增加了新的结果目录。131132结果目录一般包括四个子目录1、tite：分析或作图方法名称2、notes：分析过程的各种参数，语法等，默认为关闭状态3、case processing：显示分析所调用个体数据的情况4、report：分析结果点击相应目录即可查看相应结果，也可直接用鼠标上下移动。133二、结果文件编辑1、title的编辑：在内容区，双击means，进入编辑状态，输入：收缩压均数1342、report表格编辑：双击表格更改表格名：双击表格名report，更改，输入“不同病情分级收缩压水平”1351363、report表格格式编辑：要修改表格格式，须在分析前进行定义。步骤：editoptions,进入options(参数)对话框，单击pivot tables标签，进入该页，选择样本格式，再次运行分析过程。得到不同形式的表格结果1371381394、graph图表编辑：（1）调整大小（2）图表结构编辑：方法：1、双击图表，出现编辑菜单；2、单击右键，选择spss chart objectopen，激活图表编辑器spss chart editor。可以对图表的线条、标记、颜色、坐标刻度、做标题等进行修改，具体方法“统计图”一章详述。140141142三、结果文件输出1、将选定的表格或图表粘贴到word或powerpoint 文件中（1）步：复制；第一种：在结果文件中，光标指向表格或图表，单击右键，出现编辑菜单，选择copy object 第二种：选定，菜单栏editcopy object （2）步：粘贴；打开word或powerpoint文档，菜单栏editpaste，或单击右键，在编辑菜单上选择paste，可将表格或图表粘贴到相应文档。1432、将选定的表格转换成其他格式输出表格可以转换成文本文件（.txt）或超文本本件（.html）图表可以转换成JPEG,PNG格式等多种图像文件加以保存。144表格的转换输出步骤：在结果文件中，光标指向表格或图表，单击右键，出现编辑菜单，选择export，或菜单栏上操作。出现export对话框：145146图表的转换输出步骤：（1）编辑：指向图表，右键，编辑菜单，选择spss chart objectopen，激活图表编辑器spss chart editor。（2）在spss chart editor菜单栏上，选择fileexport chart，进入对话框（3）在对话框中指定输出文件所在文件夹和文件名，在文件名处输入文件名。选择图像格式，保存。147148149四、结果文件的保存1、Spss的分析结果可以保存为spss自身的格式：“.spo”格式（操作：file直接save即可），或换名保存，save as2、但除此之外，还可以使用导出功能以外另外几种常用的格式，具体有几下几种格式可供选择：HTML,TEXT,多种格式）操作：fileExport output,150五、结果文件的读取Fileopenoutput，在一个数据编辑器中，允许打开一个或多个结果文件，若打开多个结果文件，最后打开的为默认结果文件。在spss数据编辑器或任何一个已打开的spss viewer 中进行新操作，结果都将记录在最后打开的结果文件上。如果关闭最后打开的结果文件，默认结果文件将改为第一个打开的结果文件。151Spss系统参数设定选择Editoptions，可以对数据、表格、图表、草稿、标题等格式，以及数据编辑器、结果阅读器、草稿阅读器的视图界面进行定义和修改。152第二章第四节数据整理一切统计分析都是以数据为基础的，在数据文件建立好以后，还需要对数据进行必要的加工处理。对同一个数据往往要从各种不同的侧面进行研究，采取多种统计方法进行分析，而不同的统计方法对数据文件结构的要求不尽相同，就需要对结构进行重新调整或转换。这项工作称数据整理。153v 在spss中，数据文件的管理功能基本上都集中在Data和Transform菜单上vData:实现变量或个体级别的管理v 如插入新变量、新个体、记录排序；vTransform：实现文件级别的管理v 如变量排序、文件合并、拆分等。154一、插入或删除变量或个体v（一）插入个体v 例题：以病人基本资料为例，请在个体5与个体6之间插入一个个体。v 步骤：v 单击个体6编号（行首）选择DataInsert case,输入数据49，17204，.155v（二）插入变量v例题：以病人基本资料为例，请在变量sex与变量x0之间插入一个变量pulse（脉搏）。v 步骤：v 单击变量x0（列首）选择 DataInsert variable,出现空白变量var00001，切换到变量窗口，定义变量属性，输入数据一、插入或删除变量或个体156一、插入或删除变量或个体v（三）删除个体或变量v例题：删除个体8，删除变量indatev步骤：v1、单击选中个体8EditCut或Clearv 单击变量名indate EditCut或Clearv2、或单击右键，进行操作157158v（四）恢复已删除的个体或变量v EditUndov 不仅能恢复前一删除操作的个体或变量，在前的删除操作步骤也能恢复！一、插入或删除变量或个体159二、个体排序160Sort by:排序变量栏。如果放入两个变量，则先按第一个变量排序，在对第二个变量进行次排序。Ascending：升序排列，默认161v练习：对变量inno(住院号)进行升序排列。v 对age降序排列v 对不同性别进行身高的升序排列162三、合并文件v 统计分析的第一步工作是数据录入，在数据量较大时，经常需要把一份大的数据分成几个小部分，然后再分别由不同的录入员进行录入，以缩短录入时间。v 就会出现一份大数据分别储存在几个不同的数据文件中的现象。v 除此之外，如果数据有多个来源，则可能会是变量分散在几个文件中。163数据文件的合并方式v（一）纵向连接：几个数据集中的数据纵向相加，组成新的数据集，其中的记录数是原来几个数据集当中记录数的总和。v（二）横向合并：按照记录的次序，或者某个关键变量的数值（如住院号），将多个数据集的不同变量合并为一个数据集，新的数据集包含的变量数是所有原数据集当中不重名变量的总和。164合并中的注意事项v注意：进行合并的文件必须都存储为spss格式。v如果用程序方式，可以一次实现多个数据文件的合并；v如果使用对话框方式，一次只能进行两个spss数据文件的合并，且其中一个必须是已被打开的当前数据文件。165纵向连接v纵向连接：即将一个spss数据文件的内容追加到数据编辑窗口中当前数据的后面。v条件：一、待合并的数据文件，其内容合并是有实际意义的。v二、为方便合并，在不同数据文件中，数据含义相同的变量，最好定义相同（变量名、类型、长度等），方便自动匹配。166v例：将病人基本资料2.sav中的记录添加到病人基本资料1.sav中。v注意：两个文件中对性别的命名不同，基本资料2.sav中的sex对应了基本资料1.sav中的gender。167v步骤：1、打开基本资料1.sav；v 2、DataMerge fileAdd Cases,并选择待合并的文件基本资料2.sav168169170横向合并v 将一个已有的spss数据文件中的若干个变量加到当前数据编辑窗口的数据中，即新加的内容接到当前数据的右边，v 实质就是按照记录一一对应，左右对接。171v 遵循条件：v1、如果没有记录号，必需至少有一个变量名相同的公共变量，这个变量名是两个数据文件合并的依据，称关键变量。如学号、贵宾卡号等。关键变量可以是多个；v2、合并前按关键变量进行升序排列；v3、为方便合并，不同文件中数据含义不同的，变量名应取不同名称。172v练习：将病人基本资料4.sav中的记录添加到病人基本资料3.sav中。v 注意：有两个变量重复，编号，inno，173v步骤：1、打开基本资料3.sav；v 2、DataMerge fileAdd Variables,并选择待合并的文件基本资料4.sav174175vMatch case on key variabe in sorted:v 排序文件中按关键变量匹配个体选项vBoth files provide cases:默认。v 指合并后的数据由原来的两个文件共同提供，即原来两个文件中的记录共同组成新文件，当两个数据是逐条对应时，选此项。176vExternal file is keyed table：v 外部文件为关键表。以当前数据为基准，外部文件匹配当前数据的关键变量值，匹配则加入新变量，不匹配则不加入。即合并后记录仅包括当前数据编辑窗口中的记录。vWorking data file is keyed table：v 当前数据为关键表。以外部文件为基准，当前数据匹配外部文件的关键变量值，匹配则加入新变量，不匹配则舍去当前数据的该个体。即合并后数据文件的记录仅包括外部文件中的记录。177178179四、选择个体（select cases）180v函数选项：有一百多种可供选择。vLN(numexpr)：求自然对数vLG10(numexpr):求以10为底的对数。181五、加权个体（weight cases）182第二章第五节数据变换整理数据时，常要把某些变量的数据进行变换，这些数据变换是通过一个有效的数值表达式或使用函数来实现。另外，连续型变量也可变换为分类变量183一、计算新变量（compute）Compute过程:最常用。计算新变量的功能是在原有spss数据文件的基础上，根据用户的要求，使用spss算术表达式或函数，对所有变量或满足spss条件表达式的记录，计算出一个新结果，并将结果存入一个用户指定的变量中。这个指定的变量可以是一个新变量，也可以是一个已存在的变量。184例题1：求血压差185186187188例题2：对原始变量x3（收缩压）取常用对数并产生一个新变量lgx3189190练习：对男性的空腹血糖去平方根产生新变量sq。191192193194二、分组、合并（recode）数据分析中，将连续变量转换为等级变量，或者将分类变量中不同的变量等级进行合并是很常见的工作。两种情况：1、生成新变量（into different variables）2、修改原始变量（into same variables）195 1、对连续变量进行分组，形成一个新的计数变量196练习：请对年龄进行分组，每10岁为一组，取新变量名为age1197198199200单击old and new values2012022032042052、对分类变量进行类别的合并练习：将刚才分组编码的age1变量值进行合并，小于50岁的为中青年，编码为1；大于等于50岁的为老年，编码为2206207Transformer菜单中其他功能Count过程：功能同recode过程Random number seed过程：用于设定为随机函数的随机种子。Automatic Recode:将字符变量转换为数值变量（也可用recode手工设定）。Rank cases：用来编秩（排序）的一个专用过程。非参数检验时应用。208练习：求收缩压（x3）的秩次。209三、连续变量的可视化分段 Recor

展开阅读全文