资源描述
SPSS中多选题(复选题)的录入及统计分析
多选题,就是说一个题目可以有多个答案。在录入的时候有两种选择。
我们举例说明:
Q1 你经常使用的搜索引擎是哪几个?
1 百度
2 Google
3 雅虎
4 其他
假设有5个被访者,分别选择了
A 1
B 1,2
C 1,2,3
D 2,3
E 1,4
一 数据录入
有两种录入法,分别是二分法和分类法。
1 二分法,数据结构如下
二分法的特点是,题目有几个选项,SPSS数据文件中就有相应的几个变量以之对应。选项选中为1,不选中为0(也可以自己定义)。
2 分类法,数据结构如下
分类法的话,就是把选项序号依次输入到SPSS里面就可以了。变量个数等于同时选中的选项个数的最大值。
如果是把数据先录入到txt中的话,那么一定要注意题目之间的分隔符和选项直接的分隔符不能选一样的。比如,题目之间用TAB或逗号分开,选项之间用|分开。
二 多选题定义
SPSS中处理多选题,其实有两个模块。
一个是在菜单 Analyze -- Multiple Response 中,这个地方定义的多选题是临时的,如果你关闭SPSS后再打开,多选题还得重新定义。除非你使用Syntax,否则不推荐。
另一个就是在 Data -- Define Multiple Respones Sets 中(也可以在 Analyze -- Tables -- Multiple Respones Sets 中打开,其实是一样的),推荐用这种方法定义。
1 二分法:
1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中
2)在Variable Coding里选中 Dichotomies,即二分法
3)在Category Label Source里选 "Variable Labels"
4)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)
5)点击Add
2 分类法:
1)在菜单中打开定义多选题的对话框,然后把同一道题目的几个变量选中,点击向右的三角形将它们移动到 "Variables in Set" 这个框中
2)在Variable Coding里选中 Categories,即分类法
3)Set Name:填入多选题编号,Set Label:填入多选题的题干(或其他你觉得合适的标签)
4)点击Add
定义完以后,就会生成以$号开头的多选变量集了。这些多选变量集可以在Custom Tables里面使用。
三 多选题统计
二分法和分类法在统计的时候用法是一样的。
打开菜单 Analyze -- Tables -- Custom Tables
可以看到,在窗口左侧,出现了我们刚才定义的多选变量集 $Q1 ,把它拖到右侧的表格里。然后点击确定,即可输出频次表。
如果需要更详细的统计结果,可以打开位于左下角的Define框。其中,Summary Statistics可以定义输出的统计量(如Valid N,四分之一分位数等)及输出格式;而Categories And Totals则可以控制是够输出合计项等。
需要与其他变量交叉的时候,把其他变量拖到Columns(列)就可以了。
Tips:如何选中只选择了某个选项的Cases:
比如我们要选中所有经常使用百度的Cases做统计,则
1 二分法:
Select Cases -- Select If
输入: Baidu=1
2 分类法
Select Cases -- Select If
输入: ANY(1, Q3_1 TO Q3_3)
示例文件下载:
http://www.johnsonhu.org/files/SpssMultiple.zip
SPSS中多项选择题的处理
前几天受同学之托,继续琢磨SPSS中关于多项选择题的统计处理方法。
(一)多项选择题变量的定义方式:
主要有两种:一种二分法编码,一种是分类法编码。
1.所谓二分编码,即对该多项选择题下的每一个选项分别看作不同的变量,用“1”表示被调查者选择了该项,用“0”表示未选择该项。
2.所谓分类法编码,首先应该估计该问题最多被选择的可能性,并给每一种选择建立一个新的变量。从最终要分析的结果来看,两种定义方式具有相同的功能。
例如:以下哪类商品更容易引起您购物的冲动性? [多选题]
A食品包括零食 B电子产品 C学习用品书籍等
D生活用品 E服装 F饰品、化妆品
其中一位被调查者选择A、C、E、F
(二)编码与录入:
1.使用二分编码情况如下:
定义6个变量,变量名分别为food、electronic product、school supplies、vital commodity、clothes、decoration,值标签分别定义为0=“未选”,1=“选中”。以上被调查者的数据录入为:1 0 1 0 1 1 。
2.使用分类法编码如下:因为最多情况下,被调查者会选择6种选项,因此,仍需建立6个新变量,分别定义为shopping1、shopping2、shopping3、shopping4、shopping5、shopping6,每一变量下的值标签定义为:1=“A”,2=“B”,3=“C”,4=“D”,5=“E”,6=“F”,9=“未选或缺省”。以上被调查者的数据录入为:1 9 3 9 5 6 。
(三)定义多重响应:
所有有效数据录入完毕后就可以进行统计分析了,在此我使用SPSS17.0进行统计数据的描述与分析。比较困惑的一点是该版本的SPSS17.0中不能使用工具栏中的“数据”下的“定义多重响应集”,此处定义的集在多重响应频率和交叉表中不可用。需要使用工具栏中“分析”下的“多重响应”—“定义变量集”,可将上述两种情况各自分别定义为多重变量。
1.对应上述第一种情况:选中上述二分法编码下的6个变量,将变量编码设置为“二分法”,计数值为“1”(表示统计选中的情况),多响应集名称定义为“impulse shopping kinds”,标签为“冲动购物商品种类”,添加到“多响应集”中即可。
2.对应上述第二种情况:选中上述分类法编码下的6个变量,将变量编码设置为“分类”,范围1-9(根据分类定义情况),多响应集名称定义为“impulse shopping kinds”,标签为“冲动购物商品种类”,添加到“多响应集”中即可。
生成后的多响应集会在其名称前自动加$符号,此处即为“$impulse shopping kinds”。
(四)生成频率及交叉表:
这个过程比较简单,仍然从工具栏中“分析”下的“多重响应”—“频率”或“交叉表”进入,即可生成对应的频率表和交叉表。需要说明的是“交叉表”主要用于观察其它不同变量对该多重响应变量的影响,如不同性别和年龄对冲动购物种类的差异。
(五)问题:
或许你有这样的疑惑:我要对各项进行统计分析的同时,还要生产各种柱状图或饼状图可以吗?对于单项选择题没有问题,只需在“分析”—“描述统计”中生成即可,但是对于多项选择题柱状图的生产可能和你想要的并不相同。原因是只能对单一变量实现柱状图的生成。而多项选择题从其定义的方式及数据的录入来看,都将每一种情况作为单一变量来处理的,因此,统计生成的柱状图只能是该变量下选“1”和选“0”的情况了。
可以采取的补救办法是可以将.sav文件另存为excel文件,通过excel的统计结果来实现柱状图的生成。两者互补,基本上可以实现论文的目的
展开阅读全文