1、SPSS统计练习题及答案 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按
2、某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=0.043,说明: A. 按照0.05显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是0.043; C. 三种城市身高有差别的可能性是0.043; D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是: A 家庭主妇与女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物与没有服用药物的病人身体状况的差异; D性别与年
3、龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料与有序分类资料进行统计描述与简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 8、One-Samples T Test过程用于进行 样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次
4、观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否与我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%与20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么? 答:(1)、将数据输入SPSS,并保存; (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法
5、 (3)、按题目要求进行统计分析; (4)、保存与导出分析结果。 12、对数据进行方差分析时,Univariate菜单与Multivariate菜单最大的区别是什么? 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法? 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件
6、选择菜单File==>Read Text Data 14、指定数据按某个变量进行排序需要用到哪个菜单? 答:Date==>Sort Cases 15、两因素以上的方差分析在SPSS中用什么来完成? 答:这些方差分析一律可归入一般线性模型,所以在SPSS中都被归入了General Lineal Model子菜单。 16、简述Descriptive Statistics菜单的组成与功能。 答:描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS中专门为该目的而设计的几个模块集中在Descriptive Statistics菜单中,最常用的是列在最
7、前面的四个过程: (1)、Frequencies过程的特色是产生频数表 (2)、Descriptives过程进行一般性的统计描述; (3)、Explore过程用于对数据概况不清时的探索性分析; (4)、Crosstabs过程则完成计数资料与等级资料的统计描述与一般的统计检验,我们常用的卡方检验也在其中完成。 17、简述在多元线性回归分析中,SPSS筛选自变量进入回归方程的四种方法。 答:这四种方法是:强迫法、逐步法、向前法、向后法。 (1)逐步回归法(stepwise),是运用甚为广泛的复回归分析方法之一,也是多元回归分析报告中出现几率最多的一种预测变量的方法。它结合“向前法”(
8、forward selection)与“向后法”(backward elimination)二种方式的优点。 (2)向前法是自变量一个一个进入回归模式中,而向后法是先将所有的自变量纳入回归模式中,之后再逐一将对模式贡献最小的预测变量移除,直到所有的自变量均达到标准为止。 (3)强迫回归法(Enter)也是一种常见的方法,强迫所有变量有顺序进入回归方程。 18. 试说明多元线性回归分析中的“共线性”问题及判断标准。 答:多元回归分析中要留意“共线性”(collinarity)问题,它是指由于自变量间的相关太高,造成回归分析的情境困扰,使回归模式的参数不能完全被估计出来。自变量间的共线性问
9、题可由容忍度(tolerance)、变异数膨胀因素(VIF)与条件指针(condition index;CI)。一般而言,容忍度越接近0、VIF越大或条件指针越大(大于15),则越有可能存在共线性问题。 19、下表是不同职业与工作满意感之间相关分析的结果,试判断不同职业与满意感之间是否有相关,如果有,相关系数是多少? Correlations 不同职业 满意感 不同职业 Pearson Correlation 1 .075 Sig. (2-tailed) . .662 N 36 36 满意感 Pearson Correlation .0
10、75 1 Sig. (2-tailed) .662 . N 36 36 答:由于显著性水平P=0.662>0.05,说明二者之间不存在显著性相关。 五、分析题(问答类) 20、某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下: 患 者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健 康: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 (
11、1)将数据录入SPSS,保存为li1_1.sav; (2)分析该地克山病患者与健康人的血磷脂是否不同; (3)保存结果。 21、在数据li1_1.sav中生成新变量temp,当血磷值小于1.5时取值为1,1.5~2时取值为2,大于2时取值为3,并保存结果。 答:操作步骤如下: (1)、Output Variable框:选入x; (2)、Output Variable Name框:键入temp,单击Change钮; (3)、选中x->temp:单击Old and New Values钮; (4)、Range: Lowest through*单选钮:键入1.5; New Value
12、 Value单选钮:键入1;单击Add钮; (5)、Range: *through*单选钮:两侧分别键入1.5、2;New Value Value单选钮:键入2;单击Add钮; (6)、Range: All other values单选钮; New Value Value单选钮:键入3;单击Add钮; (7)、单击Continue; (8)、单击OK; 22、数据li3_1.sav记录的是某班50名学生语、数、外三门科目的考试成绩,分别作出三科得分频数表、计算均数、标准差、中位数、P2.5与P97.5,并画出直方图。 答:操作步骤如下: (1).Analyze==>Descri
13、ptive Statistics==>Frequencies; (2).Variables框:选入变量engl(外)、chin(语)、math(数); (3).单击Statistics钮; (4).选中Mean、Std.deviation、Median复选框; (5).单击Percentiles:输入2.5:单击Add;输入97.5:单击Add; (6)单击Continue钮; (7).单击Charts钮; (8).选中Bar charts; (9).单击Continue钮; (10).单击OK; 23、根据数据li3_1.sav分析该班男、女生在语、数、外三科
14、得分上有无差异。 答:(1).Analyze==>Compare Means==>Independent-Samples T Test; (2)Test Variables框:选入变量engl(外)、chin(语)、math(数); (3)Grouping Variable框:选入变量gender; (3)单击Define Groups钮; (4)选择Use specified Values,在group1中填1,在group2中填2; (5)单击Continue钮; (6)单击OK。 24、某驾校学校欲购进一批驾驶模拟训练器,为了知道它们的效果,进行了一次实验。从新学员中随机
15、抽取12名进行训练,训练前与训练后分别对学员驾驶技能进行测试,结果如下: 训练前 66.0 68.0 70.0 65.0 67.0 82.0 60.5 59.0 71.0 77.0 66.0 70.5 训练后 62.5 85.0 70.0 73.0 65.0 63.5 60.5 76.0 75.5 65.0 62.5 72.0 试问模拟器训练的效果如何? 答:用Paired-Sample T Test分析 (1)、录入数据:设变量x1,x2 分别代表训练前与训练后值,在SPSS 中输入数据。 (2)、统计分析:依次选择Analy
16、ze-Compare means-Paired samples T test(配对t检验),弹出对话框,将变量x1、x2同时选入Paired Variables框(同时选中x1、x2)。在Options子对话框中可定义可信区间与缺失值的处理。单击OK键提交执行即可得结果。 25、美国国家计算机产品公司在亚特兰大、达拉斯以及西雅图都设有工厂,生产 机与打印机。为了确定这三个工厂的工人的产品质量管理意识水平,特意从每个工厂随机选取10个工人,对他们进行质量意识考试,员工考试的结果如下。请问这三个工厂员工的质量管理意识水平有无显著差异?若有显著差异,根据统计结果直接观察,哪个工厂最低? 亚特
17、兰大 85 75 82 76 71 85 79 83 74 78 达拉斯 71 75 73 74 69 82 74 78 76 68 西雅图 59 64 62 69 75 67 66 62 69 70 答:数据已经输好,分组变量为group,三组取值分别为1、2、3,结果变量为X。此处先进行单因素方差分析,然后进行两两比较,这里选择S-N-K法进行两两比较。操作如下: (1).选择Analyze-Compare means- One-Way ANOVA (2).Dependent List框:选入X (
18、3).Factor框:选入group (4).Post Hoc钮:选中S-N-K复选框,单击Continue钮 (5).单击OK钮 26、某项研究欲探讨不同年龄的人完成所有不同难度任务的手眼协调性情况。研究数据见task.sav。年龄下1代表儿童组,2代表青年组,3代表老年组。后面分数为手眼协调性分数,越高表示手眼协调性越好。试问年龄、任务难度两个因素是如何影响人的手眼协调性的? 本题的组间变量为年龄,组内变量为不同难度任务。 答:操作步骤如下: (1)、Analyze==>General Lineal model==>Repeated measures (2)、With
19、in-subject factor name框:选入组内变量,即不同难度的任务,我们给其命名为task; (3)、number of levels框:表示组内变量有几个水平,键入3 ; (4)、单击Add;单击Define (5)、Within-subject variables (task)框:选入a1~a3 (6)、 Between subjects factor框:选入组间变量,即年龄Age (7)、Post Hoc纽:对选入因素各水平进行两两比较,选入Age;在S-N-K框打勾。单击Continue (8).单击OK,结果显示年龄与任务的主效应显著,并且二者交互作用显著,
20、即二者共同影响人的眼手协调性。 27、设某个计算公司所使用的现行系统,通过每个程序的平均时间为45秒。今采用一个新系统进行试验,发现通过9个程序所需的计算时间如下(单位:秒): 30 37 42 35 36 40 47 48 45 假定通过每个程序的时间服从正态分布,那么根据这些数据能否断言:新的系统能减少通过程序的平均时间(α=0.05)? 28、某份调查数据li7_1.sav记录了雇员的性别、工作类型、教育背景(年)、工作经验(月)与薪水情况,对此数据进行以下分析: (1)不同性别雇员的薪水是否有显著差异? (2)不同工作类型雇员的薪水是否有显著
21、差异? (3)雇员的教育背景与薪水之间是否相关,相关程度如何? (4)雇员的工作经验与薪水之间是否相关,相关程度如何? 答:(1)有; (2)有,多重比较(Post Hoc)结果表明:经理与主管与职员的薪水差异都显著,但主管与职员的薪水差异不显著; (3)雇员的教育背景与薪水之间有显著相关,相关系数为0.661; (4)雇员的工作经验与薪水之间有显著相关,相关系数为0.780。 29、根据数据li7_1.sav,分析雇员的性别、工作类型、教育背景(年)与工作经验(月)是否对其薪水高低有影响,进行多元回归分析,并求出直线方程。并试着判断是否存在自变量共线性问题。 答:这是多元回归
22、问题,因不知道四个变量有无影响,选择对四个变量分析的进入方法为stepwise(让软件自动选择判断),操作如下: 1.Analyze==>Regression==>Liner 2.Dependent框:选入salary 3.Independent框:选入gender、educ、job与prevexp 4.Method钮:选择stepwise 5.单击OK钮 结果显示四个变量都进入回归方程,且变量间不存在共线性问题。 30一位教师前后间隔两个月对10名学生的作文进行评分(满分30),利用非参数检验的方法判断这位教师的评分前后是否一致?(数据见teacher.sav) 答:用Non
23、parametric test==>Two-Related-Samples Tests菜单进行分析,结果显示评分前后是一致的,无显著差异。 31、根据数据li7_1.sav,完成以下任务: (1)分别对变量工作经验(prevexp)与教育背景(educ)作饼图; (2)以雇员的不同教育背景(年)对其薪水作条形图,反映不同教育背景下的薪水情况。 答:操作步骤如下: (1)选择Graph==>Pie,分别选入prevexp与educ。 (2)选择Graph==>Bar,选择Simple,点击Define。在Variable框中选入变量salary,在Category Axis框中选入变量educ。点击OK。 第 7 页






