资源描述
答案在里面自己找
1、 SPSS最初与现在的英文全称是什么?它在哪些行业有应用?
2、 SPSS的版本有哪些?我们课堂上使用的是哪个版本?SPSS软件主界面有哪几个窗口,分别是哪些?SPSS中的行、列分别代表什么?
3、 在SPSS中可以使用哪些方法输入数据?对于缺失值,如何利用SPSS进行科学替代?在计算数据的加权平均数时,如何对变量进行加权?
4、 变量按测量精度可以分成哪几种类型?
5、 一组数据的分布特征可以从哪几个方面进行测度?
6、 某百货公司9月份各天的服装销售数据如下(单位:万元)
(1) 计算该百货公司日销售额的均值、标准误差、中位数、众数、全距、方差、标准差、四分位数、十分位数、百分位数、频数、峰度和偏度;
(2) 计算日销售额的标准化Z分数及对其线性转换。
7、 对10名成年人和10名幼儿的身高(cm)进行抽样调查,结果如下:
成年组
(1) 应采用哪种测试值比较成年组和幼儿组的身高差异?
(2) 比较分析哪一组的身高差异大?
8、 在SPSS中,可以用何种方法对数据进行正态性分布检查,它们的原理分别是什么?
9、 T检验的基本原理是什么?
10、用某药治疗6名高血压病人,对每一个病人治疗前、后的舒张压进行了测量,结果如下表所示:
治疗前后的舒张压测量表
病例编号 1 2 3 4 5 6
用药前 120 127 141 107 115 138
用药后 123 108 120 107 102 152
(1)治疗前后这6名病人的均值和方差有何不同?
(2)治疗前后病人的血压是否有显著的变化?
11、A学校要对两位老师的教学质量进行评估,这两位老师分别教甲班和乙班,这两班数学课的成绩如下表所示,问这两个班的成绩是否存在差异?
甲、乙两班数学考试成绩
甲班
12、何谓方差分析?方差分析的基本思想是什么?单因素方差分析、多因素方差分析、协方差分析之间的区别?
13、某高血压研究中心开发了三种治疗高血压病的方法,下表所示为患者使用不同的治疗方法后的血压,试分析这三种方法是否有显著差异?
三组病人的血压
患者编号 入院治疗后的血压 入院治疗前的血压 组别
1 SPSS最初的英文全称:Statistical Package for the Social Sciences SPSS现在的英文全称:Statistical Product and Service Solutions。在通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业有应用。
2运行于Windows 9X/NT/2000/XP/7上的SPSS 19.0 for Windows标准版,一个是SPSS数据编辑窗口,另一个是SPSS输出窗口。每一列代表一个变量(Variable)或一个被观测量的特征,每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件
3 用户可以逐行录入也可以逐列也可以读入其他格式文件数据。
序列均值; 临近点的均值; 临近点的中位数; 线性插值法;点处的线性趋势
4定性变量、定序变量、定距变量和定比变量。
5 1、数据分布集中趋势2、数据分布离散程度3、数据分布偏态与峰度
9 T检验的基本原理是:首先假设零假设H0成立,即样本间不存在显著差异,然后利用现有样本根据t 分布求得t值,并据此得到相应的概率值p,若p≤a,则拒绝原假设,认为两样本间存在显著差异。
12 方差分析是用于两个及两个以上样本均值差异的显著性检验。方差分析的基本思想是:通过分析研究中不同变量的变异对总变异的贡献大小,确定控制变量对研究变量影响力的大小。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平能够对结果产生显著影响,那么它和随机变量共同作用,必将使结果有显著变化。
;单因素方差分析所解决的是一个因素下的多个不同水平之间的相关问题;多因素方差分析的控制变量在两个或两个以上,其主要用于分析多个控制变量的作用、多个控制变量的交互作用以及其他随机变量是否对结果产生了显著影响;协方差分析将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更准确地对控制因素进行评价。
14 相关分析即是用适当的统计指标来衡量事物之间,以及变量之间线性相关程度的强弱。相关分析包括简单相关分析、偏相关分析和距离相关分析。 相关系数的取值范围在−1和+1之间,即−1≤r≤+1。其中:
· 若0<r≤1,表明变量之间存在正相关关系,即两个变量的相随变动方向相同;
· 若−1≤r<0,表明变量之间存在负相关关系,即两个变量的相随变动方向相反;
第一章 SPSS简介
1-1答:SPSS的运行方式有三种:批处理方式、完全窗口菜单运行方式、程序运行方式。
1-2 答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。
第三章 统计描述
3-1 答:一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。
3-2 答:均值是总体各单位某一数量标志的平均数。平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。 在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。众数是指一组数据中出现次数最多的那个数据。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。
第四章 均值比较与T值检验
4-1 答:通过单一样本T检验可以检验某个单一样本某变量的总体均值与指定值之间是否存在显著差异。
4-2 答:对两个独立样本进行均值差异检验需要通过两步来完成:第一,利用F检验判断两总体的方差是否相同;第二,根据第一步的结果,决定T统计量和自由度计算公式,进而对T检验的结论作出判断。
4-3 答:两配对样本T检验的前提要求如下:两个样本应是配对的;样本来自的两个总体应服从正态分布。
4-4 答:1.用药前的均值为124.67,方差为175.47;用药后的均值为118.67,方差为331.87.
2.用配对样本T检验方法进行检验,结果得出伴随概率为0.337,大于显著性水平0.05,因而接受原假设,即治疗前后没有显著的变化。
4-5 答:用两独立样本T检验进行检验得出,甲乙两个班级学生的数学成绩方差无显著性差异,而这两个班级的学生数学成绩均值之间有差异,甲班成绩要高于乙班同学的数学成绩。
第五章 方差分析
5-1 答:方差分析可以用来检验两个及两个以上样本均数之间是否存在显著差异。
5-3 答:协方差分析是将那些很难控制的因素作为协变量,在排除协变量影响的条件下,分析控制变量对观察变量的影响,从而更加准确地对控制因素进行评价。适用情况:当有一些很难控制的随机变量时,可以使用协方差分析将这些随机变量作为协变量。
5-4 答:用单因素方差检验进行检验得,患者,可疑患者和非患者三个组的总体方差是相等的,也就具备了进行方差检验的条件,从单因素发差检验结果看,这三个组之间存在着显著差异。
5-5 答:这三个组别的接受治疗的患者在接受治疗之前各组之间没有显著性差异,在接受治疗之后,三个组别之间仍然没有显著性差异。但是通过配对样本的T检验得知,用这三种治疗方法进行治疗的患者在治疗前后血压都有有显著性差异,也即是说三种治疗方法都是有效的,并且彼此之间差别不显著。
第六章 相关分析
6-1 答:描述变量之间线性相关程度的强弱,并用适当的统计指标表示出来的过
程为相关分析。常用的方法有二元定距变量的相关分析、二元定序变量的相关分
析、偏相关分析和距离相关分析。
6-4 答:采用二元定序变量的相关分析
Correlations
jud1
jud2
jud3
jud4
jud5
jud6
jud7
jud8
jud1
Pearson Correlation
1.000
.913**
.835**
.872**
.883**
.802**
.790**
.428
Sig. (2-tailed)
.000
.001
.000
.000
.002
.002
.166
N
12.000
12
12
12
12
12
12
12
jud2
Pearson Correlation
.913**
1.000
.893**
.962**
.887**
.876**
.885**
.371
Sig. (2-tailed)
.000
.000
.000
.000
.000
.000
.235
N
12
12.000
12
12
12
12
12
12
jud3
Pearson Correlation
.835**
.893**
1.000
.858**
.880**
.762**
.820**
.480
Sig. (2-tailed)
.001
.000
.000
.000
.004
.001
.114
N
12
12
12.000
12
12
12
12
12
jud4
Pearson Correlation
.872**
.962**
.858**
1.000
.905**
.808**
.805**
.435
Sig. (2-tailed)
.000
.000
.000
.000
.001
.002
.157
N
12
12
12
12.000
12
12
12
12
jud5
Pearson Correlation
.883**
.887**
.880**
.905**
1.000
.718**
.776**
.417
Sig. (2-tailed)
.000
.000
.000
.000
.009
.003
.178
N
12
12
12
12
12.000
12
12
12
jud6
Pearson Correlation
.802**
.876**
.762**
.808**
.718**
1.000
.739**
.320
Sig. (2-tailed)
.002
.000
.004
.001
.009
.006
.310
N
12
12
12
12
12
12.000
12
12
jud7
Pearson Correlation
.790**
.885**
.820**
.805**
.776**
.739**
1.000
.374
Sig. (2-tailed)
.002
.000
.001
.002
.003
.006
.231
N
12
12
12
12
12
12
12.000
12
jud8
Pearson Correlation
.428
.371
.480
.435
.417
.320
.374
1.000
Sig. (2-tailed)
.166
.235
.114
.157
.178
.310
.231
N
12
12
12
12
12
12
12
12.000
**. Correlation is significant at the 0.01 level (2-tailed).
从二元定序变量的相关关系分析结果看,裁判1到裁判7的判决结果比较类似,但是裁判8与其他裁判在平分上有显著的不同。
第七章 回归分析
7-1 各种回归分析的基本概念、基本功能和应用范围:
答:(1)一元线性回归分析,在排除其他影响因素或假定其他影响因素确定
的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程;
(2)多元线性回归分析,在实际问题中,影响因变量的因素往往有多个,研究
在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系;(3)
非线性回归分析,研究在非线性相关条件下,自变量对因变量的数量变化关系;
(4)曲线估计,实际问题中,用户往往不能确定究竟该选择何种函数模型更接
近样本数据,这时可以采用曲线估计的方法,首先根据实际问题本身特点,同时
选择几种模型,然后SPSS自动完成模型的参数估计,并显示R2、F检验值、相
伴概率值等统计量,最后,选择具有R2统计量值最大的模型作为此问题的回归
模型,并作一些预测;(5)时间序列曲线估计,时间序列的曲线估计是分析社会
和经济现象中经常用到的一种曲线估计。通常把时间设为自变量,代表具体的
经济或社会现象的变量设为因变量,研究变量与之间关系的方法;(6)含
虚拟自变量的回归分析,在回归分析中,对一些自变量是定性变量的先作数量化
处理,处理的方法是引进只取“0”和“1”两个值的0-1型虚拟自变量。当某
一属性出现时,虚拟变量取值为“1”,否则取值为“0”;(7)逻辑回归分析,是
对定性变量的回归分析。
第八章 聚类分析与判别分析
8-1 答:聚类分析是统计学中研究这种“物以类聚”问题的一种有效方法,它属于统计分析的范畴。聚类分析的实质是建立一种分类方法,它能够将一批样本数据按照他们在性质上的亲密程度在没有先验知识的情况下自动进行分类。这里所说的类就是一个具有相似性的个体的集合,不同类之间具有明显的区别。
8-3 答:判别分析先根据已知类别的事物的性质(自变量),建立函数式(自变量的线性组合,即判别函数),然后对未知类别的新事物进行判断以将之归入已知的类别中。在分析的各个阶段应把握如下的原则:(1)事前组别(类)的分类标准(作为判别分析的因变量)要尽可能准确和可靠,否则会影响判别函数的准确性,从而影响判别分析的效果。(2)所分析的自变量应是因变量的重要影响因素,应该挑选既有重要特性又有区别能力的变量,达到以最少变量而有高辨别能力的目标。(3)初始分析的数目不能太少。
第九章 因子分析
9-3 答:因子分析有下面4个基本步骤:
(1) 确定待分析的原有若干变量是否适合于因子分析;
(2) 构造因子变量;
(3)利用旋转使得因子变量更具有可解释性;(4)计算因子变量的得分。
展开阅读全文