1、一、多选项分析一)问卷中多选项问题得分析多选项问题得分解通常有2中方法:1、多选项二分法(Multiple Dichotomies Method);2、多选项分类法(Multiple Category Method)。1、多选项二分法(Multiple Dichotomies Method);多选项二分法就是将多选项问题中得每个答案设为一个SPSS变量,每个变量只有0或1两个取值,分别表示选择个该答案与不选择该答案。按照多选项二分法可以将居民储蓄调查中村(取)款目得这个多选项问题分解为十一个问题,并设置十一个SPSS变量。2、多选项分类法(Multiple Category Method)多选
2、项分类法中,首先应估计多选项问题最多可能出现得答案个数;然后,为每个答案设置一个SPSS变量,变量取值为多选项问题中得可选答案。按照多选项分类法可将居民储蓄调查中存(取)款目得这个多选项问题分解成三个问题(通常给出得答案数不会超过三个),并设置三个SPSS变量。以上两种分解方法得选择考虑就是否便于分析与就是否丢失信息两个方面。多选项二分法分解问题存在较大得信息丢失,这种方式没有体现选项得顺序,如果问题存在顺序则适合采用分类法。同时注意自己需要得信息加以选择。二)多选项分析基本操作1、多选项分析得基本实现思路第一、按多选项二分法或多选项分类法将多选项问题分解成若干问题,并设置若干个SPSS变量。
3、第二、采用多选项频数分析或多选项交叉分组下得频数分析数据。为了实现第二步,应首先定义多选项选择变量集,即将多选项问题分解并设置成多个变量后,指定这些为一个集合。定义多选项变量集就是为了今后多选项频数分析与多选项交叉分组下得频数分析作准备。只有通过定义多选项变量集,SPSS才能确定应对哪些变量取相同值得个案数进行累加。2、定义多选项选择变量集得基本操作步骤1)选择菜单Analyze Multiple Response Defined Sets,出现如下图所示得窗口。2)从数值型变量中见进入多选项变量集得变量选择到Variables in Sets框中。3)在Variables Are Coded
4、 AS框中制定多选项变量集中得变量就是按照哪种方法分解得。Dichotomies表示以多选项二分法分解,并在Counted Value中输入对那组织进行分析。SPSS规定等于该值得样本为一组,其余样本为另一组;Categories表示以多选项分类法分解,并在Range框中输入变量取值得最小值与最大值。4)为多选型变量集命名。系统会自动在该名字前加$。5)单击Add按钮将定义好得多选项变量集加到Multiple Response Sets框中。SPSS可以定义多个多选项变量集。3、多选项频数分析得基本操作步骤多选项变量集定义完成后,便可进行多选项频数分析了。1) 选择菜单Analyze Mult
5、iple Response Frequencies,出现如下图所示得窗口。2) 从Multiple Response sets中把待分析得多选项变量集选择到Tables for框中;3) 制定就是否处理缺失数据。SPSS规定只有样本在多选项变量集中得某一个变量上取缺失值,分析时就将该样本剔除。Excluded cases listwise within dichotomies适用于多选项二分法;Excluded cases listwise within categories适用于多选项分类。生成如下所示得结果。4、多选项交叉分组下得频数分析得基本操作步骤1)选择菜单Analyze Multi
6、ple Response Crosstabs,出现如下图所示得窗口。2) 选择列联表得行变量并定义取值范围,或选择多选项变量集为行变量。3)选择列联表得列变量并定义取值范围,或选择多选项变量集为列变量。4)选择列联表得控制变量并定义取值范围,或选择多选项变量集为控制变量。5)单击Option按钮选择列联表得输出内容与计算方法,出现如下图所示得窗口。其中,在Cell Percentages中选择单元格输出哪些百分比,Row为行百分比,Column为列百分比,Total为总百分比;在Percentage Based On框中制定如何计算百分比,Case表示分母为个案数,Responses表示分母为
7、多选项应答数;Match Variable Across Response Sets选项表示,入股哦历练表得行列变量均为多选项变量集时,第二个变量集得第一个变量与第二个变量集得第一个变量做交叉分组,第一个变量集得第二个变量与第二个变量集得第二个变量做交叉分组。以此类催。至此,SPSS将自动产生相应得交叉列联表。二、相关分析Pearson简单相关系数用来度量定距型变量间得线性相关关系。如测量收入与储蓄、身高等变量间得相关系数。Spearman等级相关系数用来度量定序变量间得线性相关关系。一)计算相关系数得基本操作1、 选择菜单Analyze CorrelateBivariate,出现如下图所示得
8、窗口。2、把参加计算相关系数得变量选到Variables框。3、在Correlation Coefficient框中选择计算哪种相关系数。4、在Test of Significant框中选择输出相关系数检验得双尾(Two- Tailed)概率p值或单尾(One-Tailed)概率p值。5、选中Flag significance correlations选项表示分析结果中除显示统计检验得概率p值以外,还输出星号标记,以表明变量间得相关性就是否显著;不选中则不输出星号标记。6、在Options按钮中得Statistics选项中,选中Cross-product deviationas and cov
9、ariances表示输出各变量得离差平方与、样本方差、两变量得叉积离差与协方差。至此,SPSS将自动计算相关系数与进行统计检验,并将结果显示到输出窗口。三、偏相关分析偏相关分析也称净相关分析,它在控制了其她变量影响得条件下分析两变量间得线性相关。操作步骤:1、 选择菜单Analyze-Correlate-Partial,于就是出现如下图所示得窗口。2、 把参与分析得变量选择到Variables框中。3、 选择一个或多个控制变量到Controlling for框中。4、 在Test of Significance框中选择输出偏相关检验得双尾(Two-Tailed)概率p值或单位(One-Tail
10、ed)概率p值。5、 在Options按钮中得Statistics选项中,选中Zero-order Correlations表示输出零阶偏相关系数。至此。SPSS将自动进行偏相关分析与统计检验,并将结果显示到输出窗口。四、相关分析一)线性回归分析得基本操作变量得得筛选问题第一、向前筛选策略。向前筛选策略就是解释变量不断进入回归方程得过程。首先,选择与被解释变量具有最高线性相关系数得变量进入方程,并进行回归方程得各种检验;然后在剩余得变量中寻找与解释变量偏相关系数最高且通过检验得变量进入回归方程,并对新建立得回归方程进行各种检验得变量进入回归方程,并对新建立得回归方程进行各种检验;这个过程一直重
11、复,直到再也没有可进入方程得变量为止。第二、向后筛选策略。向后筛选策略就是变量不断剔除出回归方程得过程。首先,所有变量全部引入回归方程,并对回归方程进行各种检验;然后,在回归系数显著性检验不显著得一个或多个变量中,提出t检验值最小得变量,并重新建立回归方程与进行各种检验;如果新建回归方程中所有变量得回归系数检验都显著,则回归方程建立结束。否则按照上述方法再依次剔除最不显著得变量,直到再也没有可剔除得变量为止。第三、逐步筛选策略。就是向前筛选与向后筛选策略得综合。逐步筛选法事在向前筛选策略得基础上,结合向后筛选策略,在每个变量进入方程后再次判断就是否存在应该剔除出方程得变量。因此,逐步筛选策略在
12、引入变量得每一个阶段都提供了再剔除不显著变量得机会。1、 选择菜单Analyze-Regression-Linear,于就是出现如下图所示得窗口。2、 选择被解释变量进入Dependent框。3、 选择一个或多个解释变量进入Independent框。4、 在Method框中选择回归分析中解释变量得筛选策略。其中Enter表示所选变量强行进入回归方程,就是SPSS默认得策略,通常用在一元线性回归分析中;Remove表示从回归方程中提出所选变量;Stepwise表示逐步回归筛选策略;Backward表示向后筛选策略;Forward表示向前筛选策略。5、 第三与第四步中确定得解释变量及变量筛选策略可
13、放置在不同得快(Block)中。以单击Next与Previous按钮设置多组解释变量与变量筛选策略并放置在不同得块中。SPSS将首先在当前块(默认为1)中按照指定得筛选策略选解释变量与建立回归方程,然后自动按照下一个块中指定得策略筛选解释变量,并在上个回归方程得基础上作进一步建模工作,直到结束。可见,第四步中得Remove策略只可能放在第二个以后得块中。块设置便于作各种探索性得回归分析。6、 选择一个变量作为条件变量放到Selection Variable框中,并单击Rule按钮给定一个判断条件。只有变量值满足给定条件得样本才参与线性回归分析。7、 在Cases Labels框中指定哪个变量作
14、为样本数据点得标志变量,该变量得值将表在回归分析得输出图形中。至此便完成了线性回归分析得基本操作,SPSS将根据制定自动进行回归分析,并将结果显示到输出窗口中。二)线性回归分析得其她操作 SPSS线性回归分析还有很多其她选项。掌握这些选项对进一步深入分析与掌握更多有用信息就是非常有益得。在上图中单击Statistics按钮,出现如下图所示得窗口。该窗口可供应户选择更多得输出统计量。1)Estimates:SPSS默认输出项,输出与回归系数相关得统计量。包括回归系数(偏回归系数)、回归系数标准误差、标准化回归系数、回归系数显著性检验得t统计量与概率p值,各解释变量得容忍度(判断就是否存在共线性)
15、。多元回归分析中在个解释变量量纲不一致时(即有得显示绝对数,有得就是相对数例如百分比),如果希望比较各解释变量对被解释变量得影响程度得大小,可以采用标准化回归系数。2)Confidence Intervals:输出每个非标准化回归系数得95%置信区间。3)Descriptive:输出各解释变量与被解释变量得均值、标准差、相关系数矩阵及单侧检验概率p值。4)Model fit:SPSS默认输出项,输出判定系数、调整得判定系数、回归方程得标准误差、回归方程显著Fjianyande方差分析表。5)R squared change:输出每个解释变量进入方程后引起得判定系数得变化量与F值得变化量(偏F统
16、计量)。6)Parts and partial correlation:输出方程中各解释变量与被解释变量之间得简单相关、偏相关系数与部分相关。7)Covariance matrx:输出方程中各解释变量间得相关系数、协方差以及各回归系数得方差。8)Collinearity Diagnostics:多重共线性分析,输出各个解释变量得容忍度、方差膨胀因子、特征值、条件指标、方差比例等。(容忍度得取值范围在01之间,越接近0表示多重共线性越强;越接近于1表示多重共线性越弱。)(方差膨胀因子VIF取值大于等于1,如果取值远远大于10则表示存在严重得多重共线性。)9)在Residual框中:Durbin-Waston表示输出DW检验值;Casewise Diagnostic表示输出标准化残差绝对值大于等于3(SPSS默认值)得样本数据得相关信息,包括预测值、标准化预测值、残差、标准化残差、学生化残差、杠杆值、库克举例等得最大值、最小值、均值与标准差。