spss-数据正态分布检验.doc

资源描述

(完整版)spss 数据正态分布检验 spss 数据正态分布检验一、Z检验二、相关系数检验三、独立样本T检验四、相依样本T检验五、χ²独立性检验 32 一、Z检验第一步:录入数据。 1．命名“变量视图"； 2．“数据视图”中输入数据；第二步：进行分析。第三步：设置变量；第四步：得到结果: 二、相关系数检验在一项研究中，一个学生想检查生活意义和心理健康是否相关.同意参与这项研究的30个学生测量了生活意义和心理健康。生活意义的得分范围是10—70分（更高的得分表示更强的生活意义),心理健康的得分范围是5-35分（更高的得分表示更健康的心理状态）。在研究中基本的兴趣问题也可以用研究问题的方式表示，例如例题：生活意义和心理健康相关吗? 相关系数数据的例子 Participant Meaning in Life Well-being Participant Meaning in Life Well—being 1 35 19 2 65 27 3 14 19 4 35 35 5 65 34 6 33 34 7 54 35 8 20 28 9 25 12 10 58 21 11 30 18 12 37 25 13 51 19 14 50 25 15 30 29 16 70 31 17 25 12 18 55 20 19 61 31 20 53 25 21 60 32 22 35 12 23 35 28 24 50 20 25 39 24 26 68 34 27 56 28 28 19 12 29 56 35 30 60 35 说明:变量participant包含在数据中，但不用输入SPSS。在spss中输入数据及分析步骤1:生成变量 1．打开spss. 2．点击“变量视图”标签. 在spss中将生成两个变量，一个是生活意义，另一个是心理健康。变量分别被命名为meaning和wellbeing。 3．在“变量视图"窗口前两行分别输入变量名称meaning和wellbeing. 步骤2：输入数据 1．点击“数据视图”，变量meaning和wellbeing出现在数据视图前两列。 2．将两个变量的数据分别输入。如图。步骤3：分析数据 1．从菜单栏中选择“分析〉相关〉双变量>……” 打开“双变量”对话框，变量meaning和wellbeing出现在对话框的左边。 2．选择变量meaning和wellbeing，点击向右箭头按钮（►），把变量移到“变量”框中. 3．点击“确定”。步骤4：解释结果二元相关性的输出结果显示如下：同样的结果在相关性表格中出现了两次。生活意义和心理健康间的相关性相关性 wellbeing meaning wellbeing Pearson 相关性 1 .549＊* 显著性（双侧）相关性显著，因为p值小于0.05 。002 N 30 30 meaning Pearson 相关性。549** 1 显著性（双侧）。002 N 30 30 *＊。在。01 水平（双侧)上显著相关。 SPSS生成了一个输出表，标记为“相关性”，其中包括我们研究问题的答案，即变量meaning和wellbeing之间是否相关。注意在表格中meaning和wellbeing出现了两次，一次在行，一次在列（这表明SPSS生成的表格中出现了冗余）.相关系数值和原假设检验的p值位于变量meaning和wellbeing相交处。表格中显示meaning和wellbeing的相关性是0。549，相应的p值是0.002小于0.05，原假设被拒绝,在meaning和wellbeing的总体中存在正相关（相关系数右边的两个星号暗示了在0.01水平上相关性是统计显著的,因为p值为0。002小于0。01）.剩下的两个单元格显示了1的相关性,一个完美的正相关。即变量meaning和wellbeing自身与自身的相关性。三、独立样本T检验例题：临床心理学家想调查认知行为治疗和精神分析治疗对抑郁症的相对有效性.30名患有抑郁症的病人随机分配接受两个疗法.其中15人接受行为治疗，另外15人接受精神分析治疗，经过两个月的治疗后，记录下每个病人抑郁症得分。在本研究中，自变量是治疗方法（认知行为治疗与精神分析治疗),因变量是抑郁症，较高的分数表示更高的抑郁水平(抑郁水平的分数变化范围为10~70). 在研究中基本的兴趣问题也可以用研究问题的方式表示，例如: “在接受认知行为治疗与精神分析治疗的病人中，抑郁症水平的均值是否存在差异呢？” T检验用来检验两组数据的均值。所以，零假设假设两组数据的均值相等：原假设指出两组的抑郁症分数均值在总体上是相等的： H0：μ精神分析=μ认知行为对立假设指出两组的抑郁症分数均值在总体上是不等的： H1：μ精神分析≠μ认知行为数据在下表列出了30个参与者的数据。接受精神分析治疗的参与者标记为“1”，接受认知行为治疗的标记为“2”。独立样本t检验例子的数据 Participant Therapy Depression Participant Therapy Depression 1 1 57 16 2 47 2 1 61 17 2 42 3 1 67 18 2 59 4 1 63 19 2 37 5 l 51 20 2 35 6 1 55 21 2 42 7 1 45 22 2 38 8 1 62 23 2 49 9 1 41 24 2 61 10 l 36 25 2 43 11 1 55 26 2 47 12 1 57 27 2 49 13 1 70 28 2 37 14 l 62 29 2 41 15 1 58 30 2 48 说明：变量participant包含在数据中，但不用输入SPSS。步骤1：生成变量 1．打开SPSS。 2．点击【变量视图】标签。在SPSS中将生成两个变最，一个是不同治疗方法的组别（自变量）,另一个是抑郁症分数（因变量）。这些变量将各自被命名为therapy(治疗方法）和depression（抑郁症). 3．在【变量视图】窗口前两行分别输入变量名称therapy和depression (详见图表） 4．为变量therapy建立变量值标签，1=“精神分析治疗”，2=“认知行为治疗”。步骤2：输入数据 1．点击【数据视图】标签。变量therapy和depression出现在【数据视图】窗口的前两列。 2．参照图表6—1，为每个参与者输入两个变量的数据。对第一个参与者，为变量therapy和depression分别输人数值1和57。依次输入全部30个参与者的数据。对therapy，注意到前15个参与者为1（精神分析治疗），后15个参与者为2（认知行为治疗）。这是独立样本t检验的通用步骤，用于区分开参与者在哪个样本中。步骤3:分析数据 1．从菜单栏中选择【分析〉比较均值>独立样本 T 检验】（见图）。打开【独立样本 T 检验】对话框，变量therapy和depression出现在对话框的左边. 2．选择因变量depression，点击向右箭头按钮(►）把变量移到【检验变量】框。 3．选择自变量therapy，点击向右箭头按钮（►）把变量移到【分组变量】框中。在【分组变量】框中，两个在括号内的问号出现在therapy的右边（见图）。这些问号表示原先的数字分配到两个治疗样本中(也就是l、2）。这些数字需要通过点击【定义组】来输入。 4．点击【定义组】。 5．【定义组】对话框被打开,在【组1】(表示精神分析治疗样本的数字）的右边输入“1"，并且在“组2”（表示认知行为治疗样本的数字）的右边输入“２”。 6．点击【继续】。 7．点击【确定】。结果显示在【查看】窗口中。步骤4：解释结果组统计量表输出的第一个表格显示每个治疗组的描述统计量，包括样本量、平均值、标准差和标准误差。注意到认知行为治疗样本的抑郁分数均值（均值=45.00）比精神分析治疗样本（均值=56.00）的低。我们稍后将会考虑这两组之间的差异对具有统计显著性而言是否足够大。独立样本检验表第二个表格“独立样本检验表”显示在“均值相等的t检验"之后的“假设方差相等”栏中的结果。方差方程的 Levene 检验 “方差方程的 Levene 检验"检验两个治疗组的总体方差是否相等，这是独立样本t检验的一个假设。SPSS使用个由Levene开发的方法来检验总体相等的假设。 Levene检验的原假设和对立假设是： H0:σ²精神分析=σ²认知行为（两组的总体方差相等） H1：σ²精神分析≠σ²认知行为(两组的总体方差不相等） T检验 “组统计表”提供了两个治疗组（精神分析与认知行为）的均值。如果原假设被拒绝，我们就可以根据该表确定哪一组的抑郁分数均值较低。组统计量 therapy N 均值标准差均值的标准误 depression psychoanalytic 15 56.0000 9。41883 2.43193 cognitive-behavioral 15 45.0000 7。63451 1。97122 独立样本检验方差方程的 Levene 检验均值方程的 t 检验 F Sig。 t df Sig.（双侧）均值差值标准误差值差分的 95％置信区间下限上限 depression 假设方差相等。311 .582 3。514 28 。002 11。00000 3.13050 4。58747 17.41253 假设方差不相等 3。514 26。850 。002 11.00000 3。13050 4。57507 17。42493 因为0.02的p值小于0.05，所以两组均值相等的原假设被拒绝。根据“组统计量表”中确定哪一组的抑郁分数均值较低（认知行为组较低）。相等方差的Levene检验的p值。如果p≤0.05，我们假设方差不相等（读t的结果中的底部数值）。如果p＞0.05，我们假设方差相等（读t的结果中的顶部数值）。因为0.582的p值大于0.05，所以我们假设方差相等，解释t检验结果上面一行（假设方差相等）。四、相依样本T检验在对某种程度上相关的两个样本的均值进行比较时，我们可以使用相依样本t检验（也称为配对样本t检验，重复测量t检验，匹配样本t检验等）。在相依样本t检验中．两个样本可能包含同一个人在两个不同时刻进行侧量或者两个有联系的人分别测量的结果（例如，双胞胎的IQ,妻子与丈夫的沟通质量）。准确定义相依样本t检验的关健在于记住两样本间要在某方面存在自然联系．下面给出一个相依样本t检验的例子。一个国家选举机构的工作人员负责通过民意调查来决定经济和国家安全哪个议题对于选民更重要。有25个选民被调查以确定两个议题的重要性等级，每个议题用1—7的等级表示（1=一点也不重要，7=极其重要)。自变量是投票议题（经济、国家安全），（因）变量是重要性等级. 在研究中,基本的兴趣问题也可以用研究问题的方式表示，例如， “对选民来说经济重要性等级和国家安全是否存在不同？” 数据步骤1：生成变量 1．打开spss。 2．点击【变量视图】标签。在spss中将生成的两个变量，分别用于经济等级和国家安全。两个变量分别命名为economy和security。 3．在【变量视图】窗口前两行分别输入变量名称economy和security。（见图）. 步骤2:输入数据 1．点击【数据视图】标签.变量economy和security出现在【数据视图】窗口的两列. 2．为每个参与者输入两个变量的数据。对第一个参与者，为变量economy和security分别输入等级5和7。依次输入全部25个参与者的数据。步骤3：分析数据 1．从菜单栏中选择【分析>比较均值>配对样本 T 检验】。打开【配对样本 T 检验】对话框，变量economy和security出现在对话框的左边。 2．选择因变量economy和security，点击向右箭头按钮(►）把变量移到【成对变量】框中。 3．点击【确定】。在spss中运行相依样本t检验程序，结果显示在“查看”视窗中。步骤4:解释结果成对样本统计量输出的第一个表格“成对样本统计量”显示了economy和security的描述统计量、包括样本量、平均值、标准差和标准误差。请注意,经济的平均重要性等级(均值=5.76）比国家安全（均值=4.60）的高.我们稍后将会考虑这两个平均等级之间的差异（5。76对4。60）是否大到足以具有统计显著性。成对样本相关系数表格“成对样本相关系数”除了提到这个相关性等于25个参与者对于经济和国家安全的等级之间的皮尔逊相关系数外，对于解释配对样本t检验不是重要的. 成对样本检验表格“成对样本检验”为我们的研究问题提供了答案，就是经济和国家安全的重要性等级间是否存在差异。原假设的检验是以t的形式显示的,这里 T检验成对样本统计量均值 N 标准差均值的标准误对 1 economy 5。7600 25 1。16476 .23295 security 4。6000 25 1。77951 。35590 表格“成对样本统计量”提供了两个变量（economy和security）的均值。如果原假设被拒绝，我们将查阅这个表格以决定哪个变量有更高的均值。成对样本相关系数 N 相关系数 Sig。对 1 economy ＆ security 25 。253 。222 成对样本检验成对差分 t df Sig。(双侧) 均值标准差均值的标准误差分的 95％置信区间下限上限对 1 economy — security 1.16000 1。86369 。37274 .39071 1。92929 3。112 24 。005 因为p值为0.005，小于0.05，原假设被拒绝。均值1.16等于economy和security均值间的差（5.76-4.60=1.16）. 五、χ²独立性检验（一）双因素卡方检验双因素卡方检验法常用来检验两个因素是否互相独立.如果不是互相独立，就是互相联系。做出零假设(H0）,两个因素互相独立，没有联系;备择假设(H1)两个因素不互相独立。如果p﹥0。05或0。01，接受原假设，互相独立；相反，如果p﹤0.05或0.01，拒绝原假设，说明两事件有联系。（小拒绝大接受）（A）2×2表卡方检验例子一位研究员想调查性格类型（个性内向的人、个性外向的人）和休闲运动的选择（逛游乐园、休息一天）是否有关系.他对100名答应参与这项研究的人做了性格测试，并且基于测试的分值把他们分为性格内向的人和性格外向的人，然后要求每个参与者在逛游乐园和休息一天两者之中选择更喜欢的休闲方式。图表5-1描述了每个参与者的性格类型和选择的休闲方式: 因为性格类型和休闲方式都有两个水平,得到四个单元，当前的例子为2×2卡方表. 分析：零假设为2×2列联表中列一“性格类型”与列二“休闲方式"之间独立.如果p<0。05,则拒绝零假设；如果p>0。05，则接受零假设。步骤1：生成变量 1．打开spss。 2．点击【变量视图】标签。在SPSS中将生成三个变量，一个是不同的性格类型，一个是休闲方式，一个是频数。这三个变量分别命名为personality，activity和frequency。 3．在【变量视图】窗口前三行分别输入变量名称personality，activity和frequency。 4．为分类变量personality和activity建立变量值标签,对于personality，l=“内向”，2=“外向”。对于activity,1=“逛游乐园”，2=“休息”。步骤2：输入数据接下来,我们在spss中输入数据。χ²独立性检验有两种不同的数据输入方法：加权方法和个体观测值方法.当数据在每个单元的频数统计出来时，应采用加权方法。由于在我们的例子中，单元中的频数已经被统计出来(如图表1），我们将采用加权方法来输入数据。在我们的例子中,内向性格和外向性格的人可以进择逛游乐园和休息中的一个，于是产生了四种不同情况（内向／逛游乐园、内向／休息、外向／逛游乐园、外向／休息)。由于我们采用加权方法来输人数据，我们需要在【数据视窗】窗口为这四种情况的每一种创建单独的一行.用加权方法建立的数据文件结构如图表所示。输入数据 1．点击【数据视图】标签。变量personality，activity和frequency出现在【数据视图】窗口的前三列。按照图表，第一种情况对应于内向（1）且选择逛游乐园(1）的人，总共有12个人，这些值应该被输入【数据视图】窗口的第一行。 2．在【数据视图】窗口的第一行对personality，activity和frequency分别输入l，1和12,在【数据视图】窗口的2～4行输入剩下的三种情况（在第2行输入l，2和28，在第3行输入2,1和43，在第4行输入2，2和17)。图表中给出了完整的数据文件。步骤3：分析数据在执行χ²检验之前,我们首先需要对frequency进行加权。加权表明给定变量的值表示观测总次数，而不仅仅是一个分数值。例如，对frequency进行加权时，frequency取值为12代表12个人，而不是分数为12。对frequency进行加权 1．在菜单栏中选择“数据>加权个案”。 2．打开【加权个案】对话框.选择“加权个案”并选择变量frequency，点击向右箭头按钮（►)，把frequency移到“频率变量”框中。 3．点击“确定"。这表示在每个类别中频数的取值（12，28，43和17)对应于每个单元的所有参与者，而不仅仅是一个分数。通过对frequency进行加权，现在我们可以在SPSS中执行χ²独立性检验。执行χ²独立性检验 1．在菜单栏中选择“分析〉描述统计>交叉表"。打开【交叉表】对话框，变量personality,activity和frequency出现在对话框的左侧。 2．选择personality，点击向右箭头按钮〔►)，把变量移到“行”框。 3．选择activity，点击向右箭头按钮（►）,把变量移到“列”框中。 4．点击。打开“交叉表：统计量”对话框，选择“卡方”。 5．点击“继续”。 6．点击“单元格”。打开“交叉表：单元显示”对话框,在“计数”下选择“观察值”“期望值”；在“百分比"下选择“行”. 7．点击“继续”. 8．点击“确定”。步骤4：解释结果交叉表案例处理摘要案例有效的缺失合计 N 百分比 N 百分比 N 百分比 personality * activity 100 100.0% 0 。0% 100 100.0% personality＊ activity 交叉制表 activity 合计 amusement park retreat personality introvert 计数 12 28 40 期望的计数 22。0 18。0 40。0 personality 中的 % 30.0％ 70。0% 100.0% extrovert 计数 43 17 60 期望的计数 33。0 27。0 60。0 personality 中的 % 71。7% 28.3％ 100。0％合计计数 55 45 100 期望的计数 55.0 45。0 100.0 personality 中的 % 55.0％ 45。0% 100。0％卡方检验值 df 渐进 Sig. (双侧）精确 Sig.(双侧) 精确 Sig.(单侧) Pearson 卡方 16。835a 1 。000 连续校正b 15。194 1 .000 似然比 17.230 1 .000 Fisher 的精确检验。000 。000 线性和线性组合 16.667 1 。000 有效案例中的 N 100 a. 0 单元格(。0%）的期望计数少于 5。最小期望计数为 18.00。 b. 仅对 2x2 表计算 P值小于0.05，所以拒绝原假设（小拒绝），两个事件不独立，即性格类型与休闲方式的选择有关。（B）（r×c) 列联表的卡方检验当列联表不是2×2交叉表的时候，要判断总体的变量是否彼此独立，这时候自由度：df=（r—1）（c—1）. 列联表形式(r×c） x y 列(c）合计 1 2 3 …… C 行（r） 1 2 3 - — - r O11 O21 O31 Or1 O12 O22 O32 Or2 O13 O23 O33 Or3 …… …… …… O1c O2c O3c Orc O1 O2 O3 Or 合计 n1 n2 n3 …… nc n 方法同2×2卡方表，只是增加列、行的数量。如：《应用语言学实验方法》一书83页的例子。分析：零假设为:列一“第一语言背景”与列二“冠词错误频数”之间独立.如果p<0。05，则拒绝零假设,反之，则接受零假设。(小拒绝,大接受）经过计算，结果如下： p=0.525 接受原假设，即: 在spss中的计算方法。步骤1：建立变量【变量视图】中同样输入“错误类型”、“语言背景"和“频数”三行. 然后，分别对“错误类型”和“语言背景”标签赋值。步骤2：输入数据在【数据视图】中输入数据。注意按照列联表的对应情况,分别为“错误类型”和“语言背景"中输入1～4、1～2的值。并将它们在列联表中的频数值,输入第三列“频数"中. 步骤3:分析数据因为“频数”一列中的数值是频率数，所以先为它加权. 执行χ²独立性检验 1．在菜单栏中选择“分析>描述统计>交叉表". 2．选择“语言背景”，点击向右箭头按钮〔►)，把变量移到“行”框。 3．选择“错误类型”,点击向右箭头按钮（►），把变量移到“列”框中。 4．点击“确定"。步骤4：解释结果交叉表［数据集3] 案例处理摘要案例有效的缺失合计 N 百分比 N 百分比 N 百分比语言背景 * 错误类别 100 100.0% 0 .0% 100 100。0％语言背景* 错误类别交叉制表错误类别合计 the a an 无语言背景汉语计数 12 14 6 8 40 期望的计数 13.6 15。2 5.6 5.6 40。0 语言背景中的％ 30.0％ 35.0% 15。0% 20.0% 100。0% 日语计数 22 24 8 6 60 期望的计数 20.4 22.8 8。4 8。4 60。0 语言背景中的％ 36.7％ 40。0％ 13.3％ 10。0％ 100.0% 合计计数 34 38 14 14 100 期望的计数 34.0 38.0 14。0 14.0 100。0 语言背景中的 % 34。0% 38.0％ 14.0% 14.0％ 100.0% 卡方检验值 df 渐进 Sig. （双侧) Pearson 卡方 2.234a 3 P值>0.05，所以接受原假设（大接受）。即学生所犯错误与第一语言背景无关。。525 似然比 2。194 3 .533 线性和线性组合 1。845 1 .174 有效案例中的 N 100 a. 0 单元格(。0％）的期望计数少于 5。最小期望计数为 5。60。（二）单因素χ²检验法单因素χ²检验法是将收集到的数据按频数分组,然后检验频数的分布是否与某个概率分布模式拟合.例如，在某英语测验中，已测得各分数段的频数，要检验分数的频数分布是否与正态分布、均匀分布或其他分布拟合。我们以《应用语言学实验方法》一书中的例子（79页)，说明如何用spss进行单因素χ²分析。注意：单因素卡方检验的零假设不是“独立性"假设，我们可以将它变换成类似独立性问题的假设.在本例中，三组学生的选择问题如果是“独立”的，就是它们之间互不影响，选择方面均匀分布,各占1/3。即：“专业倾向没有差别”。统计结果中，如果p<0。05，拒绝零假设(=有差别）；如果p〉0。05，接受原假设（=无差别）。 Spss中的实现: 步骤1：建立变量 1．打开spss。 2．点击【变量视图】标签。 3．在【变量视图】窗口前三行分别输入变量名称“类别”,“人数”. 4．为分类变量“类别"建立变量值标签，对于“类别”，l=“文学",2=“语言学”，3=“外语"。结果如下：步骤2：输入数据 1．点击【数据视图】标签。变量“类别"和“人数”出现在【数据视图】窗口中。 2．在【数据视图】窗口的第一行“类别"中分别输入l,2和3，在“人数”输入48，42和30。步骤3：分析数据在执行χ²检验之前,我们首先需要对“人数”进行加权。加权表明给定变量的值表示观测总次数，而不仅仅是一个分数值。取值为48代表48个人，而不是分数为48。对“人数”进行加权 1．在菜单栏中选择“数据>加权个案”。 2．打开【加权个案】对话框。选择“加权个案"并选择变量“人数”，点击向右箭头按钮(►)，把“人数”移到“频率变量”框中。 3．点击“确定”. 执行χ²检验 1．在菜单栏中选择“分析〉非参数检验〉旧对话框〉卡方”。打开【卡方】对话框，变量“类别”和“人数”出现在对话框的左侧. 2．选择“人数”，点击向右箭头按钮〔►）,把变量移到“检验变量列表”框。 3．选择“选项”，出现“卡方检验：选项”。勾选“描述性"，然后点。 4．点击“确定"。步骤4：解释结果描述性统计量 N 均值标准差极小值极大值人数 120 41.4000 7。10356 30.00 48。00 卡方检验频率人数观察数期望数残差 30.00 30 40.0 -10。0 42.00 42 40。0 2.0 48.00 48 40。0 8.0 总数 120 检验统计量人数卡方 4.200a df 2 渐近显著性。122 p值=0.122>0.05，所以，接受原假设（大接受），学生的专业选择没有明显性差别。 a。 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 40.0。

展开阅读全文