1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Company Logo,LOGO,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Company Logo,SPSS统计分析 平均数差异检验,重点班的学生和一般学生的平均智商是否有差异呢?要解决这个问题就可以运用本章将要介绍的平均
2、数差异检验的方法。,4.1,假设检验原理,假设检验(,hypothesis testing,)是推论统计中的重要内容,是指先提出一个假设,一般是对总体参数或总体分布形态的假设,然后通过检验样本统计量的差异来推断总体参数之间是不是存在差异。因为在现实调查研究中,往往由于各种限制而无法得到总体的参数。,例如要调查汉族和蒙古族,7,岁儿童的运算能力是否存在差异,不可能对所有的汉族和蒙古族,7,岁儿童进行测试,只能通过合理的抽样,然后对样本进行调查。这样得到的参数就是样本参数,通过对样本的参数进行检验从而推测汉族,7,岁儿童总体和蒙古族,7,岁儿童总体在运算能力上是否有差异。,4.1.1,假设与假设检
3、验,在统计学中,假设一般用来指对总体参数所做的假定性说明。,在统计学上有两种假设,一种称为虚无假设(,null hypothesis,),或叫做零假设,记为,H,0,;一种称为备择假设(,alternative hypothesis,),或叫做对立假设,记为,H,1,。,H,1,是研究者提出的研究假设。,在统计学上,只能对虚无假设,H,0,进行直接的检验。假设检验的任务就是先假设,H,0,是真的,然后以此为前提,如果有不合理的现象出现则说明假设是错误的,即,H,0,为真这一假设是不成立的,要被拒绝。如果,H,0,为假,就要拒绝,H,0,并接受,H,1,,则研究者的假设成立;如果,H,0,为真,
4、就要接受,H,0,并拒绝,H,1,,则研究者的假设不能成立。这就是统计学上的“反证法”。,H,1,称为备择假设就是指其是预备当,H,0,被拒绝时以供选择的。虚无假设和备择假设互相排斥并且只有一个正确,因此,H,1,又称为对立假设。,4.1.2,假设检验中的小概率事件,小概率事件就是指一个发生概率接近零的事件,也就是一般情况下不会发生的事件。,4.1.3,假设检验的两类错误,虽然小概率事件发生的可能性很小,但仍有发生的可能。,若设定临界概率为,0.05,,从某一平均数为,0,的总体中抽取任一样本,样本平均数为。当没有落入总体分布两端,5%,概率的范围内,如图阴影部分所示。,然而,即使概率再小(如
5、0.01,)、临界区域的面积再小,任意抽取的仍有,1%,的概率落入临界区域,即这种小概率事件的发生仍有,1%,的可能性是合理的。这时,H,0,是真的,然而依据假设检验的统计逻辑却要拒绝,H,0,,这样就犯错误了。统计学中将这类不该拒绝,H,0,却拒绝了,H,0,的错误称为,型错误(,typeerror,),因为常用,表示概率,所以又常称为,型错误。这种错误往往导致虚假的科学发现。,如图所示,是,H,0,为真时和,H,1,为真时的分布,两个分布是有重合的。,在这个阴影部分中既有可能是,H,0,为真也有可能,H,1,为真。但是我们拒绝了,H,1,为真的可能性,这就可能又犯错误了。统计学中将这类
6、不该拒绝,H,1,却拒绝了,H,1,的错误称为,型错误(,type error,),这类错误的概率用,表示,所以又称,型错误,这类错误往往导致科学发现被埋没。,4.1.4,单侧检验和双侧检验,根据是否强调检验的方向性,将检验分为单侧检验和双侧检验。双侧检验只关心两个总体参数之间是否有差异,而不关心谁大谁小。,4.1.5,假设检验的步骤,假设检验一般包括以下五个步骤:,(,1,)根据研究问题的要求提出假设,包括虚无假设,H,0,和备择假设,H,1,。,(,2,)选择合适的检验统计量。,(,3,)根据需要选择显著性水平,。,(,4,)计算出检验统计量。,(,5,)根据检验统计量做出统计决策。,4.
7、2,均值比较,介绍了一定的假设检验的统计学知识,下面将具体讲解在,SPSS18.0,中如何利用假设检验的思想对平均数的差异进行检验。在,SPSS18.0,中,是由“分析”,|“,比较均值”下的子菜单完成各种情况下的平均数差异检验的。先从最基本的“均值过程”进行介绍。,4.2.1,均值比较的主要功能,均值过程和前面的描述统计过程一样,可以对指定变量的描述性统计变量进行呈现。,4.2.2,均值比较的适用条件,均值过程主要功能是统计变量的描述和不同组之间粗略的比较,因此对数据没有什么要求。需要注意的是用来形成分组的变量应该是能明确表明某种特征的变量。另外均值过程中有一个对数据进行线性检验的功能,由“
8、选项”对话框中的“线性相关检验”功能实现,这要求在第一层的控制变量要不少三个水平。,4.2.3,均值比较的操作过程,在,SPSS,中均值比较的操作过程如下:,(,1,)打开或建立数据文件。,(,2,)选择“分析”,|“,比较均值”,|“,均值”命令,打开“均值”主对话框,如图所示。,(,3,)选择因变量:对话框左面是源变量框,其中罗列了数据文件中已命名的变量,从中选择作为因变量的变量,单击上方的箭头按钮,该变量进入“因变量列表”框。因变量可以根据需要选择一个或多个变量。,(,4,)选择自变量:在源变量框中选择作为自变量的变量,即分组变量。单击下面的箭头按钮,该变量进入“自变量列表”框。首先选择
9、的自变量默认为第一层控制变量,若单击“下一张”按钮,可以再选择其他变量作为第二层控制变量。,(,5,)选择描述性统计量:单击“选项”按钮,出现“选项”对话框,如图所示。,(,6,)选择进行单因素方差分析或线性相关性检验:在“选项”对话框的下方有两个复选按钮,分别是,Anova,表 和,eta,、线性相关检验,前者对第一层的自变量进行单因素方差分析和计算变量相关程度的,eta,值;后者在第一层自变量有三个以上水平时对其进行线性相关性检验。,(,7,)设置完成后,单击“继续”按钮返回均值主对话框,单击“确定”按钮,执行操作,输出结果。,4.2.4,实例分析:某普通高校本科生自尊平均水平,在某普通高
10、校随机抽取,152,名本科生,运用缺憾感量表对其自尊水平进行测量,收集测验数据。部分数据如下所示:,1,描述不同性别学生自尊的平均水平,解:在该案例中,因变量是被试的缺憾感量表的得分,即自尊水平;自变量是被试的性别和专业。要描述不同性别学生的自尊平均水平,可以直接由均值比较的操作实现。,操作过程,(1),创建新的数据文件:变量包括被试的性别、专业和自尊。,(2),打开主对话框并完成变量选择:选择“分析”,|,“比较均值”,|,“均值”命令,打开“均值”对话框。将因变量“自尊”选入“因变量列表”框中,将分组变量“性别”选入“自变量列表”框中,如图所示:,(3),选择描述性统计量:单击“选项”按钮
11、打开“选项”对话框。因为系统已将均值作为默认的描述统计量,因此可以不做其他选择。单击“继续”按钮,返回“均值”主对话框。,(4),单击“确定”按钮,执行操作,输出结果。,结果分析,(1),案例处理摘要表:,结果首先呈现的是案例处理摘要表。该表格呈现了在均值比较中参与统计分析的案例和排除的案例的个数和所占的百分比。如下表所示,有,152,个数据个案参与统计处理,占总个案数的,100%,,剔除的个案数为,0,。,(2),均值比较结果报表:,均值比较结果报表呈现了不同分组的描述性统计量变量,便于直观比较。如下表所示,分别呈现了女生和男生自尊的平均水平,女生共有,85,人参与检验,平均自尊得分是,1
12、58.65,,标准差为,27.230,;男生共有,67,人参与检验,平均自尊得分是,173.00,,标准差为,28.410,;所有参与比较的被试的总数为,152,,自尊平均值是,164.97,,标准差为,28.572,。,2,描述不同性别和不同专业的学生的自尊平均水平,解:在该案例中,如果要描述不同性别和不同专业学生的平均自尊水平,需要有两层分组,分别以“性别”和“专业”为分组变量,可以通过均值比较中添加分组层次的功能来实现。,操作过程,(1),打开数据文件。,(2),打开主对话框并完成变量选择:选择“分析”,|,“比较均值”,|,“均值”命令,打开“均值”主对话框。将因变量“自尊”选入“因变
13、量列表”框中,将分组变量“性别”选入“自变量列表”框中。单击“下一张”按钮,选择“专业”进入“自变量列表”框中作为第二层分组变量,如图所示:,(3),选择描述性统计量:选择描述性统计量:单击“选项”按钮,打开“选项”对话框。因为系统已将均值作为默认的描述统计量,因此可以不做其他选择。单击“继续”按钮,返回“均值”主对话框。,(4),单击“确定”按钮,执行操作,输出结果。,结果分析,结果除了呈现案例处理摘要表,还呈现了均值结果报表,如下表所示。从该统计报表中不仅可以分别看出女生和男生的平均自尊得分,还可以进一步看到不同专业的女生和男生的平均自尊得分,以及不同专业学生总体的平均自尊得分。例如哲学专
14、业女生共有,26,人,平均自尊得分为,151.46,,标准差为,20.120,;心理学专业的学生共有,111,人,平均自尊得分为,167.06,,标准差为,29.601,。,4.3,单一样本,T,检验,4.2,节所介绍的均值过程可以呈现分组变量的平均值等描述统计量,将不同的组进行一个直观的比较。在以下的三节中将介绍的检验方法有单样本,T,检验、独立样本,T,检验、配对样本,T,检验,根据数据的特征,选择运用合适的检验方法。,4.3.1,单一样本,T,检验的主要功能,单一样本,t,检验是比较某一样本的平均数与某一确定总体均值是否有统计学意义上的差异。用样本的平均数来估计样本所代表的未知总体的平均
15、数,通过检验样本平均数与确定总体平均数值是否存在差异来推论未知总体是否和确定总体一致。,4.3.2,单一样本,T,检验的适用条件,当确定均值的总体的条件不同时,如总体是否为正态分布以及总体方差是否已知,所适用的单一样本平均数差异检验的方法是不同的。,4.3.3,单一样本,T,检验的操作过程,在,SPSS,中进行单一样本,t,检验的操作过程如下:,(,1,)打开或建立数据文件。,(,2,)打开主对话框:选择“分析”,|“,比较均值”,|“,单样本,T,检验”命令,打开“单样本,T,检验”主对话框,如图所示。,(,3,)选择变量:在左边的源变量列表框中选中要进行单一样本,t,检验的变量名,单击中间
16、的箭头按钮,使选中的变量进入右边的“检验变量”列表框中。,(,4,)输入检验值:在“检验变量”列表框下方的“检验值”文本框中填入要进行检验的确定的均值。,(,5,)设置置信度、选择缺失值处理方法:单击“选项”按钮,打开“选项”对话框,如图所示。,(,6,)设置完成后,单击“继续”按钮返回单样本,t,检验主对话框,单击“确定”按钮,执行操作,输出结果。,4.3.4,实例分析:全国各地区城市园林绿地面积,2008,年的全国调查显示中国各地区平均城市园林绿地面积约为,56300,公顷。假设,2010,又进行一次全国各地区城市园林绿地面积的调查,试检验,2010,年各地区城市园林绿地面积与,2008,
17、年全国平均城市园林绿地面积是否有差异。,解:在本案例中,要检验,2010,年各地区城市园林绿地面积与,2008,年全国平均城市园林绿地面积(已知值:,56300,公顷)是否有差异,即某一样本数据与某一确定均值进行比较。虽然不知道总体分布是否是正态,但样本较大(,N=30,),狂热以运用单样本,T,检验。,1,操作过程,(1),建立数据文件,:,将调查获得数据输入数据文件中,如下表所示,单位(公顷)。,(2),打开主对话框:选择“分析”,|“,比较均值”,|“,单样本,T,检验”命令,打开“单样本,T,检验”主对话框。,(3),选择变量:将变量列表框中“绿化面积”变量移入右边的“检验变量”列表框
18、中。,(4),输入检验值:在“检验变量”列表框下方的“检验值”文本框中填入检验均值,56300,,如图所示:,(5),单击“确定”按钮,执行操作,输出结果。,2,结果分析,(1),描述性统计量表:该表格呈现了单个样本的描述性统计量的值,包括参与统计的单个样本的个案数(,N,)、均值、标准差和均值的标准误。如下表所示,共调查了中国,30,个地区,平均城市园林绿地面积为,58030.63,公顷,标准差为,69705.957,,标准误为,12726.508,。,(2),单样本,T,检验结果报表:该样本呈现了单样本,T,检验的结果,包括,T,值、自由度(,df,)、检验的概率(,Sig.,)、均值差值
19、以及差分的,95%,置信区间。如下表所示,本案例,T,检验的,T,值为,0.136,,自由度,df=29,,双侧,T,检验的概率,Sig.(,双侧,)=0.893.,由于显著性水平为,0.05,,而,0.8930.05,,因此接受虚无假设,即,2010,年调查所得各地区平均城市园林绿地面积,与,2008,年调查所得的全国平均城市园林绿地面积,56300,公顷无显著差异。,T,检验对应的置信区间的公式为:,则,2010,年全国平均城市园林绿地面积,95%,的置信区间,=,均值(,58030.63,),1.96,标准误(,12726.508,),,即,33086.67432,82974.5856
20、8,,这个置信区间与给定均值之差为,33086.67432-56300,82974.58568-56300,,即,-23213.32568,26674.58568,。这和下限和上限中的数据相对应,有些,微的误差。,4.4,两独立样本,t,检验,4.3,节已经介绍了单样本,T,检验一般用来检验单样本均值与确定的总体均值是否存在显著差异,即检验某一样本是否来自已知总体。那么如何检验两个样本的均值是否有显著性差异呢?对于两个样本均值的差异检验,推断统计的逻辑是由两个样本的平均数差异来推断它们所代表的两个总体的平均数之间是否存在显著差异。两个样本平均数差异检验所要考虑的检验条件要比单样本,T,检验复杂
21、不但要考虑两个样本所代表的总体是否正态分布,总体方差是否已知,还要考虑两个总体的方差是否齐性,两个样本是独立样本还是相关样本,两个样本的容量是否相同等问题。当数据的条件不同时,所适用的检验方法也是不同的。,本节主要介绍在,SPSS 18.0,中如何进行独立样本,T,检验的操作。,4.4.1,两独立样本,t,检验的主要功能,在两个样本平均数差异检验中,根据两个样本是否相关,分为独立样本和配对样本。独立样本是指两个样本的数据之间没有关联性,即两个样本中的任一数据的获取不会受到两个样本中其他任何数据的影响,是独立的。两独立样本,t,检验就是用来检验两个独立样本的均值之间是否显著差异,即检验两样本所
22、代表的总体的均值是否相同。,4.4.2,两独立样本,t,检验的适用条件,进行两独立样本平均数差异检验时要先检验两个样本所代表的总体方差是否已知,以及方差是否齐性。当两个总体的方差未知时,需要用样本的方差来作为总体方差的无偏估计量,需要用,t,检验。当两个总体的方差未知且不齐性时,需要运用,Cochran-Cox-test,来进行检验。具体统计学知识在此不做赘述。,4.4.3,两独立样本,t,检验的操作过程,在,SPSS,中进行两独立样本,t,检验的操作过程如下:,(,1,)打开或创建,SPSS,数据文件。,(,2,)打开主对话框:选择“分析”,|“,比较均值”,|“,独立样本,T,检验”命令,
23、打开“独立样本,T,检验”主对话框。如图所示。,(,3,)选择变量:从左边的源变量框中选中需要检验的一个或多个变量,单击中间上面一个箭头按钮,使检验变量进入“检验变量”列表框中。从左边的源变量框中选中分组变量,单击下面一个箭头按钮,使之进入“分组变量”列表框中。,(,4,)定义分组变量:单击“定义组”按钮,打开“定义组”对话框,有两个复选框,对应两种定义分组变量的情况,如图所示。,使用指定值,单选按钮:这是默认的定义方法,当分组变量有两个水平时,一般选用这种方法,如性别:男、女。在组,1,和组,2,后面的文本框中填入分组变量的值。若在数据中分别用,1,代表女、用,2,代表男,则在,组,1,文本
24、框中填,1,,在,组,2,文本框中填,2,。,割点,单选按钮:当分组变量有,3,个及以上水平时,一般选用该定义方法。在,割点,文本框中输入一个数值,系统将全部数据分为分组变量数值小于割点值和大于等于割点值两组,再对这两组进行两独立样本,T,检验。若分组变量有,3,个水平,在,割点,文本框中输入,2,,则将分组变量的数值等于,1,的分为一组,将分组变量的数值等于,2,和,3,的分为一组。,(,5,)设置置信度、选择缺失值处理方法:定义好分组变量后,单击“继续”按钮,返回“独立样本,T,检验”主对话框。单击“选项”按钮,进入“选项”对话框。其中,“置信区间百分比”文本框是用来设定设定检验的置信度的
25、默认的为,95%,,“缺失值”复选框是用来选择用哪种方式处理包含有缺失值的变量的。,(,6,)设置完成后,单击“继续”按钮返回独立样本,t,检验主对话框,单击“确定”按钮,执行操作,输出结果。,4.4.4,实例分析:某大学超市会员卡消费情况,假设某大学超市要调查该校学生一年在该超市用超市会员卡消费情况,随机抽取,255,名学生的消费情况,试检验该大学学生一年在该超市使用超市会员卡的消费金额是否存在性别差异。,解:在该案例中,需要将男生消费情况与女生消费情况进行比较,检验差异是否显著。男生的消费数据和女生的消费数据是两个相互独立的样本,且样本容量较大,可以认为两总体分布近似正态,因此选用两独立
26、样本,T,检验来检验二者是否存在显著差异。在创建的文件中需要两个变量,一个是自变量,即本案例中的,性别,;另一个是因变量,即本案例中的,消费金额,。,1,操作过程,(,1,)创建数据文件:将调查获得数据输入数据文件中,部分数据如下所示,单位(元)。,注:,性别,一栏中,1,代表女生,,2,代表男生。,(,2,)打开主对话框:选择,分析,|,比较均值,|,独立样本,T,检验,命令,打开,独立样本,T,检验,主对话框。,(,3,)选择变量:从左边的变量列表框中选择,“,消费,”,作为检验变量,单击上方箭头按钮,将其移入,“,检验变量,”,列表框中。从变量列表框中选择,“,性别,”,作为分组变量,单
27、击下方箭头按钮,将其移入,“,分组变量,”,列表框中,如下图所示。,(,4,)定义分组变量:单击,“,定义组,”,按钮,弹出,“,定义组,”,对话框,在默认的,“,使用指定值,”,单选按钮下,在,“,组,1”,文本框中填,1,(代表女生),在,“,组,2”,文本框中填,2,(代表男生),如下图所示。,(,5,)设置完成后,单击,继续,按钮返回,独立样本,T,检验,主对话框,单击,确定,按钮,执行操作,输出结果。,2,、结果分析,(,1,)描述性统计量表:该表格分别呈现了分组变量的简单描述性统计量,包括参与检验数据的个案数(,N,)、均值、标准差和均值的标准误。如下表所示,是对分析变量,性别,的
28、简单描述统计。从表中可以看出随机抽取的女生样本容量为,131,,平均消费金额是,1817.2214,,标准差是,338.69831,,标准误是,29.59221,。读者同样也可以看出男生样本相关描述性统计量。,(,2,)独立样本,T,检验结果报表:该表呈现的是对两独立样本进行,T,检验的结果,包括方差齐性检验的,F,值和概率,,T,检验的,t,值、自由度(,df,)和检验的概率,均值的差值,标准误差值和差分的,95%,置信区间。如下表所示,是对男生组和女生组的消费金额进行独立样本,T,检验的结果。,方差齐性检验:前面已介绍了两独立样本,T,检验要对两样本代表的总体进行方差齐性检验,在方差齐性和
29、方差不齐性两种情况下所运用的检验方法是不同的。在,SPSS,独立样本,T,检验输出的统计报表中,会分别呈现在方差无显著性差异和方差有显著性差异下的检验值。如表,4-10,所示,,假设方差相等,所对应的一行数据是在方差无显著性差异条件下的各统计量的值,,假设方差不相等,所对应的下面一行数据是在方差有显著性差异条件下的各统计量的值。表格中,方差方程的,Levene,检验,下呈现的是检验方差齐性的,F,值(,0.105,)和显著性概率,p,(,0.747,)。因为,P0.05,,接受,F,检验的虚无假设,H0,,即两总体的方差无显著性差异。所以以下皆参照,假设方差相等,所对应的一行数据。,两独立样本
30、T,检验的值为,t=0.086,,自由度,df=253,,双侧检验显著性概率,P=0.9310.05,,因此接受两独立样本,T,检验的虚无假设,即两个样本所代表的总体的平均数相同,男生和女生在该学校超市使用会员卡消费的金额没有显著性差异。,均值差值,=3.72944,为两个组的平均数之差,说明样本中女生的消费金额比男生高,3.72944,元,但这种差异是不显著的。标准误差值,=43.19812,。其中差值的,95%,置信区间的,上限,和,下限,中的数据的意义,可以参阅,4.3.4,节的实例分析。,4.5,两配对样本,t,检验,两样本平均数差异检验,根据两个样本数据之间是够有关联性,分为独立样
31、本和配对样本。独立样本是指两个样本的数据之间没有关联性,而配对样本,也称相关样本,是指两个样本的数据之间存在一一对应的关系。两个样本中的一对数据是有某种关联性的。例如在配对组实验中或在对同一样本前测后测实验中获得的数据。本节将对配对样本,t,检验的一些统计原理和在,SPSS18.0,中的操作进行介绍。,4.5.1,两配对样本,t,检验的主要功能,两配对样本,t,检验是对两个配对样本的平均数之间进行差异检验。配对样本一般来自配对组或是同对一个样本的两次施测,而配对组是可以认为是两个同质的组,因此来自配对组的两个数据也是有关联的。,4.5.2,两配对样本,t,检验的适用条件,对两配对样本进行平均数
32、差异检验,需要考虑数据的各种条件,如两总体是否正态分布,两总体方差是否已知以及相关系数是否已知,从而选择合适的检验的方法。与两独立样本差异检验不同,两配对样本差异检验不用事先进行方差齐性检验,因为配对样本的数据是成对数据,可以认为方差一致。,4.5.3,两配对样本,t,检验的操作过程,在,SPSS,中进行两配对样本,t,检验的操作过程如下:,(,1,)打开或创建,SPSS,数据文件。,(,2,)打开主对话框:选择“分析”,|“,比较均值”,|“,配对样本,T,检验”命令,打开“配对样本,T,检验”主对话框,如图所示。,(,3,)选择变量:对话框左边是源变量框,右边是“成对变量”列表框,该列表框
33、中,“对”下显示的是配对组的序号,,Variable 1,和,Variable 2,下将分别显示选中的配对的两个变量名。在左边的源变量框中单击选中参与配对的一个变量名,单击中间的箭头按钮,使变量进入“成对变量”列表框中。该变量名将出现在“成对变量”列表框中的第一组配对组的,Variable 1,下。再从左边的源变量框中选中另一个参与配对的变量名,单击箭头按钮,该变量名将出现在“成对变量”列表框中的第一组配对组的,Variable 2,下。,当第一组变量配对完成后,,成对变量,列表框中的,对,下自动跳出第二组的序号。可以根据需要依照上述方法指定多组配对变量。,(,4,)设置置信度、选择缺失值处理
34、方法:单击“选项”按钮,弹出“选项”对话框。如图所示。,(,5,)执行操作:设置完成后,单击“继续”按钮返回独立样本,t,检验主对话框,单击“确定”按钮,执行操作,输出结果。,4.5.4,实例分析:各地区私营企业中来自城镇和乡村的员工数,假设一次全国范围内的调查,统计各地区私营企业中分别来自城镇和乡村的平均员工数,试检验城镇的员工数和乡村的员工数是否存在显著差异。,解:在该案例中,各地区私营企业中来自城镇的员工数和来自乡村的员工数是成对出现并相互影响的,且样本容量较大(,N=31,),可认为总体分布近似正态,因此选用两配对样本,T,检验对二者的差异是否存在显著性进行检验。在创建数据文件时,每个
35、个案(即每一行)需要包括两个变量的数据,即每个地区的私营企业中分别来自城镇和乡村的平均员工数。,1,操作过程,(,1,)创建数据文件:将调查获得的数据输入,SPSS,文件中。数据如下表所示,单位(人)。,(,2,)打开主对话框:选择,分析,|,比较均值,|,配对样本,T,检验,命令,打开,配对样本,T,检验,主对话框。,(,3,)选择变量:将,“,城镇人数,”,和,“,乡村人数,”,选入,“,成对变量,”,列表框中,如下图所示。,(,4,)执行操作:单击,确定,按钮,执行操作,输出结果。,2,结果分析,(,1,)描述性统计量表:该表呈现了两配对样本的相关描述性统计量,包括:均值、样本容量(,N
36、标准差和均值的标准误。如下表所示,样本容量(,N,)为,31,,私营企业中来自城镇的平均员工数为,165.2871,,标准差为,176.19871,,标准误为,31.64622,。同理可知,来自乡村的平均员工数为,89.6903,,标准差为,108.53033,,均值的标准误为,19.49262,。,(,2,)相关性检验结果报表:对两个样本进行相关性检验是对进行两配对样本,T,检验的前提检验,即两个样本的数据之间的相关关系。如下表所示,共有,31,对样本,相关系数为,0.820,,显著性概率,p0.001,,因此在,95%,的置信水平上差异显著,即私营企业城镇就业人数和乡村人数显著相关,
37、符合用配对样本,T,检验的前提条件。,(,3,)配对样本,T,检验结果报表:该表呈现的是对两独立样本进行,T,检验的结果,包括两配对样本差分的均值、标准差、均值的标准误、,95%,的置信区间,还有,T,检验的,t,值、自由度(,df,)和显著性概率(,Sig.,)。如表所示,,对,1,城镇人数,-,乡村人数,是指将每对数据以城镇人数减去乡村人数,,成对差分,下面的统计量即是对应于这种差值。均值为,75.59677,,标准差为,107.09965,,标准误为,19.23566,,,95%,的置信区间的上限和下限分别为,36.3123,和,1114.88124,。配对样本,T,检验的,t,值为,3.930,,自由度(,df,)为,30,,显著性概率,p0.001,,因此在,95%,的置信水平上差异显著,即各地区私营企业中的城镇员工数和乡村员工数有显著差异。,






