资源描述
本文指在简述SPSS中的T检验,主要说明了T检验的原理和应用,及使用范围。和SPSS中的基本操作。
T检验是检验样本的均值和给定的均值是否存在显著性差异。T检验分为3类:单样本T检验、两独立样本T检验和两配对样本T检验。
关键词:
T检验、SPSS、显著性水平、统计量、概率P-值、自由度、线性相关、置信区间、零假设。
11
目 录
一、单样本T检验 4
1.单样本T检验的目的 4
2.单样本T检验的基本步骤 4
3.单样本T检验的应用举例 5
三、两独立样本T检验 6
1.两独立样本T检验的目的 6
2.两独立样本T检验的基本步骤 6
3.两独立样本T检验的应用举例 8
三、两配对样本T检验 10
1.两配对样本T检验的目的 10
2.两配对样本T检验的基本步骤 10
3.两配对样本T检验的应用举例 10
四、参考文献 12
一、单样本T检验
1.单样本T检验的目的。
单样本检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与制定的检验值之间存在显著性差异。它是对总体均值的假设检验。
2.单样本T检验的基本步骤。
⑴.提出原假设。
单样本T检验的原假设为:总体均值与检验值之间不存在显著差异,表述为:。为总体均值,为检验值。
⑵.选择检验统计量。
当总体分布为正态分布时,样本均值的抽样分布仍为正态分布,该正态分布的均值为,方差为/,即
式中,为总体均值,当原假设成立时,;为总体方差;为样本数。总体分布近似服从正态分布时。通常总体方差是未知的,此时可以用样本方差替代,得到的检验统计量为统计量,数学定义为:
①
式中,统计量服从n-1自由度为分布。单样本检验的检验统计量即为统计量。当认为原假设成立时用代入。
⑶计算检验统计量观测值和概率P-值
该步目的是甲酸检验统计量的观测值和相应的概率P-值。SPSS将自动将样本均值、、样本方差、样本数代入式①中,计算出统计量的观测值和对应的概率P-值。
⑷给定显著性水平,并作出决策。
如果概率P-值小于显著性水平,则应拒绝原假设,认为总体均值与检验值之间存在显著差异;反之,如果概率P-值大于显著性水平,则不应拒绝原假设,认为总体均值与检验值之间无显著差异。
3.单样本T检验的应用举例
案例:利用住房状况问卷调查数据,推断家庭人均住房面积的平均值是否为20平方米。数据名字为“住房状况调查.sav”
推断家庭人均住房面积的平均值是否为20平方米。由于该问题设计的是单个总体,且要进行总体均值比较,同时家庭人均住房面积的总体可近似认为服从正态分布,因此,可采用单样本T检验来进行分析。
SPSS单样本T检验的基本操作步骤是:
⑴选择菜单:
【Analyze】 → 【Compare Means】 → 【 One- Samples T Test】
出现如图所示的窗口。
图1
⑵选择待检验的变量到【Test Variables】,在【Test Value】框中输入检验值。
⑶按Option按钮定义其他选项,出现图2所示的窗口。Option选项用来指定缺失值的处理方法。另外,还可以输出默认95%的置信区间。
图2
至此,SPSS将自动计算同嘉陵和对应的概率P-值。分析结果如表3和表4所示。
人均住房面积的基本描述统计结果
One-Sample Statistics
N
Mean
Std. Deviation
Std. Error Mean
人均面积
2993
22.0060
12.70106
.23216
表3
人均住房面积单样本T检验结果
One-Sample Test
Test Value = 0
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
人均面积
94.788
2992
.000
22.00596
21.5508
22.4612
表4
由表3可知,2993个家庭的人均住房面积的平均值为22平方米,标准差为12.7平方米,均值标准误差为()为0.23.表4中,第二列是统计量的观测值为8.64;第三列是自由度为2992;第四列是统计量观测值的双尾概率P-值;第五列是样本均值与检验值的差,即统计量的分子部分;第六列和第七列是总体均值与原假设值差的95%的置信区间,为(1.55,2.46),由此计算出总体均值的95%的置信区间为(21.55,22.46)平方米。
该问题应采用双尾检验,因此比较和。如果给定为0.05,由于小于,因此应拒绝原假设,认为家庭人均住房面积的平均值与20平方米由显著差异。95%的置信区间告诉我们有95%的把握认为家庭人均诸方面均值在21.55~22.46平方米之间。
三、两独立样本T检验
1.两独立样本T检验的目的
两独立样本T检验的目的是利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。
2.两独立样本T检验的基本步骤。
⑴提出零假设
两独立样本T检验的原假设为:两总体均值无显著差异。表述为:
:
,分别为第一个和第二个总体的均值。
⑵选择检验统计量
对两总体均值差的推断是建立在来自两个总体样本均值差的基础之上的,也就是希望利用两组样本均值的差去估计量总体均值的差。因此,应关注两样本均值的抽样分布。当两总体分布分别为和时,两样本均值差的抽样分布仍为正态分布,该正态分布的均值为,方差为。在不同的情况下,有不同的计算方式。
第一种情况:当两总体方差未知且相等,即时,采用合并的方差作为两个总体方差的估计,数学定义为
式中,,分别为第一组和第二组样本的方差;,分别为第一组和第二组样本的样本数。此时两样本均值差的抽样分布的方差为
第二种情况:当两总体方差未知且不相等,即时,分别采用各自的方差,此时两样本均值差的抽样分布的方差为:
②
于是,两总体均值差检验的检验统计量为统计量,数学定义为:
③
在第一种情况下,统计量服从个自由度的分布;在第二种情况下,服从修正自由度的分布,修正的自由度定义为
⑶计算检验统计量观测值和概率P-值。
该步的目的是计算F统计量和统计量的观测值以及相应的概率P-值。SPSS将自动依据单因素方差分析的方法计算F统计量和概率P-值,并自动将两组样本的均值、样本数、抽样分布方差等代入式③中,计算出统计量的观测值和对应的概率P-值。
⑷给定显著性水平,并作出决策。
第一步,利用F检验判断两总体的方差是否相等,并据此决定抽样分布方差和自语度的计算方法和计算结果。如果F检验统计量的概率P-值小于显著想水平,则应拒绝原假设,认为两总体方差没有显著差异,应选择式②和式③计算出的结果:反之,若果概率P-值大于显著性水平则不应拒绝原假设,认为两总体方差无显著差异。
第二步,体用检验判断两总体均值是否存在显著差异。如果检验统计量的概率P-值小于显著性水平,则应拒绝原假设,认为两总体均值有显著性差异;反之,如果概率P-值大于显著性水平,则不应拒绝原假设,认为两总体均值无显著差异。
3.两独立样本T检验的应用举例
原假设是:本市户口和外地户口的家庭收入人均值无显著性差异,即
⑴选择菜单
【Analyze】 → 【Compare Means】 → 【Indendent- Samples T Test】
于是出现如图所示的窗口。
图3
⑵选择检验变量到【Test Variables(s)】框中。
⑶选择总体标识变量到【Grouping Variables】框中。
⑷按Define Groups按钮定义两总体的标识值,显示如图4所示的窗口。其中【Use Specified Values】表示分别输入对应两个不同总体的标志值;【Cut Point】框中应输入一个数字,大于等于该值的对应另一个总体。
图4
⑸两独立样本检验的Option选项含义与单样本检验的相同。
分析结果如图5所示
本市户口和外地户口家庭人均住房面积的基本描述统计
Group Statistics
户口状况
N
Mean
Std. Deviation
Std. Error Mean
人均面积
本市户口
2825
21.7258
12.17539
.22907
外地户口
168
26.7165
18.96748
1.46337
图5
由图5可以看出,本市户口和外地户口的家庭人均住房面积的样本平均值有一定的差距。通过检验应推断这种差异是抽样误差造成的还是系统性的。
本市户口和外地户口家庭人均住房面积两独立样本检验结果
图6
图6是本市户口和外地户口家庭人均住房面积的均值检验结果。分析结论应通过两步完成。第一步,两总体方差是否相等的F检验。这里,该检验的F统计量的观测值为65.469,对应的概率P-值为0.00.如果显著性水平为0.05,由于概率P-值小于0.05,可以认为两总体的方差有显著差异。第二步,两总体均值的检验。在第一步中,由于两总体方差有显著差,因此应看第二行T检验的结果。其中T统计量的观测值为-3.369,对应的双尾开率P-值为0.001.如果显著性水平为0.05,由于概率P-值小于0.05,因此认为两总体的均值有显著差异,即本市户口和外地户口的家庭人均住房面积的平均值存在显著差异。图6中的第七列和第八列分别为T统计量的分子和分母;第九列和第十列为两总体差的95%置信区间的上限和下限。
三.两配对样本T检验
1.两配对样本T检验的目的
两配对样本T检验的目的是利用来自两个不同总体的配对样本,推断两个总体的均值是否存在显著差异。
配对样本通常有两个特征:第一,两组样本的样本数相同;第二,两组样本观测值的先后顺序是一一对应的,不能随意更改。
2.两配对样本T检验的基本步骤。
⑴提出原假设
两配对样本T检验的原假设为:两总体均值无显著差异,表述为:。,分别为第一个和第二个总体的均值。
⑵选择统计量。
两配对样本T检验采用T统计量。其思路是:首先,对两组样本分别计算出每对观测值的差值得到差值样本;然后,体用差值样本,通过对其均值是否显著为0的检验来推断两总体均值的差是否显著为0.如果差值样本的均值与0有显著差异,则可以认为两总体的均值有显著差异;反之,如果差值系列的均值与0无显著差异。则可以认为两总体均值不存在显著差异。
⑶计算检验统计量观测值和概率P-值
SPSS将计算两组样本的差值,并将相应数据代入式①,计算出T统计量的观测值和对应的概率P-值。
⑷给定显著水平,并作出决策。
给定显著水平,与检验统计量的概率P-值作比较。如果概率P-值小于显著水平,则应拒绝原假设,认为差值样本的总体均值与0有显著不同,两总体的均值有显著差异;反之,如果概率P-值大于显著水平,则不应拒绝原假设,认为差值样本的总体均值与0无显著不同,两总体的均值不存在显著差异。
3.两配对样本T检验的应用举例。
案例:为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行了减肥跟踪调研。首先将其喝减肥茶以前的体重记录下来,三个月后再依次将这35名志愿者喝茶后的体重记录下来。通过这两组样本数据的对比分析,推断减肥茶是否具有明显的减肥作用。
SPSS两配对样本T检验的基本操作步骤如下:
⑴选择菜单:
【Analyze】 → 【Compare Means】 → 【Paired-Samples T Test】
于是出现如图7所示的窗口
图7
⑵选择一对或若干对检测变量到【Paired Variables】框中。
⑶两配对样本T检验的Option选项含义和单样本T检验的相同。
至此,SPSS将自动计算T统计量和对应的概率P-值。分析结果如图8、图9和图10所示。
喝茶前和喝茶后体重的基本描述统计量
Paired Samples Statistics
Mean
N
Std. Deviation
Std. Error Mean
Pair 1
喝茶前体重
89.2571
35
5.33767
.90223
喝茶后体重
70.0286
35
5.66457
.95749
图8
图8表明,喝茶前和喝茶后样本的平均值有较大差异。喝茶后的平均体重低于喝茶前的平均体重。
喝茶前和喝茶后体重的简单相关系数及检验
Paired Samples Correlations
N
Correlation
Sig.
Pair 1
喝茶前体重 & 喝后体重
35
-.052
.768
图9
图9中,第三列是喝茶前和喝茶后两组样本的简单相关系数,第四列是相关系数检验的概率P-值。它表明在显著性水平为0.05时,肥胖志愿者服用减肥茶前后的体重并没有明显的线性变化,喝茶前和喝茶后体重的线性相关程度较弱。
喝茶前和喝茶后体重的两配对样本T检验结果
图10
图10中,第二列是喝茶前与喝茶后体重的平均差异,相差了19.2公斤;第三列是差值样本的标准差;第四列是差值样本分布的标准差;第五列、第六列是差值95%的置信区间的上限和下限;第七列是T检验统计量的观测值;第八列是R检验统计量观测值对应的双尾概率P-值,接近于0.如果显著性水平为0.05,由于概率P-值小于显著性水平,应拒绝原假设,即认为总体上体重差的平均值与0有显著不同,意味着喝茶前与喝茶后的体重平均值存在显著差异,可以认为该减肥茶具有显著的减肥效果。
四、参考文献。
[1]薛微 《统计分析与SPSS的应用》 中国人名大学出版社 2009年11月第4次出版
[2]罗良青 《统计学》 高等教育出版社 2008年5月
展开阅读全文