资源描述
SPSS软件及应用
实验报告
关于男性裤子尺寸影响因素的研究
本报告主要是通过搜集了影响男性裤子尺寸的9个因素,分别是腰围、腹围、直档1、直档2、全浪、大腿根围、膝盖围、臀围、裤长,一共测量了250组数据。旨在通过因子分析,利用降维思想,把多指标转化为少数几个综合指标,并分析得到的主因子的含义。
本报告主要研究的问题如下:
(1) 对数据进行描述性统计,并按照尺寸换算将厘米换算成尺寸,对数据按照腰围这一指标进行分组,编制频数分布表,并绘制频数分布的直方图;
(2) 使用单样本K-S检验对腰围换算成尺寸后的数据进行非参数检验,验证是否服从正态分布;
(3) 对数据进行因子分析,并对因子的含义进行分析。
问题1:
根据腰围对所有的样本进行分组,分组结果见附录。所搜集的腰围数据范围是[62.5,107],根据一尺约为33.3厘米,换算成尺寸范围是一尺九——三尺二,不足的四舍五入。得到结果如下:
尺寸
频率
百分比
有效百分比
累积百分比
有效
1.9
2
.8
.8
.8
2.0
13
5.2
5.2
6.0
2.1
27
10.8
10.8
16.8
2.2
43
17.2
17.2
34.0
2.3
52
20.8
20.8
54.8
2.4
34
13.6
13.6
68.4
2.5
26
10.4
10.4
78.8
2.6
27
10.8
10.8
89.6
2.7
6
2.4
2.4
92.0
2.8
7
2.8
2.8
94.8
2.9
10
4.0
4.0
98.8
3.0
1
.4
.4
99.2
3.1
1
.4
.4
99.6
3.2
1
.4
.4
100.0
总计
250
100.0
100.0
表1 尺寸频数分布表
图1 频数分布直方图
从表1可以看出有82.8%的男性腰围在二尺一和二尺六之间,从表2发现所调查的男性腰围均值为2.37,标准差为0.237,并且近似服从正态分布。
问题2:
对腰围换算成尺寸后的数据进行使用单样本K-S检验时,选择方法是正态分布,检验结果如下:
单样本 Kolmogorov-Smirnov 检验
尺寸
数字
250
正态参数a,b
平均值
2.366
标准偏差
.2368
最极端差分
绝对
.158
正
.158
负
-.073
检验统计
.158
渐近显著性 (双尾)
.000c
a. 检验分布是正态分布。
b. 根据数据计算。
c. Lilliefors 显著性校正。
表2 单样本 Kolmogorov-Smirnov 检验
描述统计
数字
平均值
标准偏差
最小值
最大值(X)
尺寸
250
2.366
.2368
1.9
3.2
表3 腰围的简单描述统计
表2给出了单样本 Kolmogorov-Smirnov 检验的相关统计量。从表中可以看出单样本K-S检验z统计量值为0.158,渐进显著性水平为0小于0.05,应该是拒绝原假设,认为男性腰围不服从正态分布。虽然250个样本可以认为是大样本数据,但是就全国人数来说还是太少了。该数据是来自2015年燕山大学的部分男生,所以出现这样的结果很可能是样本数据太少。不过也有可能是男性腰围确实不服从正态分布,因为现在还没人针对这一课题进行研究。
问题3:
将数据导入SPSS,在菜单栏中依次单击“分析”—>“降维”—>“因子分析”,得到结果如下:
KMO 和巴特利特检验
KMO 取样适切性量数。
.850
Bartlett 的球形度检验
上次读取的卡方
1643.806
自由度
36
显著性
.000
表4 KMO 和巴特利特检验
上表给出了KMO 和巴特利特检验的结果,其中KMO的值越接近1表示越适合做因子分析,从该表可以得到KMO的值为0.850,表示适合做因子分析。Bartlett 的球形度检验的原假设为相关系数矩阵为单位阵,显著性p值为0.000小于显著性水平0.05,因此拒绝原假设,即变量之间存在相关关系,适合做因子分析。
公因子方差
初始值
提取
腰围
1.000
.889
腹围
1.000
.813
直裆1
1.000
.717
直裆2
1.000
.733
全浪
1.000
.509
大腿根围
1.000
.828
膝盖围
1.000
.725
臀围
1.000
.880
裤长
1.000
.494
提取方法:主成份分析。
表5 公因子方差
表5给出了每个变量共同度的结果。该表左侧表示每个变量可以被所有因素所能解释的方差,右侧表示变量的共同度。从该表可以得出,因子分析的变量共同度都比较高,表示变量中的大部分信息均能够被因子所体现,说明因子分析是有效的。
总方差解释
组件
初始特征值
提取载荷平方和
旋转载荷平方和
总计
方差百分比
累积 %
总计
方差百分比
累积 %
总计
方差百分比
累积 %
1
4.711
52.340
52.340
4.711
52.340
52.340
4.418
49.091
49.091
2
1.878
20.864
73.204
1.878
20.864
73.204
2.170
24.112
73.204
3
.709
7.880
81.084
4
.591
6.569
87.653
5
.346
3.840
91.493
6
.307
3.410
94.902
7
.214
2.382
97.284
8
.142
1.582
98.866
9
.102
1.134
100.000
提取方法:主成份分析。
表6 总方差解释
表6给出了因子贡献率的结果。该表中左侧部分为初始特征值,中间为提取的主因子结果,右侧为旋转后的主因子结果。“合计”指因子的特征值,其中只有前两个因子的特征值大于1,并且前两个因子的特征值之和占总特征值的73.204%,因此提取前两个因子作为主因子。
成分矩阵a
组件
1
2
腰围
.893
-.304
腹围
.855
-.286
直裆1
.565
.631
直裆2
.301
.801
全浪
.623
.347
大腿根围
.893
-.176
膝盖围
.845
-.106
臀围
.927
-.144
裤长
.118
.693
提取方法:主成份分析。
a. 已提取 2 个成分。
表7 成分矩阵
旋转后的成分矩阵a
组件
1
2
腰围
.943
-.001
腹围
.902
.004
直裆1
.332
.779
直裆2
.028
.856
全浪
.479
.529
大腿根围
.902
.120
膝盖围
.834
.171
臀围
.924
.161
裤长
-.110
.694
提取方法:主成份分析。
旋转方法:Kaiser 标准化最大方差法。a
a. 旋转在 3 次迭代后已收敛。
表8 旋转后的成分矩阵
表7给出了未旋转的因子载荷。从该表可以得到利用主成分方法提取的两个主因子的载荷值。为了方便解释因子含义,需要进行因子旋转。表8给出了旋转后的因子载荷值,其中旋转方法是Kaiser标准化的正交旋转法。通过因子旋转,各个因子有了比较明确的含义。
表9 碎石图
表9给出了特征值的碎石图,通常该图显示大因子的陡峭程度和剩余因子平缓的尾部之间明显的中断。一般选取的主因子在非常陡峭的斜率上,而在平缓斜率上的因子对变异的解释能力非常小。从该图可以看出前两个因子都处在非常陡峭的斜率上,而从第三个因子开始斜率开始变得平缓,因此选择前两个因子作为主因子。
成分得分系数矩阵
组件
1
2
腰围
.231
-.092
腹围
.221
-.086
直裆1
.005
.357
直裆2
-.077
.425
全浪
.066
.217
大腿根围
.210
-.028
膝盖围
.188
.004
臀围
.211
-.010
裤长
-.095
.357
提取方法:主成份分析。
旋转方法:Kaiser 标准化最大方差法。
组件评分。
表10 成分得分系数矩阵
通过成分得分系数矩阵可以看出,每个因子只有部分指标的因子载荷较大,因此可以根据上表对指标进行分类。在第一个因子上因子载荷较大的有腰围、腹围、大腿根围、膝盖围和臀围,此类可以命名为胖瘦因子;在第二个因子上因子载荷较大的有直裆1、直裆2、全浪、裤长,此类命名为高矮因子。
由表10可得两个因子f1、f2的线性组合如下(腰围、腹围、直档1、直档2、全浪、大腿根围、膝盖围、臀围、裤长分别用x1、x2、x3、x4、x5、x6、x7、x8、x9来表示):
按以上2个线性组合计算因子得分,以各因子的方差贡献率占2个因子总方差贡献率的比重作为权重进行加权汇总,得到各人裤子尺寸的综合得分,即:
展开阅读全文