资源描述
姓名:汪宝成 班级:08物流管理 学号:0809012042
1、对本市200户样本的人均面积(M2)进行调查,见“人均面积”文件,对数据做描述统计.
通过直方图观察可知:人均面积在16 M2的户口是最多的
2、分析“人均面积”文件数据,对全市人均面积为25 M2说法进行检验
单个样本检验
检验值 = 25
t
df
Sig.(双侧)
均值差值
差分的 95% 置信区间
下限
上限
VAR00001
-.500
199
.618
—。36500
—1。8058
1。0758
结果说明:由表显示,显著性概率P值为0.618>0.05,所以接受原假设,即有理由认为全市人均面积为25 M2说法是正确的。
3、针对“人均面积”文件数据,若设前一百户为本市户口,后一百户是外地户口,检验两者人均面积有无显著差异
独立样本检验
方差方程的 Levene 检验
均值方程的 t 检验
差分的 95% 置信区间
F
Sig.
t
df
Sig.(双侧)
均值差值
标准误差值
下限
上限
VAR00001
假设方差相等
。049
.824
—2。119
198
.035
-3.07000
1。44862
-5.92670
—。21330
假设方差不相等
-2。119
197。739
。035
-3.07000
1。44862
—5.92672
-。21328
结果说明:由表显示,F=0.049 P=0.824,说明方差齐性的假设成立,T检验的结果是P=—2.119 是小概率事件,否定原假设,即两者人均面积有显著差异。
4、调查喝某种品牌减肥茶情况,得35名顾客饮茶前后的体重数据,见“减肥茶”文件,检验饮茶前后有无显著差异。
成对样本检验
成对差分
t
df
Sig。(双侧)
均值
标准差
均值的标准误
差分的 95% 置信区间
下限
上限
对 1
VAR00001 - VAR00002
19.22857
7。98191
1。34919
16。48669
21.97045
14.252
34
。000
由表显示,P=0。000<0。05,否定原假设,即饮茶前后,对体重没有显著差
5、检验“人均面积”文件数据的分布是否服从正态、均匀、泊松、和指数分布
单样本 Kolmogorov—Smirnov 检验
VAR00001
N
200
正态参数a,,b
均值
24.6350
标准差
10.33274
最极端差别
绝对值
。113
正
。113
负
-。049
Kolmogorov—Smirnov Z
1.600
渐近显著性(双侧)
.012
a。 检验分布为正态分布。
b. 根据数据计算得到。
单样本 Kolmogorov-Smirnov 检验 2
VAR00001
N
200
均匀参数a,,b
极小值
6.00
极大值
50.00
最极端差别
绝对值
.181
正
.181
负
-。056
Kolmogorov-Smirnov Z
2。565
渐近显著性(双侧)
。000
a。 检验分布为均匀分布。
b. 根据数据计算得到。
单样本 Kolmogorov—Smirnov 检验 3
VAR00001
N
200
Poisson 参数a,,b
均值
24.6350
最极端差别
绝对值
。241
正
。241
负
-。187
Kolmogorov-Smirnov Z
3。406
渐近显著性(双侧)
.000
a. 检验分布为 Poisson 分布。
b. 根据数据计算得到。
单样本 Kolmogorov—Smirnov 检验 4
VAR00001
N
200
指数参数。a,,b
均值
24。6350
最极端差别
绝对值
.306
正
.146
负
-。306
Kolmogorov—Smirnov Z
4.322
渐近显著性(双侧)
。000
a. 检验分布为指数分布。
b. 根据数据计算得到。
通过以上图表显示:F1=0。012 F2=0.000 F3=0。000 F4=0。000
所以可知人居面积不服从于正态、均匀、泊松和指数分布
6、针对“一周就诊患者"文件数据,检验周一到周五患者数有无显著差异
检验统计量
VAR00001
卡方
31.107a
df
4
渐近显著性
.000
a. 0 个单元 (。0%) 具有小于 5 的期望频率.单元最小期望频率为 33。6.
由表显示:F=0。000 拒绝原假设,所以“一周就诊患者”从周一到周五患者数有显著差异。
7、针对“地区与营销额”文件数据,分析本市四个区,四天某产品营销额有无显著差异
多重比较
因变量:VAR00001
(I) VAR00002
(J) VAR00002
均值差 (I-J)
标准误
显著性
95% 置信区间
下限
上限
LSD
1.00
2.00
5。75000
7.49583
.458
-10.5820
22.0820
3。00
-15.75000
7。49583
。057
-32。0820
.5820
4。00
—16.00000
7.49583
.054
-32.3320
。3320
2。00
1.00
-5。75000
7.49583
.458
-22.0820
10.5820
3。00
—21。50000*
7.49583
。014
—37.8320
-5。1680
4.00
-21.75000*
7.49583
。013
—38.0820
-5.4180
3。00
1。00
15。75000
7.49583
。057
-.5820
32。0820
2。00
21。50000*
7。49583
。014
5.1680
37。8320
4.00
-.25000
7.49583
.974
—16.5820
16。0820
4。00
1。00
16.00000
7。49583
。054
—。3320
32.3320
2。00
21。75000*
7.49583
。013
5。4180
38.0820
3。00
。25000
7.49583
.974
—16.0820
16.5820
Tamhane
1.00
2.00
5.75000
5。94944
。941
-18。4481
29。9481
3.00
-15.75000
9。52956
。649
—56。1259
24.6259
4。00
—16.00000
5。85591
.216
-40。1729
8。1729
2。00
1。00
-5。75000
5。94944
。941
-29。9481
18。4481
3。00
-21.50000
8.83648
。361
—64.1819
21。1819
4。00
-21。75000*
4.64354
.020
—39。6230
—3.8770
3。00
1。00
15。75000
9.52956
。649
-24.6259
56。1259
2.00
21.50000
8。83648
。361
-21.1819
64.1819
4.00
—.25000
8。77378
1。000
—43.3526
42.8526
4。00
1。00
16.00000
5。85591
。216
-8。1729
40。1729
2。00
21.75000*
4.64354
。020
3。8770
39。6230
3.00
.25000
8。77378
1。000
-42.8526
43.3526
*. 均值差的显著性水平为 0。05。
通过比较可知:销售额存在显著性差异的地区分别是:瑶海区与庐阳区 瑶海区与包河区。
8、针对“广告"文件数据,分析本市四个区,四天采用四种广告形式,某产品营销额有无显著差异
Multiple Comparisons
Dependent Variable: VAR00001
(I) VAR00003
(J) VAR00003
Mean Difference (I—J)
Std. Error
Sig。
95% Confidence Interval
Lower Bound
Upper Bound
LSD
1.00
2.00
—6.2500
6。91616
.390
-21.8955
9.3955
3。00
-2.5000
6.91616
.726
—18。1455
13。1455
4。00
8.7500
6.91616
。238
-6。8955
24。3955
2。00
1.00
6.2500
6。91616
。390
—9.3955
21.8955
3.00
3.7500
6.91616
。601
-11.8955
19。3955
4。00
15。0000
6。91616
.058
—。6455
30。6455
3。00
1。00
2。5000
6。91616
。726
-13。1455
18。1455
2.00
—3.7500
6.91616
。601
—19。3955
11.8955
4。00
11。2500
6.91616
.138
-4。3955
26。8955
4。00
1.00
-8.7500
6。91616
.238
-24.3955
6。8955
2.00
-15。0000
6.91616
.058
-30.6455
。6455
3。00
-11。2500
6.91616
.138
-26.8955
4.3955
Tamhane
1。00
2.00
-6.2500
11。93646
。997
—62。8209
50。3209
3.00
-2.5000
7。06812
1.000
—29。7695
24.7695
4.00
8。7500
6。89051
.824
—17.7624
35.2624
2.00
1。00
6。2500
11.93646
.997
—50。3209
62.8209
3。00
3。7500
12。12350
1。000
-51.9153
59.4153
4.00
15.0000
12。02082
。858
—41.1318
71.1318
3.00
1。00
2.5000
7.06812
1。000
—24。7695
29。7695
2。00
—3。7500
12。12350
1。000
—59.4153
51。9153
4。00
11。2500
7.20966
.673
-16.4959
38。9959
4。00
1。00
—8。7500
6。89051
。824
-35。2624
17.7624
2.00
—15。0000
12。02082
.858
-71。1318
41.1318
3.00
—11.2500
7.20966
.673
-38。9959
16。4959
Based on observed means。
通过上表可得 采用不同的广告形式,对于产品销售额有显著影响。
1、 根据文件“家庭收入与人均面积”,判断两者之间有无关联性,并对结果做检验。
相关性
VAR00003
VAR00004
VAR00003
Pearson 相关性
1
.176*
显著性(双侧)
。012
N
200
200
VAR00004
Pearson 相关性
.176*
1
显著性(双侧)
.012
N
200
200
*. 在 0.05 水平(双侧)上显著相关.
从输出结果可以看出,家庭收入(X)和人均面积(Y)两者之间的Pearson相关系数r=0。176,p=0。012,在a=0。05条件下没有统计显著性线形相关
2、根据文件“学生排名”,判断学生成绩与工作能力之间有无关联性,并对结果做检验
相关系数
VAR00005
VAR00006
Spearman 的 rho
VAR00005
相关系数
1.000
-.770**
Sig。(双侧)
。
.009
N
10
10
VAR00006
相关系数
-.770**
1。000
Sig。(双侧)
。009
.
N
10
10
**. 在置信度(双测)为 0。01 时,相关性是显著的。
从输出结果可以看出,学生成绩和工作能力两者之间的Spearman 相关系数r=—0.770,p=0。009,在a=0。01条件下达到统计显著性相关
3、根据文件“质量评价”,判断男顾客与女顾客对商品的评价结果之间有无关联性,并对结果做检验
相关系数
VAR00005
VAR00006
Kendall 的 tau_b
VAR00005
相关系数
1。000
.556*
Sig.(双侧)
。
。025
N
10
10
VAR00006
相关系数
.556*
1.000
Sig。(双侧)
。025
.
N
10
10
*。 在置信度(双测)为 0。05 时,相关性是显著的。
从输出结果可以看出,男顾客与女顾客之间的Kendall相关系数r=0。556,p=0.025,
在a=0.05条件下达到统计显著性相关
4、 根据“彩电评级”说明消费者对各种彩电的质量水平有无显著差异
秩
秩均值
VAR00001
3。23
VAR00002
4。13
VAR00003
4.58
VAR00004
3.53
VAR00005
2。48
VAR00006
3。08
检验统计量
N
20
Kendall Wa
。217
卡方
21.743
df
5
渐近显著性
。001
a。 Kendall 协同系数
从输出结果表明,东芝的均值最低,西湖的均值最高,统计检验结果表明,Kendall’s W 系数为0。217,卡方为21.743,拒绝原假设,即消费者对各种彩电的质量水平的评价不具有高度的一致性。
5、根据“偏相关"文件分析家庭收入与计划面积之间的相关性并以家庭常住人口为控制变量
相关性
控制变量
家庭收入
计划面积
家庭长住人口
-无-a
家庭收入
相关性
1.000
。022
。135
显著性(双侧)
。
.535
.000
df
0
830
830
计划面积
相关性
.022
1.000
—.186
显著性(双侧)
.535
.
。000
df
830
0
830
家庭长住人口
相关性
.135
-.186
1.000
显著性(双侧)
.000
.000
.
df
830
830
0
家庭长住人口
家庭收入
相关性
1.000
。048
显著性(双侧)
。
.169
df
0
829
计划面积
相关性
.048
1。000
显著性(双侧)
。169
。
df
829
0
a。 单元格包含零阶 (Pearson) 相关。
根据图表显示,家庭收入与计划面积之间的简单相关系数较高,且达到了高度的统计显著性水平,但将家庭常住人口控制起来的条件下,家庭收入与计划面积之间的偏相关系数仅为0.135,且不具有统计显著意义。
6、根据文件“股票”,建立股票收益率与市场收益率回归模型,并分析结果。
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
。885a
。783
。776
8.30283
a. 预测变量: (常量), VAR00002.
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
8189。530
1
8189.530
118。797
.000a
残差
2274。918
33
68.937
总计
10464。449
34
a。 预测变量: (常量), VAR00002。
b. 因变量: VAR00001
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-。537
1。432
-.375
.710
VAR00002
1。253
.115
。885
10.899
。000
a。 因变量: VAR00001
根据上表可知:决定性系数为0。7,76 该一元线性回归方程对总平方和的解释能力达到了77.6%, F=118。797 P=0.000 所以拒绝零假设,回归方程的线性关系是显著的 一元线性回归模型为:y=1。253x—0.573
7、根据“保险公司”文件建立多元线性模型并分析
模型汇总
模型
R
R 方
调整 R 方
标准 估计的误差
1
.946a
.895
.883
3。22113
a. 预测变量: (常量), VAR00003, VAR00002。
Anovab
模型
平方和
df
均方
F
Sig。
1
回归
1504。413
2
752。207
72。497
.000a
残差
176.387
17
10.376
总计
1680.800
19
a。 预测变量: (常量), VAR00003, VAR00002。
b. 因变量: VAR00001
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
33.874
1.814
18。675
。000
VAR00002
—.102
。009
—。911
-11。443
。000
VAR00003
8。055
1。459
。439
5。521
.000
a. 因变量: VAR00001
通过上图可知:决定性系数为0。883,该二元线性回归方程对总平方和的解释能力达到了88.3%,F=72。497 P=0。000 所以拒绝零假设,回归方程的线性关系是显著的. 除了常数项外, “公司规模”“公司类型”两个解释变量的t值较大,在a=0。05 条件下拒绝零假设,说明两个解释变量对被解释变量的影响是显著的. 二元线性回归模型为:y=33.874—0.102x1+8.055x2
二元线性标准化回归模型为:y/=1.814-0.009x1+1。452x2
8、根据文件“回归”建立变量间回归模型并分析
模型汇总和参数估计值
因变量:VAR00003
方程
模型汇总
参数估计值
R 方
F
df1
df2
Sig。
常数
b1
b2
b3
对数
。808
109.576
1
26
.000
-116776.114
13360。379
倒数
。471
23.122
1
26
.000
31306。384
-1.578E8
二次
.995
2327.406
2
25
。000
1253。197
.320
2.669E-7
三次
.995
1630.105
3
24
。000
1834。908
.257
1.230E—6
-3.636E—12
复合
.837
133。705
1
26
。000
3775.371
1。000
幂
.995
5343.920
1
26
。000
1。043
。908
S
.843
139.621
1
26
。000
10.277
-12932。166
增长
。837
133.705
1
26
.000
8。236
2.028E-5
指数
。837
133.705
1
26
。000
3775。371
2。028E—5
自变量为 VAR00002。
通过上表可知:社会消费品零售总额对国内生产总值二次函数的回归模型如下:y=1253。197+0。320X+2.669E—7X平方
9、根据文件“工业指标”对各地经济效益作因子分析
公因子方差
初始
提取
VAR00002
1。000
。845
VAR00003
1。000
。951
VAR00004
1.000
.089
VAR00005
1.000
.781
VAR00006
1。000
.928
VAR00007
1.000
。774
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
2.423
40。390
40。390
2。423
40.390
40.390
2。246
37。437
37。437
2
1.945
32。424
72。814
1。945
32。424
72.814
2.123
35.377
72.814
3
。973
16。209
89。023
4
.405
6.756
95.779
5
.178
2。963
98.742
6
。076
1.258
100.000
提取方法:主成份分析。
提取方法:主成份分析。
通过上表可知:每年流动资产周转次数和产品销售率共同度低于80%之外,其他几个评价指标共同度都在80%以上,因此提取出的公因子对各变量的解释能力是较强的。所提取的两个因子的方差贡献率分别为:40。390%和 32.424,累计贡献率高达 72.814%。工业指标对地区的经济效益的几个指标主要是由前两个因子决定的.
10、根据文件“经济指标"对各地经济效益作聚类分析
1
1
1
1
西藏
2
2
2
2
四川
3
3
3
3
重庆
4
4
3
3
贵州
5
5
4
3
云南
6
5
4
3
陕西
4
4
3
3
甘肃
1
1
1
1
青海
1
1
1
1
宁夏
3
3
3
3
新疆
通过上表可知:若分为三类的话则有:西藏、青海和宁夏为一组,四川一组,重庆、贵州、云南、陕西和新疆为一组。若分为四组的话,则有:西藏、青海和宁夏为一组,四川一组,重庆、贵州、甘肃和新疆为一组,云南和陕西为一组.一次类推,由上表所示不一一列举.
展开阅读全文