资源描述
全国大学生数学建模论文
关于葡萄酒评价的研究
摘要
葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的,葡萄酒质量是其外观、香气、口味等的综合表现,葡萄酒的质量是通过评酒员的品评得到的。
针对问题一,为判断两组评酒员的评价结果有无显著性差异,首先用Matlab对各组各酒样的总分做正态性检验,再用SPSS 做配对样品t检验,得到两组评酒员的评价结果有显著性差异;其次,用Matlab中的Std(x)函数求得第二组的标准差较小,即第二组结果更可信。
针对问题二,某些理化指标对酿酒葡萄的影响不大,故本文采用主成分分析法对其作降维处理,得到各酿酒葡萄的主要理化指标。再用快速聚类分析对主要理化指标分类,最后结合葡萄酒的质量对酿酒葡萄的等级加以评定。
针对问题三,在问题二的基础上,用主成分分析法分析葡萄酒的理化指标,得到各葡萄酒的主要理化指标。再用相关分析法对酿酒葡萄和酒样的主要理化指标分析,得到两者间某些指标存在正、负相关关系,说明酿酒葡萄在较大程度上影响了葡萄酒的理化指标,此为模型一。再用多元线性逐步回归分析,得到两者的方程模型,此为模型二。
针对问题四,分析影响时用SPSS 对酿酒葡萄的理化指标与葡萄酒质量,葡萄酒的理化指标与葡萄酒的质量进行相关性分析。对论证部分,以葡萄酒质量作为因变量,酿酒葡萄和葡萄酒的主要理化指标作为自变量,利用SPSS 19.0进行多元线性逐步回归分析后,得到方程模型,可通过四个方程模型用酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量予以评价,即得到结论可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:Matlab SPSS 配对样品t检验 主成分分析法 聚类分析
双变量相关分析 多元线性逐步回归分析
二、问题重述
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。
附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:
1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。
4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
三、问题分析
葡萄酒质量的评定过程是每个评酒员对葡萄酒进行品尝后对其分类指标进行打分,通过求和得到其总分,这个总分反映了葡萄酒质量的好坏。另外,酿酒葡萄的质量是影响葡萄酒质量的直接因素,利用附件提供的数据,分析二者理化指标之间的联系。
1)对问题一,为判断两组评酒员的评价结果有无显著性差异,首先,在excel表格中分别求得第一组、第二组评酒员对每一种酒样品所评总分的平均值,然后用Matlab对所得平均值做正态性检验,判断该两组数据是否符合正态分布,若符合,再利用spss对所得的两组数据做配对样品t检验;其次,在excel中分别求得第一组、第二组十位评酒员对每种酒样品评分的标准差,所得标准差较小的一组即为评分结果更可信的一组。
2)对问题二,要对酿酒葡萄进行分级,先找出酿酒葡萄性质的主要理化指标进行降维处理,故本文采用主成分分析法。再用聚类分析进行分类,而酿酒葡萄的好坏又与所酿葡萄酒的质量有直接的关系,所以对酿酒葡萄的分级可以结合葡萄酒的质量加以分析。
3)对问题三,首先对葡萄酒做主成分分析,结合第二问中酿酒葡萄的主要理化指标,利用SPSS 19.0对酿酒葡萄和葡萄酒的理化指标做相关性分析,此为模型一。其次,用多元线性逐步回归分析方法分析,建立线性回归方程模型,此为模型二。
4)对问题四,第一问用SPSS 19.0分别做酿酒葡萄的理化指标与葡萄酒质量,葡萄酒的理化指标与葡萄酒质量的相关性分析,根据输出数据分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响。问题四的第二问,是研究多个理化指标与葡萄酒质量是否存在相互依存关系,因此可用多元线性逐步回归分析的方法,以葡萄酒质量作为因变量,以第二问中挑选出的特征向量较大的酿酒葡萄和葡萄酒的理化指标作为自变量,利用SPSS 19.0进行多元线性逐步回归分析。
四、模型假设
1)附件中的数据真实可靠;
2) 假设第i号酿酒葡萄的好坏与第i号葡萄酒的优劣水平一致;
3)假设二级指标对酿酒葡萄和葡萄酒质量的影响不大,可以忽略;
4)假设在一定时间内葡萄酒的理化指标含量保持不变。
五、符号说明与定义
符号
符号解释
表示第i主成分;
表示第i种葡萄样品的第j种指标的平均值;
表示第i主成分的特征值;
表示第i主成分的系数;
表示指标变量的值;
表示某种酿酒葡萄和葡萄酒的第i个指标;
表示葡萄样品标准化后的值
六、模型的建立与求解
6.1问题一的分析
6.1.1两组评价结果的显著性差异分析
对同一葡萄酒两组评酒员进行品评,得到成对出现的两组评价结果,即配对样本。故分析两组评价结果的显著性,本文采用配对样品t检验分析法。进行配对t检验的样本必须服从正态分布,首先,对配对样本进行正态分布检验,根据附件一,分别求出第一、第二组各十名评酒员对红、白葡萄酒评分的总和,再求其平均值如下表所示:
表一 红、白葡萄酒的总分平均值
组别
红酒样品
第一组
第二组
组别
白酒样品
第一组
第二组
1
62.7
68.1
1
82
77.9
2
80.3
74
2
65.1
75.8
3
80.4
74.6
3
78.3
75.6
4
68.6
71.2
4
79.4
76.9
5
73.3
72.1
5
71
81.5
6
72.2
66.3
6
68.4
75.5
7
71.5
65.3
7
77.5
74.2
8
72.3
66
8
71.4
72.3
9
81.5
78.2
9
72.9
80.4
10
74.2
68.8
10
74.3
79.8
11
70.1
61.6
11
72.3
71.4
12
53.9
68.3
12
63.3
72.4
13
74.6
68.8
13
65.9
73.9
14
73
72.6
14
72
77.1
15
58.7
65.7
15
72.4
78.4
16
74.9
69.9
16
74
67.3
17
79.3
74.5
17
78.8
80.3
18
59.9
65.4
18
73.1
76.7
19
78.6
72.6
19
72.2
76.4
20
79.8
75.8
20
77.8
76.6
21
77.1
72.2
21
76.4
79.2
22
77.2
71.6
22
71
79.4
23
85.6
77.1
23
75.9
77.4
24
78
71.5
24
73.3
76.1
25
69.2
68.2
25
77.1
79.5
26
73.8
72
26
81.3
74.3
27
73
71.5
27
64.8
77
28
81.3
79.6
选平均值为评价结果,用Matlab的normplot命令,判定上述四组数据均趋于正态分布,结果如下图所示:(程序见附录程序一至程序四)
图一 第一组 红葡萄酒 图二 第二组 红葡萄酒
图三 第一组 白葡萄酒 图四 第二组 白葡萄酒
上图表明,此四组数据均服从正态分布,对红葡萄酒而言,要分析两组评酒员对其评分结果是否有显著性差异,可利用SPSS 19.0对这两组数据做配对样本t检验,所得结果为:t=2.497,sig=0.019,置信区间为[0.4573 4.7130]。可见,sig<0.05,置信区间包括t=2.497,得出两组评酒员对红葡萄酒的评价结果具有显著性差异。
对于白葡萄酒而言,方法同上,所得结果为:t=2.838,sig=0.009,置信区间为[0.7883 4.9045],包含t=2.838。由于sig的值远小于0.05,得出两组评酒员对白葡萄酒的评价结果也具有显著性差异。
6.1.2两组评价结果中较可信结果的选择
假设每种葡萄酒的评价标准是一定的,标准差的大小能够反映不同评酒员对每种酒评分的离散程度,该值越小,改组评分越稳定,所得评价结果就越可信。因此,本文采用分别计算第一组、第二组各十名评酒员对27种红葡萄酒样品和28种白葡萄酒样品评分的标准差的方法,通过比较标准差的大小选择可信结果。
用Matlab编程作上述计算(见附录程序五),所得结果如下表:
表二 红、白葡萄酒评分的标准差
组别
红酒样品
第一组
第二组
组别
白酒样品
第一组
第二组
1
9.6385
9.0486
1
9.0632
5.0870
2
6.3078
4.0277
2
14.1798
7.0048
3
6.7692
5.5418
3
8.1520
11.9369
4
10.3944
6.4256
4
6.6866
6.4885
5
7.8747
3.6953
5
11.2488
5.1262
6
7.7287
4.5959
6
12.7558
4.7668
7
10.1790
7.9169
7
6.2583
6.4944
8
6.6341
8.0691
8
13.5499
5.5787
9
5.7397
5.0728
9
9.6315
10.3086
10
5.5136
6.0148
10
14.5835
8.3905
11
8.4123
6.1680
11
13.3087
9.3714
12
8.9250
5.0122
12
10.7605
11.8340
13
6.7032
3.9101
13
13.0678
6.8386
14
6.0000
4.8120
14
10.6875
3.9847
15
9.2502
6.4300
15
11.4717
7.3515
16
4.2544
4.4833
16
13.3417
9.0683
17
9.3814
3.0277
17
12.0074
6.2013
18
6.8710
7.0899
18
12.5118
5.4985
19
6.8832
7.4267
19
6.8118
5.1034
20
3.7006
6.2503
20
8.0250
7.0742
21
10.7750
5.9591
21
13.1420
8.0250
22
7.1149
4.9261
22
11.7757
7.3212
23
5.6999
4.9766
23
6.6072
3.4059
24
7.0553
3.2745
24
10.5415
6.2084
25
8.0388
6.6131
25
5.8205
10.3199
26
5.5936
6.4464
26
8.5381
10.1440
27
7.0553
4.5277
27
12.0167
5.9628
28
8.9697
5.0376
由上表可知,第一组评酒员对红、白葡萄酒评分的标准差分别有74%、79%大于第二组评酒员对相应项的评分,且第一组评酒员虽然在某些酒样品的评分中标准差小于第二组,但此时两组评酒员评分的标准差相差不大,故综上可知,第二组的评分结果更为可信。
6.2问题二的求解与分析
6.2.1酿酒红葡萄的理化指标的主成分分析
根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,由于有些理化指标对酿酒葡萄的影响不大,故本文采用这成分分析法进行降维处理,再运用聚类分析进行分类。假设中假设酿酒葡萄的质量和葡萄酒的质量相对应,结合葡萄酒的质量再分等级。
主成分分析法的原理阐述[1]:主成分分析是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各个主成分之间互不相关,从而这些主成分能够反映原始变量的绝大部分信息,且所含的信息互不重叠。
假设用p个变量来描述研究对象,分别用来表示,这P个变量构成的P维随机向量为。对X进行线性变化,考虑原始变量的线性组合:
主成分是不相关的线性组合,并且是的线性组合中方差最大者,是与不相关的线性组合中方差最大者,,是与都不相关的线性组合中方差最大者。
酿酒红葡萄主成分模型的建立过程:
根据附件二中所给的27种酿酒红葡萄的理化指标,计算每种指标的平均值,即得到样本的数据矩阵其中表示第i中葡萄样品的第j种指标的平均值;
为了消除各项指标之间的量纲化和数量级上的差别,本文利用SPSS 19.0对指标数据进行标准化,得到标准化矩阵(见附表一);
对标准化数据矩阵用SPSS 19.0做主成分分析,求出特征值,主成分贡献率和累积方差贡献率如下表,:
表三 主成分分析的方差分解图
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
6.968
23.228
23.228
6.968
23.228
23.228
2
4.941
16.471
39.698
4.941
16.471
39.698
3
3.734
12.447
52.145
3.734
12.447
52.145
4
2.840
9.468
61.613
2.840
9.468
61.613
5
2.000
6.666
68.279
2.000
6.666
68.279
6
1.741
5.805
74.084
1.741
5.805
74.084
7
1.419
4.729
78.813
1.419
4.729
78.813
8
1.269
4.231
83.044
1.269
4.231
83.044
9
.961
3.205
86.248
10
.738
2.459
88.708
11
.691
2.302
91.010
12
.514
1.713
92.723
13
.494
1.646
94.369
14
.373
1.243
95.612
15
.295
.983
96.595
16
.254
.846
97.441
17
.218
.726
98.168
18
.200
.667
98.835
19
.112
.373
99.208
20
.071
.237
99.445
21
.061
.205
99.650
22
.043
.143
99.794
23
.032
.108
99.902
24
.016
.053
99.955
25
.010
.034
99.989
26
.003
.011
100.000
27
5.868E-17
1.956E-16
100.000
28
-6.241E-17
-2.080E-16
100.000
29
-2.849E-16
-9.497E-16
100.000
30
-5.294E-16
-1.765E-15
100.000
根据选取主成分个数的原则,特征值要求大于1且方差累积贡献率达80%-95%的特征值所对应的1,2,…,m ,其中的m即为确定的主成分个数,所得结果如下表:
表四 特征值以及提取主成分的个数
6.968
4.941
3.734
2.840
2.000
1.741
1.419
1.269
8
将前八个因子载荷矩阵输入到SPSS数据编辑窗口(为变量),然后利用“转换计算变量”,在对话框输入,,即可求得主成分系数,如下表:
表五 红葡萄主成分系数(特征向量)
A1
A2
A3
A4
A5
A6
A7
1
0.14
0.24
0.01
0.27
-0.17
-0.23
0.14
2
0.23
-0.22
0.09
0.16
0.14
-0.1
0.07
3
-0.05
-0.18
0.05
-0.01
-0.39
0.1
-0.02
4
0.32
-0.05
-0.05
-0.18
0.07
0.15
-0.08
5
0.14
0.04
0.19
0.23
0.22
-0.11
0.17
6
0.15
0.14
0.09
-0.39
0.06
0.28
-0.09
7
0.12
0.09
0.21
-0.22
0.25
-0.05
0.24
8
0.12
0.04
-0.11
-0.35
0.17
-0.26
-0.01
9
0.23
-0.04
0.03
-0.42
-0.01
-0.04
-0.07
10
0.29
-0.21
-0.01
0.13
-0.02
0.09
0.18
11
0.33
-0.08
-0.09
0.13
-0.01
0.14
-0.01
12
0.29
-0.07
-0.14
-0.04
-0.12
0.19
0.2
13
0.27
-0.13
-0.1
0.17
0.02
0.23
0.1
14
0.02
-0.03
0.42
0.04
-0.15
0.12
0.25
15
0.21
0.01
0.01
-0.04
-0.12
-0.38
0.4
16
0.1
0.35
-0.08
0.15
0.07
-0.03
-0.06
17
0.03
0.35
-0.06
0.08
0.08
-0.08
-0.04
18
0.09
0.34
-0.16
0.09
0.09
-0.04
-0.02
19
0.1
-0.13
0.09
0.41
0.09
-0.09
-0.24
20
-0.11
0.21
-0.31
0
-0.23
0.17
0.25
21
0.15
-0.02
0.22
0
0.38
-0.08
-0.27
22
0.14
0.38
-0.1
0.06
0.07
-0.02
0.05
23
-0.13
-0.21
-0.11
0.04
0.42
0.03
0.19
24
-0.2
-0.16
-0.24
0.05
0.19
0.11
0.19
25
0.22
-0.1
0.09
-0.13
-0.29
-0.31
0.07
26
0.21
-0.08
-0.14
0.1
0.01
0.3
-0.12
27
-0.1
-0.11
-0.32
-0.07
0.23
-0.06
0.4
28
-0.21
-0.15
0.16
-0.02
0.04
-0.23
0.06
29
-0.13
0.13
0.38
0.03
-0.02
0.22
0.22
主成分方程:将上表中的特征向量与标准化后的数据相乘得出主成分表达式。
其中表示标准化后的葡萄样品的第i个指标值;;
由上述表达式,并结合表一中主成分的方差贡献率,分析可知,特征向量较大的是:花色苷(),总酚(),白藜芦醇(),,还原糖(),果穗质量(),PH值(),干物质含量(),L(), b()等9项。通过SPSS 19.0软件对葡萄酒的9项指标进行快速聚类分析,将其分为四级,由第一问的结论知,第二组评酒员的评分结果更为可信,所以根据第二组评分对27种红葡萄酒样品按总分从高到低排序,本文此处认为,与葡萄酒样品对应的酿酒葡萄好坏与酒样品一致,故对酿酒红葡萄的等级评定可参照红葡萄酒质量的得分,最终分解结果为:
表六 酿酒红葡萄样品的分级
一
二
三
四
样品号
1,2,8,9,23
3,6,12,17
5,10,14,15,20,24,25,26,27
4,7,11,12,16,18,19,21,
22
6.2.2酿酒白葡萄的理化指标的主成分分析
酿酒白葡萄的理化指标的主成分分析方法与酿酒红葡萄相同,用类似6.2.1的分析法可得到酿酒白葡萄的主要理化指标,再对酿酒白葡萄样品进行聚类分析(求解过程以及中间结果见附录),可得到酿酒白葡萄样品的分级为:
表七 酿酒白葡萄样品的分级
等级
优
良
中
差
样品号
4,5,9,14,17,18,19,20,21,22,23,25,26,28
10,13,15
1
2,3,6,7,8,11,12,16,27,
24
6.3问题三酿酒葡萄与葡萄酒的理化指标联系的分析
6.3.1酿酒红葡萄与红葡萄酒的理化指标联系的相关性分析
模型一:酿酒红葡萄与红葡萄酒的理化指标联系的相关性分析
有些理化指标对酿酒葡萄与葡萄酒的理化指标的影响比较大,本文先用主成分分析法对其进行降维处理,得到主要理化指标。相关性分析方法不需要区分自变量和因变量,通过相关分析可以了解变量之间的关系密切程度,故本文采用相关分析法分析两者之间的联系。首先,利用SPSS 19.0对红葡萄酒的理化指标作主成分分析,分析结果如下表:
表八 主成分分析结果
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的 %
累积 %
合计
方差的 %
累积 %
1
4.656
66.510
66.510
4.656
66.510
66.510
2
1.369
19.557
86.166
1.369
19.557
86.066
3
0.457
6.522
92.588
4
0.296
4.227
96.815
5
0.151
2.160
98.974
6
0.042
0.593
99.568
7
0.03
0.432
100
表九 红葡萄酒主成分矩阵
成份矩阵a
成份
1
2
花色苷
.802
-.279
单宁
.947
-.080
总酚
.979
.077
酒总黄酮
.933
.029
白藜芦醇
.456
.785
DPPH半抑制体积
.968
.144
色泽
-.375
.800
表十 红葡萄酒的主成分系数矩阵
A1
A2
1
0.37
-0.39
2
0.41
-0.3
3
0.43
0.09
4
0.40
0.09
5
0.19
0.8
6
0.42
0.19
7
-0.38
0.39
由表八可见,成分1、成分2的特征值大于1,且方差的累积贡献率为86.166%,大于80%,根据主成分选取指标的原则,选取前两个主成分来代表红葡萄酒的7项指标,由表十可写出主成分表达式。
第一种主成分方程:
其中为葡萄酒第i种理化指标标准化后的指标值,它对应的原始值为。 由表八知,第一主成分方差贡献率最大为66.510%,通过的表达式能得到特征向量较大的是总酚;
第二种主成分方程:
由表八知,第二主成分方差贡献率最大为19.557%,通过的表达式能得到特征向量较大的是色泽。
综上得:特征向量较大的是总酚和色泽两项。
本文在第二问中已经对酿酒葡萄的理化指标做了主成分分析,分别求得了酿酒红葡萄的8个主成分并找出了特征向量较大的指标,其中红葡萄的指标中特征向量较大的是花色苷(),总酚(),白藜芦醇(),,还原糖(),果穗质量(),PH值(),干物质含量(),L(), b()等9项。
现在对酿酒红葡萄的9项指标和红葡萄酒的2项指标用SPSS 19.0作双变量相关性分析,所得结果见附录中附表八。
由附表八数据分析,红酒总酚与花色苷、总酚的相关系数分别为0.774,0.875,且三者,故红酒总酚与花色苷、总酚正相关;红酒色泽与花色苷、干物质含量、果穗质量、L的相关系数分别为-0.446,-0.42,0.435,0.458,分别为0.02,0.029,0.023,0.016,且均小于0.05,故红酒色泽与故红酒色泽与花色苷,干物质含量呈负相关,与果穗质量,L呈正相关。
6.3.2酿酒红葡萄和红葡萄酒理化指标的多元线性逐步回归分析
模型二:酿酒红葡萄的理化指标与红葡萄酒总酚的多元线性逐步回归模型
将酿酒红葡萄的9个代表指标作为自变量,分别以红葡萄酒总酚、红葡萄酒色泽作为因变量,利用SPSS 19.0进行多元线性逐步回归分析,所得结果如下表:
表十一 酿酒红葡萄的理化指标与红葡萄酒总酚的线性回归
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
1.362
.593
2.298
.030
总酚
.333
.037
.875
9.044
.000
2
(常量)
1.684
.570
2.953
.007
总酚
.253
.050
.664
5.057
.000
花色苷
.008
.004
.290
2.213
.037
3
(常量)
7.536
3.251
2.318
.030
总酚
.292
.052
.767
5.579
.000
花色苷
.007
.004
.237
1.847
.078
PH
-1.792
.981
-.174
-1.826
.081
表十二 酿酒红葡萄的理化指标与红葡萄酒色泽的线性回归
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
47.362
1.026
46.180
.000
花色苷
-.090
.007
-.924
-12.084
.000
2
常量)
48.883
1.082
45.190
.000
花色苷
-.091
.007
-.935
-13.617
.000
白犁
-.293
.110
-.183
-2.668
.013
由表十一可写出回归方程为
由表十二可写出回归方程为
通过对酿酒红葡萄和红葡萄酒的理化指标做相关性分析和多元线性回归分析,可知酿酒红葡萄和红葡萄酒理化指标的联系。
6.3.3酿酒白葡萄与白葡萄酒的理化指标联系的相关性分析
模型一:酿酒白葡萄与白葡萄酒的理化指标联系的相关性分析
酿酒白葡萄与白葡萄酒的理化指标的联系分析方法同酿酒红葡萄与红葡萄酒的理化指标的联系分析方法。
利用SPSS 19.0对白葡萄酒的理化指标作主成分分析,分析结果见附表八至
附表十一。
根据附表十一,写出第一种主成分方程:
由附表九知,第一主成分方差贡献率最大为48.677%,通过的表达式能得到特征向量较大的是总酚;
第二种主成分方程:
由附表九知,第二主成分方差贡献率最大为17.188%,通过的表达式能得到特征向量较大的是色泽。
现在对酿酒白葡萄的9项指标和白葡萄酒的2项指标用SPSS 19.0作双变量相关性分析,所得结果见附录中附表十二。
由附表十二数据分析,白葡萄酒总酚与酿酒白葡萄总酚的相关系数分别为0.547,,故白葡萄酒总酚与酿酒白葡萄总酚呈正相关;白葡萄总酚与葡萄总黄酮、单宁的相关系数分别为0.588,0.573,且,故白葡萄酒总酚与葡萄总黄酮、单宁均呈呈正相关;白葡萄酒总酚与果梗比的相关系数为-0.434,,故白葡萄总酚与果梗比呈负相关;白葡萄酒色泽与干物质含量的相关系数为0.670,,故白葡萄酒色泽与干物质含量呈正相关;白葡萄酒色泽与百粒质量的相关系数为-0.379,,故白葡萄酒色泽与百粒质量呈负相关。
6.3.4酿酒白葡萄和白葡萄酒理化指标的多元线性回归分析
模型二:酿酒白葡萄的理化指标与白葡萄酒总酚的线性回归模型
将酿酒白葡萄的9个代表指标作为自变量,分别以白葡萄酒总酚、白葡萄酒色泽作为因变量,利用SPSS 19.0进行多元线性回归分析,所得结果如下表:
表十三 酿酒白葡萄的理化指标与白葡萄酒总酚的线性回归
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
.911
.168
5.416
.000
葡萄总黄酮
.144
.039
.588
3.707
.001
2
(常量)
-1.228
1.004
-1.223
.233
葡萄总黄酮
.151
.036
.618
4.142
.000
干物质含量
.090
.042
.322
2.157
.041
表十四 酿酒百葡萄的理化指标与白葡萄酒色泽的线性回归
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
32.772
.458
71.630
.000
干物质含量
.090
.020
.670
4.600
.000
2
(常量)
32.741
.398
82.175
.000
干物质含量
.098
.017
.733
5.707
.000
苹果酸
-.044
.014
-.392
-3.051
.005
由表十三可写出回归方程为
由表十四可写出回归方程为
通过对酿酒白葡萄和白葡萄酒的理化指标做相关性分析和多元线性回归分析,可知酿酒白葡萄和白葡萄酒理化指标的联系。
6.4问题四酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的关系
6.4.1酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响
首先,对第二问中得到酿酒红葡萄的代表指标与第一问中第二组评酒员对27种红葡萄酒样品的总评分的平均值(即感官指标)利用SPSS 19.0作相关性分析,所得结果如下表:
表十五 酿酒红葡萄的理化指标与葡萄酒质量的相关性分析
花色苷
总酚
白藜芦醇
干物质
果穗
PH
b
果皮质量
L
感官指标
Pearson相关性
0.272
0.647
-0.244
-0.081
0.21
0.527
-0.476
0.237
-0.17
显著性(双侧)
0.17
0
0.221
0.686
0.293
0.005
0.012
0.235
0.396
N
27
27
27
27
27
27
27
27
27
由上表可知葡萄酒质量与总酚的相关系数为0.647,,与PH的相关系数分别为0.527,,故总酚、PH值与葡萄酒质量成正相关;葡萄酒质量与b的相关系数为-0.476,,故b与葡萄酒质量呈负相关。
其次,对第三问中得到红葡萄酒的的代表指标与其感官指标利用SPSS 19.0作相关性分析,所得结果如下表:
表十六 红葡萄酒的理化指标与葡萄酒质量的相关性分析
花色苷
单宁
总酚
酒总黄酮
白藜芦醇
DPPH
色泽
感官指标
Pearson相关性
0.153
0.486
0.493
0.518
0.511
0.550
-0.205
显著性(双侧)
0.447
0.010
0.009
0.006
0.006
0.003
0.306
N
27
27
27
27
27
27
27
由上表可知葡萄酒质量与花色苷的相关系数为0.486,,故花色苷与葡萄酒质量相关;葡萄酒质量与总酚的相关系数为0.493,,故总酚与葡萄酒质量呈正相关;葡萄酒质量与酒总黄铜,白藜芦醇的相关系数分别为0.518,0.5114,且,故酒总黄酮与白藜芦醇均与葡萄酒质量呈正相关;葡萄酒质量与DPPH的相关系数为0.550,,故DPPH与葡萄酒质量呈正相关。
6.4.2酿酒白葡萄和白葡萄酒的理化指标对白葡萄酒质量的相关性分析
首先,对第二问中得到酿酒白葡萄的代表指标与第一问中第二组评酒员对28种白葡萄酒样品的总评分的平均值(即感官指标)利用SPSS 19.0作相关性分析,所得结果见附表十三;
其次,对第三问中得到白葡萄酒的的主要理化指标与其感官指标利用SPSS 19.0作相关性分析,所得结果见附表十四。
由附表十四可知葡萄酒质量与酒石酸的相关系数为0.376,,故酒石酸与葡萄酒质量成正相关。
6.4.3用酿酒红葡萄与红葡萄酒的理化指标评价红葡萄酒质量
将红葡萄酒质量评分作为因变量,分别以酿酒红葡萄的代表指标和红葡萄酒的代表指标作为自变量,利用SPSS 19.0进行多元线性回归分析,所得结果如下表:
表十七 酿酒红葡萄与红葡萄酒质量的线性回归
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
64.804
1.471
44.045
.000
总酚
.388
.091
.647
4.245
.000
2
(常量)
61.741
1.720
35.904
.000
总酚
.442
.084
.737
5.281
.000
果穗质量
.009
.003
.384
2.748
.011
3
(常量)
60.690
1.585
38.283
.000
总酚
.653
.109
1.088
6.002
.000
果穗质量
.010
.003
.412
3.293
.003
花色苷
-.021
.008
-.473
-2.665
.014
4
(常量)
61.264
1.478
展开阅读全文