1、基于统计学原理对葡萄酒质量的评价与研究摘要葡萄酒的评价涉及原料、加工、主要成分比重等多方面因素,本文旨在运用统计学原理对葡萄酒质量进行必要的讨论和研究。问题一根据题目已给出的数据,运行SPSS 18.0软件,对每款葡萄酒在每个评酒小组中的总体评分和四个大项(外观、香气、口感、平衡)评分均分别进行配对样本T检验,用以分析两个小组的差异性,运行结果显示无论是总体还是单项,两小组均存在显著性差异(见表3)。随后通过方差分析的方法,比较两个小组内部对各款葡萄酒评分的方差。最终,得到结果第二组平均方差小于第一组(见表11),说明第二组更为可靠。问题二,首先采用最小均方差法对酿酒葡萄的理化指标进行筛选。随
2、后,用主成分分析法确定保留下来的指标间的权重。接下来,将指标记性无量纲处理,并结合其权重得到酿酒葡萄的理化性质得分(G)。最后,根据该得分将酿酒葡萄进行聚类,同时结合葡萄酒质量的分级确定酿酒葡萄的等级。计算结果显示,红葡萄方面,“优等”包括2号样品等五种;“良等”包括4号样品等十三种;“中等”1号样品等九种。白葡萄方面,“优等”包括4号样品等六种;“良等”包括1号样品等十三种;“中等”2号样品等九种。且从红(白)酿酒葡萄分级和红(白)葡萄酒的质量分级的符合度77.8%(81.4%)来看,两种分类分级均有相似的结果的,说明本模型对酿酒葡萄的分级效果良好。问题三首先运用SPSS 18.0软件分别计
3、算酿酒葡萄和葡萄酒理化指标的相关系数,除去部分相关性较高的指标。然后,对剩余指标进行典型相关性分析,通过比较不同指标间的典型相关系数确定酿酒葡萄和葡萄酒理化指标的联系。问题四,对葡萄酒的理化指标运用最小均方差法筛选部分指标。同时结合问题二中筛选的酿酒葡萄的理化指标,运用SPSS 18.0软件构建这些指标与葡萄酒质量(第二组评酒员的总体评分)之间的线性回归方程。最终得到回归方程如下: 红葡萄酒: 白葡萄酒: 运行的结果来看,红(白)葡萄酒的可决系数分别为0.595和0.570,回归方程的拟合效果一般。说明用酿酒葡萄和葡萄酒的理化指标虽可以在一定程度上反映葡萄酒的质量,但不能用理化指标完全代替酒品
4、的质量。关键词:葡萄酒质量评价 理化指标 最小均方差法 典型相关分析 SPSS 18.0软件一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2根据酿酒葡萄的理化指标和葡
5、萄酒的质量对这些酿酒葡萄进行分级。3分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型假设1各评酒员打分相互独立,互不干扰2忽略葡萄酒生产、运输、储藏等环节对酒品质的影响3理化指标和芳香化物中未检测到的物质含量可视为零4已知数据真实可用三、符号说明 第i种红葡萄酒酿酒葡萄的理化指标得分 第i种红葡萄酒酿酒葡萄的理化指标得分 第a小组中第j位评酒师对第i款红葡萄酒质量的总评分 第a小组中第j位评酒师对第i款白葡萄酒质量的总评分 . .酿酒葡萄的理化指标四、问题分析本题目的核心在于解决酿酒葡萄
6、理化指标、葡萄酒自身理化指标以及葡萄酒质量高低的内在关系。通过文献的阅读发现葡萄酒品质很大程度上受自身内部物质影响,因此需逐步分析各项重要指标间的相关性,最终建立它们与葡萄酒品质的数学模型是本题的突破口。问题一,质量上乘的葡萄酒必然拥有光润的色泽,浓郁的嗅感以及醇正的口感。然而,由于个体差异的存在,对于同一款葡萄酒的鉴赏不同评酒师之间也不尽相同,尤其是经验丰富评酒师,在多年与葡萄酒打交道中间,更会对其品相的优劣产生独到的见解。因此要鉴定某种葡萄酒的质量,就必须综合葡萄酒色泽、嗅感及口感等诸多方面因素对葡萄酒进行整体评价。由题意知要分析两组评酒员的评价结果有无差异性,就是检验每组评酒元对同一种酒
7、的四大项打分和总分是否具有显著性差异,对于这样的配对资料的数据均值的检验,我们拟采用配对样本的T检验来解决。针对哪组更有效问题,也即是检测那组评分结果的内部离散程度大小。离散程度越小其可靠性就越高,通过方差分析,变异系数,极差分析等都可以解决,但是本文采用最常用的方法方差分析已解决此问题。问题二,根据文献和实际生活,对酿酒葡萄进行分级的依据主要是葡萄自身的物理化学性质,而由该品种葡萄所酿制的葡萄酒的级别也可以反过来反映葡萄所在的级别。所以可以对酿酒葡萄的理化指标进行处理,得到一个综合反映其性质的量值,根据该量值和葡萄酒质量的分级,对酿酒葡萄划分等级。问题三,由于葡萄酒是由酿酒葡萄经过加工提取而
8、成,故二者在理化性质方面必然存在紧密的联系。分别选取两者最具代表性的指标,随后进行典型相关分析,找出相关性较高的若干指标,并对相关情况予以合理解释可解决此问。问题四要求用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量,就必须建立葡萄酒质量和葡萄、葡萄酒理化指标的回归方程。在问题二已经筛选出一部分酿酒葡萄理化指标的基础上,继续对葡萄酒的理化指标进行筛选,得到最能反映变化规律的指标引入回归方程,继而对葡萄酒的质量进行评价。五、模型建立与求解5.1.1 .问题一5.1.1 .两个组评酒小组评分的差异性分析5.1.1.1 计算每种酒样品在两组中的总评分,分析结果的差异性本题中,对于某款葡萄酒品质的评价需要
9、考虑包括澄清度、色调、纯正度等在内十个因素,而每组的十名评酒员则需根据本身的专业知识对葡萄酒的这十项指标进行打分,最后对每个指标进行求和即为该评酒员(第j位评酒员)对第i款葡萄酒的评分,如式(1): (1)而每个小组中十位评酒员的平均分,则为此款葡萄酒在该评酒小组中的最终评分,如式(2): (2)根据公式(1)(2)和已给数据,即可得到各款红(白)葡萄酒分别在两个小组中的得分,见表(1)(2):(注:本题中数据中第3号白葡萄酒的第二组3号评酒员评分“77”为错误数据,应为“7”另外,第二组第20红葡萄酒的第一组5号评酒员评分空缺,本文采用该评酒员评分的众数,即评分为“6”)表(1)各款红葡萄酒
10、在两个小组中的评分(略表,详表见附录)红葡萄酒第一组评分第二组评分酒样品162.768.1酒样品280.374.0酒样品380.474.6酒样品468.671.2酒样品573.372.1酒样品672.266.3酒样品2773.171.5表(2)各款白葡萄酒在两个小组中的评分(略表,详表见附录)白葡萄酒第一组评分第二组评分酒样品182.077.9酒样品274.275.8酒样品378.375.6酒样品479.476.9酒样品571.081.5酒样品668.475.5酒样品2881.379.6为便于比较各组评分中的差异,故在不同小组中,按照红(白)葡萄酒总评分对其进行排序,并得到表(3)(4):表(
11、3)各款红葡萄酒的总评分在两个小组中的排序(略表,详表见附录)次序第一组第二组1酒样品23酒样品92酒样品9酒样品233酒样品3酒样品204酒样品2酒样品35酒样品17酒样品176酒样品19酒样品227酒样品12酒样品11表(4)各款白葡萄酒的总评分在两个小组中的排序(略表,详表见附录)次序第一组第二组1酒样品1酒样品52酒样品28酒样品93酒样品26酒样品174酒样品4酒样品105酒样品17酒样品286酒样品3酒样品2528酒样品12酒样品16通过上表可以发现,无论红葡萄酒还是白葡萄酒,得分方面或各种酒品的排序,两个小组均存在较大的出入,且对白葡萄酒的评价分歧更大。运用SPSS 18.0软件
12、,首先对对表(1)(2)进行检验是否服从正态分布,结果显示(运行结果详见附录):第一组红葡萄酒:第二组红葡萄酒:第一组白葡萄酒:第二组白葡萄酒:上述结果表明,p值均大于0.05,显示资料服从正态分布,可以进行配对样本T检验。分别进行配对样本T检验,分析其差异性,最终运行实验得到两组p值分别如下(运行结果见附录):红葡萄酒:白葡萄酒:故运算证明两个小组对红(白)葡萄酒的评价均有显著性差异。5.1.1.2 分析两组对不同指标的评价的差异性在明确了两个小组对于每款葡萄酒的评价存在显著性差异之后,仍需对造成该差异的原因进行讨论。根据十项指标的评价角度,可以将其划分为“外观分析、香气分析、口感分析和平衡
13、/整体评价”等四大类别,分别计算每款葡萄酒诸类别的评分。与上文方法类似,运用SPSS 18.0软件,对两个小组每款葡萄酒的这四个类别分别进行配对样本T检验,分析两组在不同指标评价方面的差异,根据运行结果(见附录)得到两组红(白)葡萄酒p值列表如下,表(5)(6):表(5)两个小组对每款红葡萄酒各类别评价的p值评价类别外观分析香气分析口感分析平衡/整体评价p值0.0150.0160.1410.661表(6)两个小组对每款白葡萄酒各类别评价的p值评价类别外观分析香气分析口感分析平衡/整体评价p值0.4580.5880.0010.002通过上表可以发现,在红葡萄酒的评价方面,两个小组的主要差异在于“
14、外观分析和香气分析”方面(p0.05);而白葡萄酒方面,二者的差异在于“口感分析和平衡/整体评价”方面。在此,本文以“外观分析”为例,继续进行差异性的讨论。统计每款红葡萄酒在每组中的外观分析得分,见表(7),并据此绘制折线图,如图(1):表(7)各款红葡萄酒的外观分析评分(略表,详表见附录)红葡萄酒第一组外观分析评分第二组外观分析评分酒样品18.710.7酒样品210.110.1酒样品312.010.2酒样品412.09.9酒样品512.710.8酒样品610.98.7酒样品279.99.9图(1)各款红葡萄酒外观分析评分折线图白葡萄酒同理,得到表(8)和图(2):表(8)各款白葡萄酒的外观分
15、析评分(略表,详表见附录)白葡萄酒第一组评分第二组评分酒样品111.210.1酒样品210.910.9酒样品311.29.7酒样品411.610.4酒样品57.410.6酒样品69.69.0酒样品2812.711图(2)各款白葡萄酒外观分析评分折线图通过上图可以看出,无论红(白)葡萄酒,第二组的“外观分析”评分变化较第一组要平稳,而且在最优和最劣的评价上二者也不尽相同。说明两个小组对于外观的好坏的理解并不完全一致,但总体而言第二组对外观的要求比第一组更加严格。其他诸类别也可同理进行分析,在此便不做赘述。5.1.1.2 分析两组内不同评酒员评价的差异性在考虑了各小组对葡萄酒不同指标上的评价差异外
16、,两个小组内部评酒员对于葡萄酒优劣的认识不同,也是造成二者显著性差异的重要原因。为便于讨论,本文分别仅随即抽取一款红葡萄酒和一款白葡萄酒作为研究对象,分析两小组自身内部的差异性。对数据稍加整理,得到两款葡萄酒在不同小组内部的总得分分别如下:表(9)不同评酒员对17号红葡萄酒评分情况评酒员(j)12345678910极差第一组7079916897826980817628第二组7273757475777976766811图(3)不同评酒员对7号红葡萄酒评分情况折线图表(10)不同评酒员对5号白葡萄酒评分情况评酒员(j)12345678910极差第一组7847865479918568738134第二
17、组8379798077878273849118图(4)不同评酒员对25号白葡萄酒评分情况折线图从对7号红葡萄酒的评分中可以看出,第二组评分普遍比第一组较低,同时极差小于第一组,显示其内部波动较小,说明在对这款红葡萄酒的评价方面,第一组内部分歧较大,不如第二组稳定。对第25号白葡萄酒评价也是如此。在对全部红(白)葡萄酒以相同方式进行分析,结果发现对于大多数酒品而言,两个小组都出现了类似7号红葡萄酒和25号白葡萄酒的情况,这也从另一方面反映了两个评酒小组出现显著性差异的客观事实。5.1.2. 葡萄酒评价的可信度分析为判定哪一组评酒员对葡萄酒品质的鉴定更加准确,需对两组的评价进行可信度分析。在每个小
18、组的中,如果不同评酒员对同一款葡萄酒的质量评价相差很大,就说明改组内部波动性较大,一致性较差。在实践中,常用方差刻画系统内部的波动性,故方差分析是考察可信度最直接、最简洁的方法。根据数据,构建方差分析公式如下,式(3): (3)本文中,K表示每组中评酒员人数,即;表示第i款葡萄酒在第a组总评分的方差。分别计算每一款葡萄酒在第一、二小组内部的方差,方差越小,说明该小组内部稳定性越高,评价结果可信度越高。运行Excel软件将数据代入式(3),得到每款红(白)葡萄酒在不同小组的组内方差和方差平均值,如下表(11)(12):表(11)每款红葡萄酒在两个小组内的方差(略表,详见附录)酒样品(i)1234
19、27平均数第一组92.939.7945.82108.4449.7858.229第二组81.8816.2230.7141.2915.2934.460表(12)每款白葡萄酒在两个小组内的方差(略表,详见附录)酒样品(i)123428平均数第一组92.22201.666.4644.7180.46118.943第二组25.8849.07142.4842.125.3855.135根据上表,很显然可以看出,无论红(白)葡萄酒,第二组的方差平均数均小于第一组,说明第二组的评酒员对葡萄酒的评鉴更加一致,其内部差异较小,可信度更高。5.2.1 .问题二5.2.1 .最小均方差法筛选酿酒葡萄指标5.2.1.1 .
20、根据酿酒葡萄的指标进行分类本题中,评价酿酒葡萄的指标数目繁多,但通过观察分析可以发现,很多的指标都反应了酿酒葡萄的同一属性,换言之,这些指标可以归为同一类别。通过查阅文献,并结合已给数据可以将酿酒葡萄的诸多指标按照“颜色、口感、气味、营养物质、物理性状”分为五类,即式(4): (4)而每大类之内也均包含相应一级指标,具体指标分类见下表:表(13)各类别所包含的指标类别包含指标(T)花色苷,多酚氧化酶活力,褐变度,DPPH自由基,黄酮醇,色谱仪参数a、b、l、h、c总酸,总酚,单宁,葡萄总黄酮,白藜芦醇,总糖,还原糖,pH值,固酸比各类芳香化物氨基酸总量,蛋白质,VC含量干物质含量,果穗质量,百
21、粒质量,果梗比,出汁率,果皮质量将酿酒葡萄的诸多指标按一定规则分类,可以更加精准的反映这些指标的内在联系和影响。5.2.1.2 .最小均方差法筛选评价指标由于酿酒葡萄的指标众多,不可能完全将全部指标进入评价模型,因此需对所有指标进行一定的筛选,保留最能反映酿酒葡萄之间的差异和质量的指标。本题中选用最小均方差法对指标进行甄选。若某一指标的方差较小,即表示该指标在不同的酿酒葡萄间的变化不大,取值近似相等,则说明该指标本身很重要,但就对评价结果影响不大。而所谓最小均方差法就是在全部m个指标中,比较每个指标的方差,排除方差最小的指标,保留对酿酒葡萄影响最大的指标。根据式(5)计算各红(白)葡萄酒各指标
22、的方差: (5)上式中,表示指标l在全部葡萄间的均值,表示第i种葡萄指标l的含量。为便于叙述,本文仅以红葡萄酒为例进行讨论。根据已给的数据,运行SPSS 18.0软件中“求解方差”命令,计算所有指标的方差,得到下表(14)(18):表(14)颜色类各指标方差指标褐变度花色苷黄酮醇 多酚氧化酶活色谱仪参数h色谱仪参数a色谱仪参数c色谱仪参数l色谱仪参数bDPPH自由基方差331.387.9439.699.6217.42.092.161.130.960.11表(15)口感类各指标方差指标还原糖总糖总酚 单宁固酸比白藜芦醇葡萄总黄酮 总酸 方差33.822.666.516.505.995.374.7
23、91.72表(16)气味类各指标方差指标乙酸乙酯乙酸己酯乙酸甲酯1-己醇乙醇-蒎烯方差539.9184.4161.3119.937.00.247表(17)营养类各指标方差指标氨基酸重量蛋白质VC含量方差1536.344.551.92表(18)物理性状别类各指标方差指标果穗质量 百粒质量 出汁率 干物质含量 果梗比果皮质量方差158.6058.217.142.421.090.06从上表中可以看出,每个大类中方差差异很大,选择方差差距三倍以上的项目为最终评价指标引入评价模型,故红葡萄酒的酿酒葡萄最终选择8个指标,表(19):表(19)红葡萄酒酿酒葡萄所选最终指标类别包含指标(T)花色苷,褐变度总糖
24、,还原糖乙酸乙酯氨基酸总量果穗质量,百粒质量白葡萄酒与红葡萄酒同理,最终也选择8个指标,表(20):表(20)白葡萄酒酿酒葡萄所选最终指标类别包含指标(T)褐变度总糖,还原糖,固酸比乙酸乙酯氨基酸总量果穗质量,百粒质量5.2.1.2 .对筛选指标的合理解释通过查阅文献可知,虽然红酒内物质含量众多,但最终决定葡萄酒属性的物质却仅是少部分。红葡萄酒方面,类中,花色苷为红葡萄酒中重要色素,而褐变度表征红葡萄酒的红润程度,二者最能代表酒品的颜色属性;在类中可以看出,总糖、还原糖方差较其他因素较大,说明在葡萄酒的评价中甜味感是最终影响口感的重要因素;在香味方面,文献显示在酒类发酵加工过程中,乙醇和乙酸化
25、合生成的乙酸乙酯是酒内部最重要的芳香化物,也是决定香气物质;葡萄物理性状中的果穗质量和百粒质量是评价葡萄好坏的重要指标。白葡萄酒和红葡萄酒相似,但仍略有差异。在颜色类别中,因为白葡萄酒本身是无色透明,花色苷含量以及变化都显然要比红葡萄酒差异性小,所以不考虑花色苷因素;而在方面,白葡萄酒的口感更讲究各种口味的平衡适中,因此增加固酸比一项。总体而言,通过最小均方差法筛选的指标具有很高的合理性,可以较好反映酿酒葡萄的各项属性,符合客观实际。5.2.2 .建立酿酒葡萄分级综合评价模型在确定红(白)葡萄酒分级的指标后,仍需建立葡萄酒分级的评价模型,综合酿酒葡萄的理化指标和葡萄酒质量这两方面因素,确定各款
26、红(白)葡萄酒的等级。5.2.2.1 .基于主成分分析法确定酿酒葡萄指标的权重上文中已介绍筛选部分酿酒葡萄的理化指标引入评价模型,但仍不明确各指标在模型中所占的地位,故需要明确已筛选得到的指标间的权重关系。主成分分析法是利用降维的思想,大量原始数据转化为少数几个综合指标。本题中,可对已选择抽提为数目较少且相互独立的若干变量,每个变量对于整体的影响程度用该变量的贡献率进行刻画。变量数目的选取上要求这些变量的累计贡献率之和大于85%,即式(6): (6)而指标l()对变量i()的影响程度则记为该指标对该变量的载荷,通过指标在每个变量的载荷和每个变量贡献率即可得到指标l的权重,即式(7): (7)运
27、行SPSS 18.0软件对已选的指标(仍以红葡萄为例,白葡萄同理)进行主成分分析(结果详见附录),整理各主成分的贡献率如表(21)。表(21)主成分贡献率统计主成分()贡献率()累计贡献率()第一主成分()32.99132.991第二主成分()19.78252.773第三主成分()14.66367.436第四主成分()11.49978.935第五主成分()7.68486.619第六主成分()5.80592.424第七主成分()4.75097.174第八主成分()2.826100.000当累计贡献率大于85%时,选择前5个主成分进行分析。因此,红葡萄各指标对各主成分的的载荷如下表(22):表(2
28、2)各类别所包含的指标第一主成分()第二主成分()第三主成分()第四主成分()第五主成分()总糖0.730-0.4300.2500.0490.081还原性糖0.610-0.4800.259-0.2180.102氨基酸总量0.650-0.397-0.0560.3690.379果穗总量-0.689-0.0160.6220.0950.178百粒质量-0.722-0.2690.444-0.2240.133褐变度0.3500.829-0.019-0.2060.109花色苷0.4120.6990.217-0.1930.410乙酸乙酯-0.6480.106-0.3250.3990.405将表(21)(22)
29、中的数据代入式(7),得到各指标的相互权重如下,表(23):表(23)红葡萄各指标的相互权重指标总糖还原性糖氨基酸总量果穗总量百粒质量褐变度花色苷乙酸乙酯权重(r)10.35%6.43%31.23%12.00%1.78%12.82%15.51%9.86%同理,白葡萄的相互权重为表(24):表(24)白葡萄各指标的相互权重指标总糖还原性糖氨基酸总量果穗总量百粒质量固酸比褐变度乙酸乙酯权重(w)12.56%7.83%12.28%7.07%14.91%19.11%16.12%10.08%5.2.2.2 .基于现行加权法构建葡萄评分模型上文已解决酿酒葡萄理化指标间的权重问题,综合理化指标和权重二者,可
30、得到某款葡萄酒理化指标得分,式(8): (8)进一步整理,即得到红(白)葡萄酒分评价模型如下:红葡萄酒: . (模型一)白葡萄酒: . (模型一)将相关数据分别代入模型一中,得到每种红(白)酿酒葡萄的分级得分如下,表(25)(26):表(25)各种红葡萄理化指标得分红葡萄理化指标评分酒样品129.1酒样品231.4酒样品343.7酒样品424.7酒样品529.3酒样品626.1酒样品2736.9表(26)各种白葡萄理化指标得分白葡萄理化指标评分酒样品142.6酒样品229.8酒样品354.9酒样品417.4酒样品525.3酒样品627.6酒样品2718.95.2.3 . 基于聚类分析划分酿酒葡
31、萄等级由于酿酒葡萄的等级高低最终将影响到葡萄酒的优劣,因此在得到酿酒葡萄分级得分后,可以根据葡萄酒质量分级确定酿酒葡萄的等级。目前,我国并未正式出台关于葡萄酒分级的国家标准,而全世界公认葡萄酒分级标准主要以法国为代表的“旧世界”模式和以美国为代表的“新世界”模式。但无论何种模式,都大致将酒品分为“特优级”、“优质级”和“佐餐级”三个级别。鉴于此,本文也将给出的红(白)葡萄酒划为“优等、良等、中等”三等。运行SPSS 18.0软件“快速聚类”命令,对红(白)葡萄酒质量分别进行聚类分析,划分类别为三类,具体分类情况如下(结果详见附录),表(27)(28):表(27)红葡萄酒等级评定等级葡萄酒样品编
32、号优等(1类)2号、3号、5号、9号、17号、23号良等(2类)4号、13号、14号、16号、19号、20号、21号、22号、24号、25号、26号、27号中等(3类)1号、6号、7号、8号、10号、11号、12号、15号、18号表(28)白葡萄酒等级评定等级葡萄酒样品编号优等(1类)5号、9号、10号、17号、21号良等(2类)1号、4号、6号、7号、8号、15号、18号、19号、20号、22号、23号、25号、28号中等(3类)2号、3号、11号、12号、13号、14号、16号、24号、26号同理根据酿酒葡萄理化指标,运行SPSS 18.0软件“快速聚类”命令,对红(白)酿酒葡萄进行聚类,
33、同样也分为三等如下,表(29)(30):表(29)红酿酒葡萄等级评定等级葡萄酒样品编号优等(1类)2号、3号、5号、9号、23号良等(2类)4号、13号、14号、15号、16号、17号、18号、19号、20号、21号、22号、24号、25号中等(3类)1号、6号、7号、8号、10号、11号、12号、26号、27号表(30)白酿酒葡萄等级评定等级葡萄酒样品编号优等(1类)4号、5号、8号、9号、10号、17号良等(2类)1号、6号、7号、18号、19号、20号、21号、22号、23号、24号、25号、27号、28号中等(3类)2号、3号、11号、12号、13号、14号、15号、16号、26号分别
34、比较表(27)和表(29)、表(28)和表(30)的符合度b,即分类相同的样品数(n)与样品总数(N),式(9): (9)带入数据后可得结果如下,式(10)(11):红酿酒葡萄和红葡萄酒:. (10)白酿酒葡萄和白葡萄酒: .(11)根据符合度来看,两种分类分级均有相似的结果的,说明本模型对酿酒葡萄的分级效果良好。5.3.1 问题三通常情况下,为了研究两组变量的相关关系,我们可以分别计算两组变量之间的全部共个相关系数,已达到简化计算的目的。5.3.1 相关指标的筛选根据酿酒葡萄对质量的影响程度,运行SPSS 18.0软件计算它们内部的相关系数,并对相关性和一致性很大的指标进行取舍。对指标进行计
35、算之后,相关性系数大于0.8的指标予以合并(具体指标的相关性系数见附录),下表为相关性系数大于0.8的具体指标,表(31)(32):表(31)红葡萄酒相关性系数较大(需合并)的指标葡萄DPPH自由基,总酚,总黄酮总糖,可溶性固形,干物质含量色谱分析仪参数a、b、c葡萄酒单宁,总酚,总黄酮,DPPH自由基色谱分析仪参数a、c表(32)白葡萄酒相关性系数较大(需合并)的指标葡萄总酚,总黄酮,总糖,可溶性固形,干物质含量可滴定酸,固酸比色谱分析仪参数l、b、c葡萄酒单宁,总酚,色谱分析仪参数l、b、c进过指标的合并后,最终确定刻画红葡萄和红葡萄酒的指标如下:红葡萄氨基酸总量,蛋白质,Vc含量,花色苷
36、,总酸,多酚氧化酶,褐变度,总酚,单宁,白藜芦醇,黄酮醇,总糖,还原糖,pH值,可滴定酸,固酸比,果穗质量,百粒质量,果梗比,出汁率,果皮质量,色谱分析仪参数l、a、h,共24项。红葡萄酒花色苷,总酚,白藜芦醇,色谱分析仪参数l、a、b、h,共7项。同理,对白葡萄酒和白葡萄而言,也可以确定其指标如下:白葡萄氨基酸总量,蛋白质,Vc含量,花色苷,总酸,多酚氧化酶,褐变度,DPPH自由基,总酚,单宁,白藜芦醇,黄酮醇,总糖,还原糖,pH值,固酸比,果穗质量,百粒质量,果梗比,出汁率,果皮质量,色谱分析仪参数a、b、h,共24项。白葡萄酒总酚,总黄酮,白藜芦醇,DPPH自由基,色谱分析仪参数a、b、
37、h,共7项。5.3.2 .对指标进行典型相关性分析典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。其基本思想与主成分分析相类似,但由于其合并了相关性较高的指标,故而叫主成分分析有更好的效果。运行SPSS 18.0软件,对已筛选的指标(以红葡萄酒为例,白葡萄酒同理)进行典型相关性分析(结果详见附录),并得到表(33):表(33)典型变量相关性和显著性分
38、析组数典型相关系数P值11.0000.00021.0000.00031.0000.00041.0000.00051.0000.00060.9490.68270.8040.919根据运算结果共求得五对典型变量相关系数。现列出第一对红葡萄酒典型变量和的相关性系数,并以此为例(其他四对系数见附录)讨论酿酒葡萄理化指标和葡萄酒理化指标的相关性,表(34)(35):(注:负数代表负相关)表(34)第一对酿酒葡萄的典型相关理化指标和典型相关性系数氨酸总量蛋白质花色苷总酸酚氧化酶0.091-0.418-0.3151.706-0.487表(35)第一对葡萄葡萄酒的典型相关理化指标和典型相关性系数花色苷单宁总酚
39、白藜芦醇-2.0040.750.0060.15.3.3 结果分析本文选取的5组典型变量的相关系数都达到了1,表明他们的相关性很高。首先,根据酿酒葡萄理化指标的第一典型相关变量与花色苷呈现高度的正相关,而与可滴定酸呈现一定的负相关,葡萄酒的理化指标第一典型相关变量与花色苷,b、l呈现明显的负相关,而第一对典型变量的相关性很高,说明,葡萄酒内含有的花色苷,b、l与酿酒葡萄的可滴定酸含量呈正相关,而与花色苷呈负相关。其次,从第二对典型变量可以看出葡萄酒的花色苷与b、h与酿酒葡萄中的糖类物质,单宁呈现负相关,和果皮质量呈现正相关,那么糖类越少,单宁越少,花色苷,b、h就越少,颜色就越偏于蓝色。再次,从
40、第三对典型变量可以看出,h、l与酿酒葡萄的黄酮醇有关,表明葡萄酒的色泽会受到葡萄中的黄酮醇的影响。然后,第四对典型变量预示着葡萄酒的单宁,总酚,,总黄酮等与酿酒葡萄可滴定酸和葡萄色泽的关系,葡萄的可滴定酸含量越高,色泽越鲜明,酿造的葡萄酒的单宁,总酚,总黄酮含量也会越高。最后,从第五对典型变量的高度相关性也一定程度上反应了葡萄酒的色泽与酿酒葡萄中氨基酸总量,褐变度,黄酮醇的关系,与前两者呈现正相关,后者呈现负相关。白葡萄酒可进行同理分析,在此不做赘述。5.4.1 问题四通过查阅查阅文献可以了解到,葡萄酒的质量高是受葡萄酒及酿酒葡萄自身物质基础影响的,例如葡萄的甘甜口味主要因为就内含有还原糖和总
41、糖,而酸涩口味主要决定于单宁和各种酸的平衡性等。在上文中已经讨论证明酿酒葡萄的理化性质与葡萄酒的质量存在相关性,故而据此推断,可以用酿酒葡萄和葡萄酒的理化指标评价葡萄酒质量的优劣。5.4.1. 最小均方差法筛选葡萄酒理化性质指标与问题二类似,由于项目繁多,对于葡萄酒的理化指标和芳香物质也要进行部分遴选,在此仍然选用最小均方差法对葡萄酒理化指标和芳香化物进行筛选。运行SPSS 18.0软件中“求解方差”命令,计算葡萄酒理化指标和芳香物质方差如下:表(36)红葡萄酒理化指标方差情况指标花色苷单宁总酚 黄酮醇白藜芦醇DPPH半抑制体积色谱仪参数l色谱仪参数a色谱仪参数b方差529168.436.378.918.370.01456.62176.0657.721表(37)红葡萄酒芳香化物方差情况指标辛酸乙酯甘油己酸乙酯乙醇乙酸乙酯方差1024.26484.80213.12206.4127.41表(38)白葡萄酒理化指标方差情况指标单宁总酚 黄酮醇白藜芦醇DPPH半抑制体积色谱仪参数l色谱仪参数a色谱仪参数b方差0.510.22.720.090.0050.100.041.39表(39)白葡萄酒芳香化物方差情况指标辛酸乙酯癸酸乙酯己酸乙酯乙醇丁酸方差6732.101100.23909.38725.44235.35根据上表,选