收藏 分销(赏)

基于理化指标的葡萄酒评价分析模型.docx

上传人:xrp****65 文档编号:5869955 上传时间:2024-11-22 格式:DOCX 页数:37 大小:421.80KB 下载积分:10 金币
下载 相关 举报
基于理化指标的葡萄酒评价分析模型.docx_第1页
第1页 / 共37页
基于理化指标的葡萄酒评价分析模型.docx_第2页
第2页 / 共37页


点击查看更多>>
资源描述
2012高教社杯全国大学生数学建模竞赛 编 号 专 用 页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号): 基于理化指标的葡萄酒评价分析模型 摘要 本文在利用主成分分析法提取出主成分理化指标后,结合偏最小二乘回归分析法建立了对葡萄和葡萄酒及其理化指标的相关分析和评价模型。 对问题1,在对附件1表格中的酒样品序号按由小到大排序后,直接利用Excel中的函数命令,按每个评酒员对各项的打分进行求和,得到了每种酒样品的总评分。最后又对10名评酒员的各自总评分进行均值处理,得到了每种酒样品的平均得分和平均得分方差。从平均得分和平均得分方差的比较,不同葡萄酒平均得分的排序和图表三方面得出了两组结果均存在明显差异。后又通过方差和总体分布检验,结合图表得出的第二组结果更可信,并给出了红白葡萄酒的质量排序。 在问题2中,首先将芳香物质视为葡萄的理化指标。再通过网上查询对一些重要的理化指标进行了预先排序,后对所有理化指标实施了主成分分析法,分别提取出了9种和10种主成分红白葡萄理化指标,累积贡献率均达到了85%,并给出了对红白葡萄的综合评价值及其排序,详见表7和表10。 在问题3中,首先通过主成分分析法提取出了红白葡萄酒中的3种和4种主成分理化指标,与问题2中的红白葡萄主成分理化指标相互讨论,利用偏最小二乘回归分析法建立了两者之间联系关系式,并通过回归系数直方图和预测图进一步说明了建立的联系。下面是红葡萄与红葡萄酒理化指标的回归方程 在问题4中,还是利用主成分分析法把得出的红白葡萄和葡萄酒的主成分理化指标,与可信度强的第二组红白葡萄酒的质量平均得分,视为自变量和因变量,通过偏最小二乘回归分析法,建立了两者之间的影响关系式,并结合回归系数直方图和预测图得出能够用葡萄和葡萄酒的理化指标来评价葡萄酒质量的结论。 关键词:方差 总体分布检验 主成分分析法 偏最小二乘回归分析法 1 问题重述 确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题: 1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 2 问题的分析 2.1 问题1 对于第一问:要讨论两组评酒员评价结果的差异性,先对附件1中4个表格里的样酒按序号进行了由小到大的重新排序,因为它们排序都是打乱的,不方便实现差异性分析。其次,根据每个评酒员在打分后,求和得其总分来确定葡萄酒的质量得分。而葡萄酒在澄清度、色调等10个指标方面的总分又是一致的,在此直接利用Excel中函数命令按每个评酒员对各项的打分进行求和,得到了每种样酒的总评分。最后又对10名评酒员的各自总评分进行均值处理,得到了每种样酒的平均得分。由此还可求出10名评酒员各自总评分的方差,通过对平均得分和平均分方差的比较、排序,结合图表可对差异性实现分析。 对于第二问:两组评酒员评价结果的可信度分析。利用第一问得出的平均得分和平均得分方差,通过数据比较之后,会有一组平均得分的方差要大,说明它的偏离程度就大,可信度就降低。为进一步对偏离程度进行分析,可对27种红葡萄酒和28种白葡萄酒的每名评酒员得分进行总体分布检验。因为它们的酒质量是未知的,方差也是未知的,属于非参数检验。故可直接利用Matlab工具箱中的normfit命令进行非参数检验的总体分布检验,来确定哪一组评价结果偏离程度大,实现可信度分析。 2.2 问题2 首先我们也将芳香物质视为葡萄的理化理化指标。因为它是构成葡萄与葡萄酒质量的主要因素,决定着葡萄酒的风味和典型性。题目要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。可考虑先从网上查询酿酒葡萄中的理化指标对葡萄酒的作用及影响,粗略了解一下各项指标在葡萄酒中的所占的比重,把比重明显靠前的放到前面,不重要靠后,主观的对所有理化指标进行排序。 然后,根据所有理化指标的排序,通过编程,利用主成分分析法提取出贡献率大的n个理化指标,使其累积贡献率达到85%以上,之后就用这n个作为主成分进行分析。最终能得出红白葡萄综合评价值及其排序结果,来实现分级(在讨论白葡萄时,去掉花色苷理化指标,因白葡萄酒中不含有花色苷)。在运用主成分分析法前,得先对附件3中的葡萄酒样品进行重新排序,还可能得对一些理化指标的单位进行统一换算处理。 2.3 问题3 由题意知,可用偏最小二乘回归分析法分析酿酒葡萄与葡萄酒的理化指标之间的联系。但由附件2知道,酿酒葡萄的理化指标含有28种,红白葡萄的理化指标各为7种和6种。可见要全部讨论两者理化指标之间的联系,数据处理较大,过程可能也会较复杂。又由问题2知,能通过主成分分析法提取出红白葡萄理化指标中的几个主成分,且其累积贡献率在85%以上,若用这几个主成分理化指标来代替红白葡萄的全部理化指标进行分析,在指标的个数上大大减少,并且主要信息却基本没丢,故方法是可行的。所以我们首先也要通过主成分分析法对红白葡萄酒的理化指标进行分析,提取出累积贡献率达到85%以上的几个理化指标,用来代替全部指标。然后用这两部分主成分理化指标,利用偏最小二乘回归分析法可实现对酿酒葡萄与葡萄酒的理化指标之间的联系分析。 2.4 问题4 第一问:从2.3可知,完全可用由主成分分析法提取出来的主成分理化指标来代替全部理化指标进行分析,故本问还用那些主成分理化指标来分析对葡萄酒质量的产生的影响。对红白葡萄酒质量的衡量,在此我们选取第一问中可信度较强的那一组结果。这样因变量确定了,自变量为葡萄和葡萄酒的主成分理化指标,故还可用偏最小二乘回归分析法实现对葡萄酒质量的影响分析,同时还给出了两都之间的一个关系式。 第二问:利用第一问中给出的葡萄和葡萄酒的主成分理化指标对葡萄酒质量的影响关系式,结合回归系数直方图和预测图,完全可判断出能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。 3 模型假设 1.每个评酒员在对葡萄酒进行品尝后的分类打分都是客观的; 2.在第一组白葡萄酒的品尝评分中,评酒员7和9分别对酒样3和8中口感分析的持久性(总分8)给出了77和16的错误打分,我们视为打印错误,根据均值改为7和6; 3.在评酒员评分过程中,设葡萄酒在外观、香气、口感和平衡/整体评价四方面共10个指标的总分是一致的; 4.芳香物质是构成葡萄与葡萄酒质量的主要因素,决定着葡萄酒的风味和典型性,故将葡萄和葡萄酒的芳香物质视为酿酒葡萄和葡萄酒的理化指标。 5.设附件3葡萄和葡萄酒芳香物质的各项成分所给数据的单位均为mmol/L; 6.设附件2中理化指标的顺序是随机排列的,可以对其打乱重排; 7.设附件2中的理化指标之间不存在可完全替代的两种理化指标,基本彼此线性无关。 4 模型的建立与求解 4.1两组评酒员评价结果的有无显著性差异分析和可信度分析 首先,在附件1(葡萄酒品尝评分表)中,我们发现4个表格里的酒样排序都是打乱的,没有固定的次序,无法很好的实现差异性分析,故对酒样进行了序号由小到大的重新排序。其次,考虑到是根据每个评酒员在打分后,求和得其总分来确定葡萄酒的质量得分的。又葡萄酒在澄清度、色调等10个指标方面的总分是一致的,故没有必要再用各项的打分与总分的比值来进行计算。在此,我们直接利用Excel中函数命令按每个评酒员对各项的打分进行求和,得到了每种样酒的总评分。后又对10名评酒员的各自总评分进行均值处理,得到了每种样酒的平均得分。最后,为了差异性的讨论又对10名评酒员的各自总评分求出了方差,同时对各项指标也进行了均值和方差处理,详见附件1(葡萄酒品尝评分表)中的4个表。 4.1.1两组评酒员对红葡萄酒评价结果的有无显著性差异分析 下面是两组评酒员对27种红葡萄酒样品的平均得分和平均分方差及它们的差(第一组减第二组)情况: 红葡萄 酒样品 第一组 第二组 两组平均 分之差 两组平均分 的方差之差 平均 得分 平均分 方差 平均 得分 平均分 方差 1 62.7 92.90 68.1 81.88 -5.4 11.02 2 80.3 39.79 74 16.22 6.3 23.57 3 80.4 45.82 74.6 30.71 5.8 15.11 4 68.6 108.04 71.2 41.29 -2.6 66.76 5 73.3 62.01 72.1 13.66 1.2 48.36 6 72.2 59.73 66.3 21.12 5.9 38.61 7 71.5 103.61 65.3 62.68 6.2 40.93 8 72.3 44.01 66 65.11 6.3 -21.10 9 81.5 32.94 78.2 25.73 3.3 7.21 10 74.2 30.40 68.8 36.18 5.4 -5.78 11 70.1 70.77 61.6 38.04 8.5 32.72 12 53.9 79.66 68.3 25.12 -14.4 54.53 13 74.6 44.93 68.8 15.29 5.8 29.64 14 73 36.00 72.6 23.16 0.4 12.84 15 58.7 85.57 65.7 41.34 -7 44.22 16 74.9 18.10 69.9 20.10 5 -2.00 17 79.3 88.01 74.5 9.17 4.8 78.84 18 59.9 47.21 65.4 50.27 -5.5 -3.06 19 78.6 47.38 72.6 55.16 6 -7.78 20 78.6 26.04 75.8 39.07 2.8 -13.02 21 77.1 116.10 72.2 35.51 4.9 80.59 22 77.2 50.62 71.6 24.27 5.6 26.36 23 85.6 32.49 77.1 24.77 8.5 7.72 24 78 74.89 71.5 10.72 6.5 64.17 25 69.2 64.62 68.2 43.73 1 20.89 26 73.8 31.29 72 41.56 1.8 -10.27 27 73 49.78 71.5 20.50 1.5 29.28 表1 两组评酒员对红葡萄酒样品的平均得分和平均分方差 及平均分之差和平均分方差之差表 从表1的两组平均分之差列可以看出,只有5个是负值,并且还有13个数值都大于5,说明第一组评酒员的平均得分基本都要比第二组的平均得分要高,最多高出8.5分。第一组平均得分列的平均分73.06,比第二组的70.51也高出2.55分。最后的一列两组平均分方差之差中,也只有7个是负值,大部分方差之差都要高出20,显然第一组的平均得分偏离均值的程度要大。它们的平均分方差的平均分差为58.62-33.79=24.83。 为了更好说明两组评酒员在红葡萄酒样品中的差异,通过程序(附录1:ti1tu1.m),作出了两组评酒员的平均得分图,红圆代表第一组得分,蓝星代表第二组得分,见图1。 图1 两组评酒员对红葡萄酒的平均得分图 4.1.2两组评酒员对白葡萄酒评价结果的有无显著性差异分析 下面是两组评酒员对28种白葡萄酒样品的平均得分和平均分方差及它们的差(第一组减第二组)情况: 白葡萄 酒样品 第一组 第二组 两组的 平均分之差 两组平均分 的方差之差 平均 得分 平均分 方差 平均 得分 平均分 方差 1 82 92.22 77.9 25.88 4.1 66.34 2 74.2 201.07 75.8 49.07 -1.6 152.00 3 78.3 66.46 75.6 142.49 2.7 -76.03 4 79.4 44.71 76.9 42.10 2.5 2.61 5 71 126.44 81.5 26.28 -10.5 100.17 6 68.4 162.71 75.5 22.72 -7.1 139.99 7 77.5 39.17 74.2 42.18 3.3 -3.01 8 70.4 163.38 72.3 31.12 -1.9 132.26 9 72.9 92.77 80.4 106.27 -7.5 -13.50 10 74.3 212.68 79.8 70.40 -5.5 142.28 11 72.3 177.12 71.4 87.82 0.9 89.30 12 63.3 115.79 72.4 140.04 -9.1 -24.26 13 65.9 170.77 73.9 46.77 -8 124.00 14 72 114.22 77.1 15.88 -5.1 98.34 15 72.4 131.60 78.4 54.04 -6 77.56 16 74 178.00 67.3 82.23 6.7 95.77 17 78.8 144.18 80.3 38.46 -1.5 105.72 18 73.1 156.54 76.7 30.23 -3.6 126.31 19 72.2 46.40 76.4 26.04 -4.2 20.36 20 77.8 64.40 76.6 50.04 1.2 14.36 21 76.4 172.71 79.2 64.40 -2.8 108.31 22 71 138.67 79.4 53.60 -8.4 85.07 23 75.9 43.66 77.4 11.60 -1.5 32.06 24 73.3 111.12 76.1 38.54 -2.8 72.58 25 77.1 33.88 79.5 106.50 -2.4 -72.62 26 81.3 72.90 74.3 102.90 7 -30.00 27 64.8 144.40 77 35.56 -12.2 108.84 28 81.3 80.46 79.6 25.38 1.7 55.08 表2 两组评酒员对白葡萄酒样品的平均得分和平均分方差 及平均分之差和平均分方差之差表 从表2的两组平均分之差列可以看出,只有9个是正值,负值中有10个数值小于-5,说明第一组评酒员的平均得分基本都要比第二组的平均得分低,最多低12.2分。第一组平均得分列的平均分73.96,比第二组的76.53也低了2.57分。但最后的一列两组平均分方差之差中只有6个是负值,且大部分方差之差都要高出50,也是第一组的平均得分偏离均值的程度要大。它们的平均分方差的平均分差为117.80-56.02=61.78。 为了更好说明两组评酒员在白葡萄酒样品中的差异,通过程序(附件2:ti1tu2.m),作出了两组评酒员的平均得分图,红圆代表第一组得分,蓝星代表第二组得分,见图2。 图2 两组评酒员对白葡萄酒的平均得分图 为了更进一步的说明两组评酒员对红白两种葡萄酒的评分差异,我们又根据它们的平均得分对它们进行了排序,结果见下面表3: 27种红葡萄酒的排序 28种白葡萄酒的排序 第一组 第二组 第一组 第二组 红葡萄酒23 85.6 红葡萄酒9 78.2 白葡萄酒1 82 白葡萄酒5 81.5 红葡萄酒9 81.5 红葡萄酒23 77.1 白葡萄酒26 81.3 白葡萄酒9 80.4 红葡萄酒3 80.4 红葡萄酒20 75.8 白葡萄酒28 81.3 白葡萄酒17 80.3 红葡萄酒2 80.3 红葡萄酒3 74.6 白葡萄酒4 79.4 白葡萄酒10 79.8 红葡萄酒17 79.3 红葡萄酒17 74.5 白葡萄酒17 78.8 白葡萄酒28 79.6 红葡萄酒19 78.6 红葡萄酒2 74 白葡萄酒3 78.3 白葡萄酒25 79.5 红葡萄酒20 78.6 红葡萄酒14 72.6 白葡萄酒20 77.8 白葡萄酒22 79.4 红葡萄酒24 78 红葡萄酒19 72.6 白葡萄酒7 77.5 白葡萄酒21 79.2 红葡萄酒22 77.2 红葡萄酒21 72.2 白葡萄酒25 77.1 白葡萄酒15 78.4 红葡萄酒21 77.1 红葡萄酒5 72.1 白葡萄酒21 76.4 白葡萄酒1 77.9 红葡萄酒16 74.9 红葡萄酒26 72 白葡萄酒23 75.9 白葡萄酒23 77.4 红葡萄酒13 74.6 红葡萄酒22 71.6 白葡萄酒10 74.3 白葡萄酒14 77.1 红葡萄酒10 74.2 红葡萄酒24 71.5 白葡萄酒2 74.2 白葡萄酒27 77 红葡萄酒26 73.8 红葡萄酒27 71.5 白葡萄酒16 74 白葡萄酒4 76.9 红葡萄酒5 73.3 红葡萄酒4 71.2 白葡萄酒24 73.3 白葡萄酒18 76.7 红葡萄酒14 73 红葡萄酒16 69.9 白葡萄酒18 73.1 白葡萄酒20 76.6 红葡萄酒27 73 红葡萄酒10 68.8 白葡萄酒9 72.9 白葡萄酒19 76.4 红葡萄酒8 72.3 红葡萄酒13 68.8 白葡萄酒15 72.4 白葡萄酒24 76.1 红葡萄酒6 72.2 红葡萄酒12 68.3 白葡萄酒11 72.3 白葡萄酒2 75.8 红葡萄酒7 71.5 红葡萄酒25 68.2 白葡萄酒19 72.2 白葡萄酒3 75.6 红葡萄酒11 70.1 红葡萄酒1 68.1 白葡萄酒14 72 白葡萄酒6 75.5 红葡萄酒25 69.2 红葡萄酒6 66.3 白葡萄酒5 71 白葡萄酒26 74.3 红葡萄酒4 68.6 红葡萄酒8 66 白葡萄酒22 71 白葡萄酒7 74.2 红葡萄酒1 62.7 红葡萄酒15 65.7 白葡萄酒8 70.4 白葡萄酒13 73.9 红葡萄酒18 59.9 红葡萄酒18 65.4 白葡萄酒6 68.4 白葡萄酒12 72.4 红葡萄酒15 58.7 红葡萄酒7 65.3 白葡萄酒13 65.9 白葡萄酒8 72.3 红葡萄酒12 53.9 红葡萄酒11 61.6 白葡萄酒27 64.8 白葡萄酒11 71.4 白葡萄酒12 63.3 白葡萄酒16 67.3 表3 红白两种葡萄酒的排序 4.1.3两组评酒员评价结果的可信度分析 由上面分析结果知道,两组评酒员的平均得分是存在明显差异的,并且不论红白葡萄酒第一组评酒员的评分结果方差都比第二组大,在这55种葡萄酒中竟多达42个,比例为76.36%,最大的平均分方差之差为152,说明第一组平均得分结果偏离均值的程度要大。已可说明第二组的评价结果要比第一组的评价结果要可信。 为了更好的说明问题,我们又用了非参数检验中的总体分布检验,对偏离程度进行了分析。如果只对每种葡萄酒样品的两组数据进行讨论,因数据太少结果不明显。在这里我们对27种红葡萄酒和28种白葡萄酒的每名评酒员得分进行讨论。因为它们的质量是未知的,肯定存在差异,所以方差也是未知的,属于非参数检验。为了简便,我们直接Matlab工具箱中的normfit命令进行总体分布检验,用程序(附录3:fenbu1.m,附录4:fenbu2.m)分别给出两组红、白葡萄酒样品的总体分布图,见下面图3,图4。 图3 两组红葡萄酒样品的总体分布图 图4 两组白葡萄酒样品的总体分布图 从上面两个图的下方4个线形图可以看出,数据基本都分布在一条直线上,说明两组评酒员的评价结果确实都是客观的。但上方的4个柱形图告诉我们,第二组的数据没有第一组集中,又知第一组红白葡萄酒评价结果在均值为0.95的置信区间为(71.83,74.28)、(72.64,75.31),第一组红白葡萄酒评价结果在均值为0.95的置信区间为(69.70,71.33)、(75.62,77.45),显然第一组的数据偏离程度大。进一步说明第二组的评价结果要比第一组的评价结果要可信。 4.2酿酒葡萄的分级方案 4.2.1酿酒葡萄中的理化指标对葡萄酒的作用及影响 芳香物质:是具挥发性的、能够产生一定气味的含香物质的总称。葡萄与葡萄酒中芳香物质大部分都是结构简单的小分子有机物,含量少,种类多。它们是构成葡萄与葡萄酒质量的主要因素,决定着葡萄酒的风味和典型性,芳香物质的种类、含量、感觉阈值及其之间的相互作用决定着葡萄酒的感官质量,芳香物质是造就葡萄酒风味的物质之一,葡萄酒中的芳香物质越多,葡萄酒的风味就浓厚。 氨基酸:在葡萄酒的酿制过程中,通过发酵菌的生成作用,由氨基酸的协助将葡萄中的糖分解转化成酒精。并在此过程中保留了原来的氨基酸并且有新的氨基酸,生成的这些氨基酸和多种微量元素都是生命必须的营养物质。 蛋白质:蛋白质主要从葡萄籽、葡萄皮提取的。蛋白质在葡萄酒中起着多种作用:对酒石的稳定、对蛋白的稳定、芳香物质的支撑体、稳定多酚物质。而多酚物质对红葡萄酒的感官质量起着决定性的作用。在酒精发酵过程中及当葡萄酒在酒泥上陈酿时,蛋白质可以影响葡萄酒的香气质量,改变芳香物质的挥发性,还可提高葡萄酒的酒石稳定性,同时可提高葡萄酒的“肥硕感”及香气的馥郁性。 Vc:具有抗氧化的作用同时还具有促氧的作用,但是由于它会使葡萄酒产生沉淀物质,所以不宜使用。 花色苷:主要是皮里的物质花色苷,在葡萄酒中起呈色作用,通过浸渍葡萄皮中的部分花色苷被转移到葡萄酒中,使得葡萄酒呈出紫红色。在酝酿过程中,生成稳定的色素,葡萄酒的颜色由紫色变为砖红,是红葡萄酒颜色的主要形式,白葡萄酒中不含有。 单宁:主要是由葡萄籽、皮及梗浸泡发酵而来,或是因为存于橡木桶内而萃取橡木内的单宁而来。它是葡萄酒中所含有的二种酚化合物其中的一种物质,尤其在红葡萄酒中含量较多,作用是使葡萄酒入口后口腔感觉干涩,口腔黏膜会有褶皱感。单宁的多少可以决定酒的风味、结构与质地。缺乏单宁的红酒质地轻薄,没有厚实的感觉。单宁丰富的红酒可以存放经年,并且逐渐酝酿出香醇细致的陈年风味。 总酚:含有多种酚类成分,广泛分布在葡萄皮、梗和籽里面。这些成分在葡萄酒中起决定性的作用。首先,影响葡萄酒的口感,使葡萄酒具有苦味和收敛性,尤其是红酒;第二,影响葡萄酒的颜色;第三,起到防腐的作用,延长酒的寿命;第四,在葡萄酒中的抗氧化作用。 白藜芦醇:主要存在于葡萄的果皮中,其次是种子。在葡萄中的含量甚微,只有在酿造葡萄酒的发酵过程中与酶结合,才会使它的数量骤然增加。率能以游离态(顺式、反式) 和糖苷结合态(顺式、反式)2种形式在植物中分布及生物合成,且均具有抗氧化效能。葡萄酒中的白藜芦醇含量的高低已成为衡量优质酒和劣质酒的标准,但并不是所有的葡萄酒中都含有这种成分。 总黄酮:主要是从葡萄皮和葡萄籽中提取的,在葡萄酒中的类黄酮类物质对葡萄酒的颜色、收敛性以及苦味等都具有重要的作用,还具有很强的抗氧化能力以及降血糖、抗病毒、抗肿瘤、免疫调节等作用,还可以作为食品添加剂来避免亚硝酸盐导致的致病隐患等作用。 酒石酸、苹果酸和柠檬酸:为葡萄果实中的主要有机酸,有近70%的有机酸分布在中、内果皮(即果肉)中,其组成与含量是决定葡萄果实风味和品质的重要因素之一.有机酸的种类及其浓度调节着酸碱的平衡,必然要影响葡萄酒的酸味,进而也会影响葡萄酒的风味.此外,有机酸的防腐特性还可以增强葡萄酒的微生物和物化的稳定性,酸度较高的年限短的白葡萄酒更具有陈酿潜力. 因此它们对葡萄酒的组成成分、稳定性和感官品质都起着重要的作用. 4.2.2主成分分析法的原理和步骤 主成分分析(Principal Component Analysis)是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组全,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部分信息,且所含的信息互不重叠。采用这种方法可以从多达30多种酿酒葡萄的理化指标中,提取出贡献率大的决定性理化指标,然后对其分类排序给出分级,这样避免了都分析的复杂性,结果较为科学,信息也较为准确。下面为主成分分析法的评价步骤: (1)对原始数据进行标准化处理 设所考察的n个量中含有m个指标变量(即成分),则由此可构造原始数据矩阵,(,),将各指标值转换成标准化指标, ,(,) 其中,,(),即为第个指标的样本均值和样本标准差。对应地,称 ,() 为标准化指标变量。 (2)计算相关系数矩阵 相关系数矩阵, ,() 式中,,是第个指标与第个指标的相关系数。 (3)计算特征值和特征向量 计算相关系数矩阵的特征值,及对应的标准化特征向量 ,其中,由特征向量组成m个新的指标变量 式中是第1主成分,是第2主成分,…,是第m主成分。 (4)选择()个主成分,计算综合评价值 i)计算特征值的信息贡献率和累积贡献率。称 () 为主成分的信息贡献率; 为主成分的累积贡献率,当接近于1()时,则选择前个指标变量作为个主成分,代替原来m个指标变量,从而可对个主成分进行综合分析。 ii)计算综合得分 其中为第个主成分的信息贡献率,根据综合得分值就可进行评价。 4.2.3利用主成分分析法对酿酒葡萄质量的分析与分级方案 因为是从葡萄酒的质量角度出发对酿酒葡萄进行分级的,故根据5.2.1中理化指标对葡萄酒的作用及影响,我们先主观对一些理化指标进行了排序,结果如下: 1 2 3 4 5 6 7 8 芳香物质 氨基酸 单宁 总酚 花色苷 蛋白质 酒石酸 苹果酸 9 10 11 12 13 14 15 16 柠檬酸 葡萄总 黄酮 白藜 芦醇 黄酮醇 总糖 还原糖 可溶性 固形物 PH值 表4 酿酒葡萄中理化指标的主观排序 为了运用主成分分析法,先对数据进行初步处理。利用根据1摩尔=1分子量克,对葡萄和葡萄酒中的芳香物质成分进行单位统一化。对含有二级指标的,与一级指标求和再取平均值。有多次测试值的,也取平均值。下面通过主成分分析法分别对红白葡萄进行排序、分级。 按表4中的理化指标排序,利用MATLAB软件编程序(附录5:fenjihong.m),求得红葡萄相关系数矩阵的前10个特征根及其贡献率,见下表5。 序号 理化指标 特征值 贡献率 累计贡献率 1 芳香物质 7.03 22.67 22.67 2 氨基酸 4.98 16.06 38.72 3 单宁 3.77 12.15 50.88 4 总酚 2.86 9.24 60.12 5 花色苷 2.05 6.61 66.73 6 蛋白质 1.74 5.62 72.35 7 酒石酸 1.42 4.58 76.94 8 苹果酸 1.28 4.12 81.05 9 柠檬酸 1.11 3.57 84.63 10 葡萄总黄酮 0.89 2.88 87.51 表5 红葡萄分级的主成分分析结果 可以看出,前9个特征根的累计贡献率就达到84.63%以上,已很接近85%,而增加一个成分贡献率也就增加2.88,故选前9个作为主成分进行分析。下面是前9个特征根对应的特征向量,见表6。 第1特 征向量 第2特 征向量 第3特 征向量 第4特 征向量 第5特 征向量 第6特 征向量 第7特 征向量 第8特 征向量 第9特 征向量 -0.101 0.096 -0.102 0.112 0.204 -0.032 -0.053 0.144 0.635 0.138 0.246 0.013 0.255 -0.195 -0.225 0.146 -0.021 -0.064 0.286 -0.059 -0.148 -0.046 -0.117 0.183 0.199 -0.030 0.113 . . . . . . . . . . . . . . . . . . . . . . . . . . . -0.211 -0.154 0.151 -0.009 0.064 -0.236 0.054 0.321 0.029 -0.123 0.111 0.387 0.037 -0.020 0.223 0.213 0.186 -0.077 -0.053 0.209 0.319 -0.008 0.117 0.350 0.251 0.069 -0.099 表6 红葡萄主成分分析法的前9个特征根对就的特征向量 由此可得9个主成分分别为 . . . . . . . . . . . . . . . . . . . 分别以9个主成分的贡献率为权重,构建主成分综合评价模型: 将红葡萄酒的9种主成分值代入上式,可以得到各种红葡萄的综合评价值及其排序结果,见下表7所示。 名次 1 2 3 4 5 6 7 8 9 红葡萄 样品 3 样品 9 样品 11 样品 1 样品 2 样品 21 样品 23 样品 22 样品 8 综合评 价值 1.58 1.17 1.06 1.06 0.99 0.95 0.34 0.28 0.28 名次 10 11 12 13 14 15 16 17 18 红葡萄 样品 16 样品 12 样品 14 样品 6 样品 24 样品 17 样品 5 样品 13 样品 19 综合评 价值 0.14 0.12 0.11 -0.12 -0.15 -0.18 -0.20 -0.22 -0.28 名次 19 20 21 22 23 24 25 26 27 红葡萄 样品 7 样品 18 样品 15 样品 4 样品 20 样品 27 样品 26 样品 10 样品 25 综合评 价值 -0.30 -0.33 -0.40 -0.65 -0.69 -0.80 -1.01 -1.17 -1.58 表7 红葡萄的综合评价值及其排序结果 故按不含花色苷的表4中的理化指标排序(因白葡萄酒中不含有花色苷),利用MATLAB软件编程序(附录6:fenjibai.m),求得白葡萄相关系数矩阵的前11个特征根及其贡献率,见下表8。 序号 理化指标 特征值 贡献率 累计贡献率 1 芳香物质 5.722536 19.73288 19.7328831 2 氨基酸 4.763667 16.42644 36.1593201 3 单宁 3.579864 12.34436 48.5036789 4 总酚 2.135842 7.364973 55.8686518 5 蛋白质 1.983464 6.839532 62.7081837 6 酒石酸 1.624207 5.600715 68.3088988 7 苹果酸 1.443047 4.976024 73.2849225 8 柠檬酸 1.183292 4.080316 77.3652386 9 葡萄总黄酮 1.165558 4.019166 81.3844047 10 白藜芦醇 1.030023 3.551804 84.9362091 11 黄酮醇 0.815662 2.812626 87.7488355 表8 白葡萄分级的主成分分析结果 可以看出,前10个特征根的累计贡献率就达到84.94%以上,约为85%,而增加一个成分贡献率也就增加2.81,故选前10个作为主成分进行分析。下面是前10个特征根对应的特征向量,见表9。 第1特 征向量 第2特 征向量 第3特 征向量 第4特 征向量 第5特 征向量 第6特 征向量 第7特 征向量 第8特 征向量 第9特 征向量 第10特 征向量 0.02 -0.05 0.02 -0.51 -0.04 -0.25 -0.13 0.37 -0.06 0.04 0.24 0.11 0.07 0.17 0.34 0.02 -0.09 -0.07 0.21 0.07 0.17 0.21 0.12 -0.04 -0.04 0.37 -0.01 -0.18 -0.35 -0.18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0.19 0.20 -0.27 0.15 -0.16 -0.08 -0.23 0.00 0.08 -0.22 -0.09 -0.24 0.31 0.05 0.02 0.07 0.12 -0.12 -0.30 0.24 0.25 0.10 -0.33 0.12 -0.08 -0.15 -0.07 -0.02 0.19 -0.13 表9 白葡萄主成分分析法的前10个特征根对就的特征向量 由此可得10个主成分
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 学术论文 > 其他

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服