收藏 分销(赏)

葡萄酒的评价-全国数学建模大赛优秀论文大学论文.doc

上传人:胜**** 文档编号:2011921 上传时间:2024-05-13 格式:DOC 页数:28 大小:2.60MB 下载积分:10 金币
下载 相关 举报
葡萄酒的评价-全国数学建模大赛优秀论文大学论文.doc_第1页
第1页 / 共28页
葡萄酒的评价-全国数学建模大赛优秀论文大学论文.doc_第2页
第2页 / 共28页


点击查看更多>>
资源描述
2012高教社杯全国大学生数学建模竞赛 承 诺 书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 重庆工商大学 参赛队员 (打印并签名) :1. 伍家棋 2. 杜静 3. 黄丹 指导教师或指导教师组负责人 (打印并签名): 日期: 2012 年 9 月 10 日 赛区评阅编号(由赛区组委会评阅前进行编号): 2012高教社杯全国大学生数学建模竞赛 编 号 专 用 页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号): 葡萄酒的评价 摘要 酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定的程度上反映葡萄酒和葡萄的质量。本论文主要研究葡萄酒的评价、酿酒葡萄的分级以及酿酒葡萄与葡萄酒的理化指标之间的相互关系问题。 对于问题一:我们从假设检验的角度出发分析,对两组的评分进行均值和方差运算,并在零假设成立的前提下通过使用Matlab做T检验,得出两组评酒员对于红葡萄酒的评价结果无显著性差异,而对于白葡萄酒的评价结果存在显著性差异的结果。再建立可信度模型,计算结果如下表, 第一组红葡萄酒 第二组红葡萄酒 第一组白葡萄酒 第二组白葡萄酒 0.100507 0.056413 0.064941 0.041433 由表可得第二组的可信度更高。 对于问题二:根据葡萄酒质量的综合得分,将其划分为优、良、合格、不合格四个等级,并对酿酒葡萄的理化指标进行主成分分析,得出对葡萄影响较大的理化指标: 红葡萄主要理化指标 DPPH自由基、葡萄总黄酮、PH值、花色苷、蛋白质、黄酮醇、固酸比、果梗比 白葡萄主要理化指标 氨基酸、干物质含量、可溶性固形物、果穗质量、总糖、苹果酸、还原糖、总酚、葡萄总黄酮、酒石酸、黄酮醇 并根据酿酒葡萄的理化指标和葡萄酒的质量,利用模糊综合评价模型对葡萄酒进行了分类,结果如下: 等级数 级数 红酒数量 红葡指标 白酒数量 白葡指标 次品 4 3 1 0 3 普通 3 11 4 7 4 良好 2 12 20 19 16 优质 1 1 2 2 5 对于问题三:先对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。利用通径方法建立了数学模型,得出了它们之间的线性回归方程: 对于问题四:在前面主成分分析和葡萄酒分级的基础上,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。运用SPSS软件,通过matlab编程运算,求出受它们综合影响的线性回归方程。在验证时,随机从上面选取理化指标,将它们带入P的计算式中,通过所求P值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。 最后,对模型进行了改进和推广。 关键词 T检验 主成分分析 Logistic回归模型 一、问题的重述 葡萄酒作为体现时尚品味的元素,同名茶、咖啡一样备受追捧。在物质社会的今天,人们酿造葡萄酒的品质还是有待鉴定的,因此,确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。 此外,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据,现需要用数学建模方法研究解决以下问题: 1.分析附件1中两组评酒员的评价结果有无显著性差异,并判断哪一组结果更可信? 2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 二、问题的分析 针对问题一: 分析评酒员的评价结果有无显著性差异,需要从反面来论证,要从假设性检验角度来分析问题。由于样本容量较大,近似地服从正态分布。因此,本论文采用了使用Matlab做T检验,从而确定两组评价有无显著性差异。 为了确定哪一组的结果更可信,建立了一种可以替代可信度的模型。又考虑到该样本涉及到的是正态分布,则数据的离散程度是对其影响最大的因素,所以采用用标准差与平均值的比值作为可信度模型来衡量可信度的高低。 针对问题二: 该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量来对酿酒葡萄进行分级,故我们要对酿酒葡萄的理化指标和葡萄酒的质量进行综合评价,但是在进行综合评价以前我们有分别要对它们二者分别进行分析。 在第一问中,我们已经对葡萄酒的整体进行了打分,因此,葡萄酒的质量实际上已经分好类了,那么我们就需要对酿酒葡萄的理化指标进行分析。但是,由于影响酿酒葡萄的理化指标的因素有30个,要使问题得到简化,我们只需取其几个主要的影响因素,因此,采用主成分分析法来分析主要影响因素。然而,葡萄酒的质量的单位系与酿酒葡萄的理化指标的单位系不同,因此不能直接加减来判断,所以,我们采用了模糊综合评价模型来对酿酒葡萄进行分级。 针对问题三: 对酿酒葡萄的理化指标和酒样品的质量进行偏相关分析,得到了它们的偏相关系矩阵。利用通径方法建立了数学模型,得出了它们之间的线性回归方程 针对问题四: 基于前面主成分分析和葡萄酒分级的基础,建立Logistic回归模型,并利用最大似然估计法求出线性回归方程的参数,得出线性回归方程。运用SPSS软件,通过matlab编程运算,求出受它们综合影响的线性回归方程。 在验证时,随机从上面选取理化指标,将它们带入P的计算式中,通过所求P值判断此时葡萄酒质量所属级别,得出了不能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量的结论。 三、基本假设 1、各个样品酒中原产地相似,酿酒葡萄的产地对葡萄酒的质量影响相同; 2、酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系; 3、葡萄酒的酿造工序和贮藏条件相同; 4、各评酒员的资质较高,在对葡萄酒品平时都是客观的,不存在主观偏好; 5、仪器对样本理化指标和所含芳香物质的测试不存在随机误差,附件所给的数据真实、准确、可靠; 6、酒样品容量较大时,认为各组样本服从正态分布且相互独立; 7、两种葡萄酒和酿酒葡萄的分级标准相同,且葡萄酒分为优、良、合格、不合格四个级别; 8、假设附件1中,酒样品为一级指标,外观、口感、香气分析和整体评价为二级指标,澄清度、色调、纯正度、浓度、持久性和质量为三级指标; 四、符号定义 :表示澄清度,色调等指标个数,; :表示评酒员的个数,; :表示第b个评酒员对a指标的评分; :表示酒样品数,; :表示第种酒样品评分的均值; :表示总体均值; :表示两组对应红(白)酒的均值差; :表示对均值差()做t检验时的统计量; :表示拒绝域; :表示总体可信度的指标; :表示酿酒葡萄的理化指标数,; :表示第种酒样品的第中理化指标的值; :表示对标准化后的值; :表示相关系数矩阵的第个特征值; :表示主要理化指标的贡献率; :表示主要理化指标的累计贡献率; :表示主要理化指标的综合评价函数,; :表示显著性水平; :表示方差; :表示相关系数矩阵的特征向量; :表示子集中含有个评判因素; :表示个因数的权数分配; 五、模型的建立与求解 5.1、问题一模型的建立与求解 5.1.1显著性差异的T检验 针对于如何确定有无显著性差异,我们从假设检验的角度出发,通过使用Matlab做T检验,分析它们的均值与方差来确定显著性。 1、对数据均值进行分析计算 均值即每种酒样品的平均得分,它表示每个评酒员对每种酒样品评定的质量的具体值,其公为: , (5.1.1) 其中,a表示附件1中的三级指标;b表示评酒员的个数。 将各种葡萄酒样品各个评分代入式子(5.1.1),运用excel计算可得出如下结果: 表1 第一组红葡萄酒整体均值 酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14 平均得分 62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73 酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 平均得分 58.7 74.9 79.3 59.9 78.6 79.1 77.1 77.2 85.6 78 69.2 73.8 73 表2 第二组红葡萄酒整体均值 酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14 平均得分 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6 酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 平均得分 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5 表3 第一组白葡萄酒整体均值 酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14 平均得分 82 74.2 78.3 79.4 71 68.4 77.5 70.4 72.9 74.3 72.3 63.3 65.9 72 酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 28 品均得分 72.4 74 78.8 73.1 72.2 77.8 76.4 71 75.9 73.3 77.1 81.3 64.8 81.3 表4 第二组白葡萄整体均值 酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14 平均得分 77.9 75.8 75.6 76.9 81.5 75.5 74.2 72.3 80.4 79.8 71.4 72.4 73.9 77.1 酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 28 平均得分 78.4 67.3 80.3 76.7 76.4 76.6 79.2 79.4 77.4 76.1 79.5 74.3 77 79.6 2、对数据方差进行分析计算 方差即各个数据与平均数之差的平方的平均数,它表示两组葡萄酒质量的波动大小,其公为: , (5.1.2) 其中,m表示酒样品数;表示组数,=1,2. 将以上各种葡萄酒样品的均值代入式子(5.1.2),可求得各组的方差,结果如下: 表5 两组红、白葡萄酒的方差 第一组红葡萄酒 第一组白葡萄酒 第二组红葡萄酒 第二组白葡萄酒 53.91410256 23.30787037 15.82439 10.05485 3、成对数据进行T检验 根据表1、表2、表3和表4显示的结果,我们可将两组中红、白酒样品分别形成相应的成对数据,形式如下表: 表6 两组酒样品的成对数据及差值 酒样品号 1 2 …… 27 x1 x2 …… x27 y1 y2 …… y27 x-y(d) d1 d2 …… d27 首先,假设:,且独立,则,其中,; 然后,T检验问题为: 零假设 ,即; 对立假设,即. 此时,用T统计量 , (5.1.3) 其中,, ,表示酒样品数,(红酒,白酒); 在零假设成立的前提下,此统计量服从分布。这时,零假设的()显著水平的拒绝域是如下的样本区域: . (5.1.4) 将表1和表2中的数据代入式子(5.1.3)中,可求得红葡萄酒的统计量t值,通过查表法将m值代入(5.1.4)可以求得显著水平的拒绝域。 结果为:=2.04569 =2.04106 所以可得评酒员对红葡萄酒的评价没有显著性差异。 同理,我们可计算出白葡萄酒的统计量t值,即=-2.66648,不在拒绝域内,所以,结果可得两组评酒员对白葡萄酒的评价存在显著性差异。 5.1.2可信度模型的建立及求解 针对可信度的问题,我们用H表示可信度。在一定程度上,当平均值相等时,标准差能反映一个总体的离散程度,即标准差越大,离散程度越大,则表明这个总体的水平不稳定;标准差越小,反之水平越稳定。 基于标准差和平均值的性质,我们用标准差与平均值比值的大小来表示一个总体可信度的高低。因而,我们建立一个可信度模型: , 其中,H表示标准差与平均值的比值,即. 可见,H值越大时它的可信度越低,H值越小时可信度越高。 由此,可算得两组红葡萄酒样本的标准差与平均值的比值,如下表: 表7 两组红、白葡萄酒的均值标准差与平均值的比值 第一组红葡萄酒 第二组红葡萄酒 第一组白葡萄酒 第二组白葡萄酒 0.100507 0.056413 0.064941 0.041433 由以上表格显示的结果可得出如下结论: 对于两组中的红葡萄酒,有: ,所以第二组对红葡萄酒的评价结果的可信度更高; 对于两组中的白葡萄酒,有: ,所以第二组对白葡萄酒的评价结果的可信度更高; 综上所述:第二组更可信。 5.2、问题二模型的建立和求解 5.2.1对酿酒葡萄的质量进行分类 该问题要求我们根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级,而在第一问中我们已经对葡萄酒进行了综合评分,现将其结果分为优、良、合格、不合格四类,。对其质量进行等级分类,结果如下表格: 表8 红葡萄酒质量的等级分类 等级(均值) 酒样品 优(75以上) 9、20、23 良(70—75) 2、3、4、5、14、17、19、21、22、24、26、27 合格(65—70) 1、6、7、8、10、12、13、15、16、18、25 不合格(65以下) 11 表9 白葡萄酒质量的等级分类 等级(均值) 酒样品 优质(75以上) 1、2、3、4、5、6、9、10、14、15、18、19、20、21、22、23、24、25、26、27、28 良 (70—75) 7、8、11、12、13 合格(65—70) 16 不合格(65以下) 5.2.2对酿酒葡萄的理化指标进行主成分分析 1、建立主成分分析数学模型 样本观测数据矩阵为: , 其中, 将酿酒葡萄的理化指标带入X中,求得了X的矩阵。 将个观测变量综合成为个新的变量(综合变量),即 简写为: , () 其中,为综合评分函数,为主成分系数,为各样品酿酒葡萄的理化指标,n为1~27个葡萄样品,p为1~30个理化指标,为理化指标的观测数据矩阵。 第一步:对原始数据进行标准化处理 , ; 又: 第二步:计算样本相关系数矩阵 , 为方便,假定原始数据标准化后仍用表示,则经标准化处理后的数据的相关系数为: 第三步:用雅克比方法求相关系数矩阵的特征值()和相应的特征向量。 解特征方程,求出特征值。因为R是正定矩阵,所以其特征值都为正数,将其按大小顺序排列,即.特征值是各主成分的方差,它的大小反映了各个主成分的影响力。 第四步:选择重要的主成分,并写出主成分表达式 主成分分析可以得到个主成分,但是由于各个主成分的方差是递减的,包含的信息量也是递减的,所以实际分析时,一般不是选取个主成分,而是根据各个主成分累计贡献率的大小选取前个主成分,这里贡献率就是指某个主成分的方差占全部方差的比重,实际也就是某个特征值占全部特征值合计的比重,即 =, 其中,表示主成分的贡献率,贡献率越大,说明该主成分所包含的原始变量的信息越强。 又累计贡献率为: , 所以,特征值大于1且累计贡献率达80%-95%的特征值所对应的1,2,…,()其中整数即为主成分的个数。 第五步:计算主成分得分 根据标准化的原始数据,按照各个样品,分别代入主成分表达式,就可以得到各主成分下的各个样品的新数据,即为主成分得分,具体形式可如下: 又 , 2、运用SPSS软件计算数据 根据SPSS软件算出葡萄酒质量的等级与酿酒葡萄的理化指标的相关度(附录二),由附录中分析得出: 30种酿酒葡萄的理化一级指标对葡萄分级有一定影响,它们在葡萄中的含量决定葡萄的质量。以27种红(28种白)葡萄的30个理化指标构成27(28)30的矩阵,利用MATLAB软件进行主成分分析(MATLAB主成分分析的源代码见附录1),经过有限次剔出后确定保留的成分,再用相关矩阵的特征值与特征向量特征值算得主成分、主成分个数及主成分贡献率,由以上数据得出综合评分。 红葡萄的理化指标经过有限次剔出后,保留了8个主成分: x10、x13、x19、x4、x2、x15、x21、x25,分别代表DPPH自由基、葡萄总黄酮、PH值、花色苷、蛋白质、黄酮醇、固酸比、果梗比(主成分按照贡献率降幂排列);理化指标的综合评分(分数越低,排名越靠后)是: 表10 红葡萄主要成分的综合评分 红葡萄样品 1 2 3 4 5 6 7 排名 25 22 21 6 9 5 12 主成分综合分 -0.7986 -0.3447 -0.3379 0.5151 0.3369 0.5603 0.3001 红葡萄样品 8 9 10 11 12 13 14 排名 20 23 1 7 17 2 3 主成分综合分 -0.3156 -0.4675 2.2129 0.4172 -0.0247 1.6312 0.7737 红葡萄样品 15 16 17 18 19 20 21 排名 11 27 26 15 16 8 4 主成分综合分 0.3125 -3.0269 -1.0608 0.041 0.0088 0.3684 0.6661 红葡萄样品 22 23 24 25 26 27 排名 13 14 19 24 18 10 主成分综合分 0.1339 0.0811 -0.1872 -0.7932 -0.0697 0.3187 同理可算出,白葡萄的相关信息: 白葡萄的理化指标经过有限次剔出后,保留了11个主成分,: x1、x22、x18、x23、x16、x6、x17、x11、x13、x5、x15,分别代表氨基酸、干物质含量、可溶性固形物、果穗质量、总糖、苹果酸、还原糖、总酚、葡萄总黄酮、酒石酸、黄酮醇(主成分按照贡献率降幂排列);理化指标的综合评分(分数越低,排名越靠后)是: 表11 白葡萄主要成分的综合评分 白葡萄样品 1 2 3 4 5 6 7 排名 6 16 23 20 28 21 3 主成分综合分 0.5604 0.1665 -0.3528 -0.2285 -2.1077 -0.2566 1.002 白葡萄样品 8 9 10 11 12 13 14 排名 7 25 19 9 17 15 11 主成分综合分 0.55 -0.8539 -0.0338 0.4645 0.0712 0.2672 0.394 白葡萄样品 15 16 17 18 19 20 21 排名 4 8 5 13 27 24 2 主成分综合分 0.8677 0.5384 0.7039 0.3253 -1.55 0.5309 1.3999 白葡萄样品 22 23 24 25 26 27 28 排名 14 1 10 12 18 26 22 主成分综合分 0.2879 1.6136 0.4433 0.3471 0.0026 -1.4436 -0.2726 5.2.2采用模糊综合评价模型来对酿酒葡萄进行分级 1、多层次模糊综合评判模型的建立: (1) 对评判因素集合U,将其划分成2个子集,并使它们满足: (5.2.1) 这样,就得到了第二级评判因素集合:                         (5.2.2) 其中,表示酿酒葡萄的质量,酿酒葡萄的理化指标 在(5.2.2)式中,Ui={Uik}(i=1,2,…,m;k=1,2,…,nk)表示子集Ui中含有nk个评判因素。 其中 =(外观,香气、口感、整体评价) =(酿酒葡萄的主要理化指标) (2)对于每一个子集Ui中的nk个评判因素,按单层次模糊综合评判模型进行评判,如果中的诸因数的权数分配为,其评判决策矩阵为,则得到第i个子集Ui的综合评判结果: (5.2.3) (3)对U中的m个评判因素子集Ui(i=1,2,…,m),进行综合评判,其评判决策矩阵为: (5.2.4) 如果U中的各因数子集的权数分配为A,则可得综合评判结果: 因此,可以分别求出白葡萄和红葡萄相对于葡萄质量的综合得分,然后根据它们的综合得分对它们进行分级。 2、使用SPSS实现等级的划分 将葡萄酒质量与酿酒葡萄的理化指标综合评分分配优、良、合格、不合格四个等级,结果如下表: 表12 红、白葡萄酒的分级 样品等级数 红酒数量(27) 红葡指标数量 白酒数量(27) 白葡指标数量 不合格 3 1 0 3 合格 11 4 7 4 良 12 20 19 16 优 1 2 2 5 用SPSS软件计算出主成分相关系数,结合成分各自比重算出酿酒葡萄的主成分之和与葡萄酒质量的等级的相关度,公式:;再由的关系式,得出权重p,如下表: 表13 酿酒红葡萄的主成分之和与红葡萄酒质量的等级的相关度 红葡萄 DPPH自由基 葡萄总黄酮 PH值 花色苷 相关度(r) 0.61 0.608 0.569 0.499 成分比重f(标准化) 0.17410363 0.15095 0.142857 0.142408 红葡萄 蛋白质 黄酮醇 固酸比 果梗比 相关度(r) 0.482 0.451 0.422 0.258 成分比重f(标准化) 0.105429 0.102956 0.096212 0.085085 相关度(R) 0.510131055 权重P (%) 理化指标p 33.7806 评酒质量1-p 66.2194 表14 酿酒白葡萄的主成分之和与白葡萄酒质量的等级的相关度 白葡萄主成分 氨基酸 干物质含量 可溶性固形物 果穗质量 总糖 苹果酸 相关度(r) 0.594 0.434 0.425 0.413 0.395 1.358 成分比重f(标准化) 0.164707 0.14108 0.110033 0.105353 0.0799 0.079557 白葡萄主成分 还原糖 总酚 葡萄总黄酮 酒石酸 黄酮醇 相关度(r) 0.352 0.35 0.344 0.338 0.307 成分比重f(标准化) 0.076247 0.067686 0.062208 0.057528 0.055701 酒和葡萄理化指标和的相关度(R) 0.497412 权重 理化 0.332181 评酒 0.667819 对比酿酒葡萄的理化指标主成分与葡萄酒质量的排名的综合评分及排名,用上小节计算的权重p,加权算术得到综合评分(见下表),并利用权数算得酿造葡萄的分级。 表15 红葡萄酒与酿酒葡萄样品排名的综合评分 样品 酿酒红葡萄排名 葡萄酒评分 综合评分 1 3 4 3.66 2 6 23 17.26 3 7 24 18.26 4 22 10 14.05 5 19 15 16.35 6 23 9 13.73 7 16 6 9.38 8 8 8 8.00 9 5 26 18.91 10 27 11 16.40 11 21 5 10.40 12 11 1 4.38 13 26 12 16.73 14 25 16 19.04 15 17 2 7.07 16 1 14 9.61 17 2 22 15.24 18 13 3 6.38 19 12 21 17.96 20 20 25 23.31 21 24 19 20.69 22 15 18 16.99 23 14 27 22.61 24 9 20 16.28 25 4 7 5.99 26 10 17 14.64 27 18 13 14.69 表16 红样品综合等级频数 样品等级数 不合格 合格 良 优 综合等级频数 2 5 17 4 表17白葡萄酒与酿酒葡萄样品排名的综合评分 样品 酿酒葡萄排名 品酒评分 综合排名 1 6 3 4.00 2 16 17 16.67 3 23 2 8.98 4 20 6 10.65 5 28 13 17.98 6 21 22 21.67 7 3 14 10.35 8 7 24 18.35 9 25 12 16.32 10 19 10 12.99 11 9 23 18.35 12 17 28 24.35 13 15 27 23.01 14 11 20 17.01 15 4 15 11.35 16 8 26 20.02 17 5 4 4.33 18 13 18 16.34 19 27 21 22.99 20 24 9 13.98 21 2 8 6.01 22 14 16 15.34 23 1 11 7.68 24 10 19 16.01 25 12 5 7.33 26 18 7 10.65 27 26 25 25.33 28 22 1 7.98 表18 白样品综合等级频数 白样品等级数 不合格 合格 良 优 综合等级频数 2 9 15 1 5.3问题三模型的建立与求解 对于本问题分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们采用的通径分析法,通过建立通径分析模型来求解它们之间的联系。 5.3.1偏相关分析 由附件2知道,本实验的数据分别给出28个白葡萄样品和6个白葡萄酒样品的理论化指标,对其中多次测量的理化指标,我们采用的是取其平均值的方法进行处理。在28个不同的葡萄酒样品中,白葡萄酒的理化指标()的实验数据如下表所示: 表19 白葡萄酒的理化指标 品种编号 单宁 总酚 酒总黄酮 白藜芦醇 DPPH 色泽 白葡萄酒 L*(D65) a*(D65) b*(D65) 酒样品1 1.620 1.264 0.105 0.3090 0.035 102.110 -0.510 2.110 酒样品2 1.233 1.104 0.510 0.2154 0.033 101.850 -0.590 3.160 酒样品3 2.009 1.820 3.669 0.3484 0.047 101.790 -0.480 2.940 酒样品4 2.017 1.485 1.132 0.1119 0.053 101.700 -0.870 4.050 酒样品5 1.595 1.537 1.414 0.3127 0.041 101.820 -1.150 4.370 酒样品6 1.289 1.176 0.079 0.1757 0.042 102.070 -0.580 2.640 酒样品7 1.374 1.202 3.931 0.3711 0.052 101.860 -0.260 2.260 酒样品8 1.513 0.472 0.577 0.5844 0.039 102.100 -0.680 2.610 酒样品9 1.844 1.287 0.100 0.1993 0.040 101.730 -0.790 3.880 … … … … … … … … … 根据上述取得的样本数据,通过使用excel进行数据的相关系数的拟合,求得的偏相关系数矩阵如下所示: 同理,我们可以分别求得红色葡萄酒的理论指标()的偏相关系矩阵、红葡萄的理论指标()的偏相关系矩阵、白葡萄的理论指标()的偏相关系矩阵,具体结果见附录3。 5.3.2通径分析模型 其中yi和xi均为标准化的样本数据值。则回归系数的最小二乘估计满足的正则方程组为: 正则方程组将分解为对的直接作用及xj通过其它xk(k=/j)对y的间接作用原理。所以对的作用是通过1条直接路和条间接路来实现的,总作用等于各路径系数之和,即 同样的第2,3,4,………,方程分别表示了对的作用机理。 分析模型中决定系数 5.3.2通过使用SPSS求理化指标间的通径系数 通过使用SPSS可得葡萄的等级与红葡萄酒的各个理化指标之间的关联度大小:(如下表) 表20 红葡萄与红葡萄酒的理化指标之间的关联度 花色苷 单宁 总酚 酒总黄酮 白藜芦醇 R1 R2 R3 R4 R5 0.700 0.983 0.982 0.981 0.978 DPPH半抑制体积 L*(D65) a*(D65) b*(D65) 芳香物质 R6 R7 R8 R9 R10 0.972 0.940 0.928 0.976 0.570 通过比较关联度的大小就可以得出红葡萄酒的各个理化指标与酿酒红葡萄的密切关系程度。 当然,同理可以计算出白葡萄和白葡萄酒的理化指标的关联度大小:(如下表) 表21 白葡萄与白葡萄酒的理化指标的关联度 单宁 总酚 酒总黄酮 白藜芦醇 DPPH半抑制体积 R1 R2 R3 R4 R5 0.974 0.974 0.974 0.972 0.971 L*(D65) a*(D65) b*(D65) 芳香物质 R6 R7 R8 R9 0.845 0.970 0.977 0.519 通过比较关联度的大小就可以得出白葡萄酒的各个理化指标与酿酒白葡萄的密切关系程度。最终求得各理化指标间的线性回归方程为; 5.4、问题四模型的建立与求解 本问题是为了分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,由前面我们已经知道酿酒葡萄的综合得分,并对其进行了分级处理。但是,酿酒葡萄的综合得分只是一种感性认知,不能决定葡萄酒的质量,故此我们要综合考虑两者的影响。 我们从反应变量出发分析,附录2和附录3中给出的是分类变量,因此不适宜用线性回归分析,因此我们选用Logistic回归模型来进行统计分析。 5.4.1 Logistic回归方程为; 其中,P,,,,,分别称为随机误差,概率优势,回归常数和偏回归系数。 所以得P的计算式为: 5.4.2 运用SPSS软件求解Logistic回归方程的参数 (1)理化指标与葡萄酒质量的影响程度 通过SPSS软件的Analyze→Regression→Linear过程,输出葡萄的理化指标与葡萄酒质量之间关系的相关表,如下图: 图1 红葡萄理化指标对葡萄酒质量的影响(平均数) 第二列中,常数项估计值=64.053,其余是偏回归系数估计值。 第六列t
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 学术论文 > 毕业论文/毕业设计

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服