全国大学生数学建模竞赛题葡萄酒的评价答案.doc
文本预览下载声明
数学实验
计算机科学与技术
成员:xxx
学号:xxxxxxxxxx
葡萄酒的评价
摘要
本文主要研究的是如何对葡萄酒进行评价的问题。通过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、分析和处理,我们得出了一个较为合理地评价葡萄酒质量优劣的模型。
在问题一中,我们采用T检验法,首先进行正态分布拟合检验,判断出它们服从正态分布。之后,我们通过T检验法判断出了两组评酒员的评价结果具有显著性差异。而对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。利用Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评价结果更可信。
在问题二中,我们采用主成分分析法,把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差第二变量的方差次大,并且和第一变量不相关依次类推 第组评酒员对各品种红葡萄酒的评分均值的期望
第组评酒员对各品种红葡萄酒的评分均值的方差
问题一的假设
第个主成分
第个评酒员对第种酒的评分
问题的分析
针对问题一,如何判断两组评酒员的评价结果有无显著性差异,我们采用T检验法进行判断。但采用T检验法的前提是其必须服从正态分布,方差未知且相等。所以我们先对那些数据进行正态分布检验,判断其是否服从正态分布。验证服从正态分布后,我们利用T检验法判断两组评酒员评价结果的显著性差异。对于如何判断哪一组评酒员的评价结果更可信,由于评酒员评分的客观性,我们通过计算评酒员评分均值的置信区间,利用置信区间的长短来判断评分的可信程度。置信区间越窄,说明其越可信。
针对问题二中如何根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,我们采用主成分分析法。因为在实际问题的研究中,往往会涉及众多有关的变量。但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。解决这个问题的过程中,我们用Matlab软件实现主成分分析,我们对那些理化指标进行重新整理,求出各个理化指标的之间的相关系数、特征值及特征向量和贡献率等。
针对问题三中如何分析酿酒葡萄与葡萄酒的理化指标之间的联系,我们想到了用多项式曲线拟合的方法,根据两者理化指标实测样本,用统计分析的方法,找出一种适当的函数关系从而达到处理酿酒葡萄与葡萄酒之间相关关系的目的。实际的操作过程中,我们首先构造一个关于酿酒葡萄与葡萄酒的理化指标的函数,以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量,利用Matlab软件进行曲线拟合,得出酿酒葡萄与葡萄酒的理化指标之间的关系。
针对问题四中如何分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,以及能否用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量,我们采用无交互作用的双因素试验的方差分析方法。用方差分析,可以将影响葡萄酒的主要因素和次要因素区分开来,还可以分别算出酿酒葡萄的理化指标和葡萄酒的理化指标与葡萄酒质量之间的误差,如果误差在可接受范围之内,即说明可以用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒质量。
模型的建立与求解
问题一的模型建立与求解
4.1.1 T检验法的模型建立与求解
T检验是用分布理论来推论差异发生的概率,从而比较两个的差异是否显著。62.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7,
74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73
第二组评酒员对各品种红葡萄酒的评分均值为:
68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72, 71.5
然后我们利用Matlab软件里的正态分布拟合函数进行曲线拟合,得出其正态分布的拟合曲线图为图一:
图一、正态分布拟合曲线图
从图中我们知道其曲线近似为一条直线,因此我们认为评酒员对红
显示全部