资源描述
封 面
院校:湖南理工学院
题目:畅 销 品 问 题
队员:杨洁 熊翠文 张志
畅销品判断
摘要 :解决这道题我们使用SPSS软件与matlab软件进行分析。。主要采用以下两种方法,方法一:贝叶斯判断法,进行系数的判定。该模型构造了类别与商品的式样、包装和耐久性之间的线性关系函数,并由得到的函数判断新厂家产品的得分情况,判断产品是否受欢迎。方法二:classify函数判别法,在matlab软件中用已有的classify函数直接进行判定,该方法操作简便不但能明确的反映各个影响因素之间的关系,而且能快速判断产品的。且利用判别分析法,可预测到产品所属概率型。
关键字:聚类分析 贝叶斯判断 信度分析
目 录
一、问题重述与分析 4
1.1问题重述 4
1.2问题分析 4
二、模型建立求解与分析 4
2.1模型假设 4
2.2符号说明 5
2.3模型建立 5
2.4模型求解 5
三、模型评价与改进 7
3.1模型分析与评价 7
3.2误差分析 8
3.3模型改进 9
四、参考文献 10
一、问题重述与分析
1.1问题重述
某种产品的生产厂家有12家,其中7家的产品受消费者欢迎,属畅销品,定义为1类;5家的产品不受欢迎,属滞销品,定义为2类。
将12家的产品的式样,包装和耐久性进行了评估后得分如下:
厂家
1
2
3
4
5
6
7
8
9
10
11
12
式样
9
7
8
8
8
9
7
4
3
6
3
1
包装
8
6
7
5
9
9
5
4
6
3
4
2
耐久性
7
6
8
5
7
3
6
4
6
3
5
2
类别
1
1
1
1
1
1
1
2
2
2
2
2
今有一新厂家,得分为(6,4,5),该产品是否受欢迎。
分析已给出的数据,并根据新厂家的产品的各项得分判断该厂家的产品是畅销品还是滞销品。
1.2问题分析
本题讲述的是畅销品判断问题,这道题所要解决的问题是日常生活中常见的问题,无论是商家还是顾客都很关注商品的畅销问题。一般的,商品是否畅销取决于商品的式样、包装和耐久性,这三个方面既是吸引顾客的主要因素,也是商品好坏的评判标准。
本题给出实际问题的可能影响因素,并给出实际数据供我们分析,得出判断的函数。并由得到的函数判断新厂家产品的得分情况,判断产品是否受欢迎。
二、模型建立求解与分析
2.1模型假设
从表格中可以看出有三个因素影响着类别的判断,故作出如下假设:
﹙1﹚ 三个因数中由某个或多个对产品是否畅销起作用,不考虑其它因数
﹙2﹚ 给出的数据是准确的没有记录错误
2.2符号说明
x1:表示式样得分 x2:表示包装得分 x3:表示耐久性得分
a:表示x1系数 b:表示x2系数 c:表示x3系数 d:常数项
z1:表示产品为畅销品的判别函数 z2:表示产品为滞销品的判别函数
2.3模型建立
根据模型假设中的分析则建立式样、包装、耐久性对产品为畅销品或是滞销品的一次线性函数关系,其形式如下:
畅销品判断函数(1)
滞销品判断函数(2)
2.4模型求解
方法一:贝叶斯判断法
打开SPSS软件将表格中的数据录入表格中,并保存生成文件cxp.sav,对数据文件进行聚类分析,对数据进行Univaritate ANOVAs单变量方差或者Box’s M 的描述性统计,函数系数用贝叶斯判断,在对数据进行统计分析时函数系数选择Fisher’s 方法得到先验概率表如下
表(1)
其中类别1和类别2的先验概率均为0.5
当对数据进行K_Means分析时得到两类中的各个因素凝聚点的值如下图所示:
表(2)
由贝叶斯线性判别函数得到和两函数的各个因素的系数如下表所示:
表(3)
故得到模型建立函数如下:
畅销品判断函数(3)
滞销品判断函数(4)
使用模型求解实际问题:任意代入(x1,x2,x3)到函数、z2中得到两个函数值分别、 ,比较、的大小,若>,则产品为畅销品,若<,则为滞销品。
把(6,4,5)直接带入到上述两个函数得到=13.1530 、=12.6880
由于z1>z2 故该厂家产品为畅销品。
为了测试模型的正确性任意输入其他数据测试模型的正确性:
⑴如测试数据(7,5,6)代入到、z2两个方程中得到=20.5990、=16.4820,则判断得出该厂家产品为畅销品;
⑵如测试数据(2,3,4)代入到、z2两个方程中得到=-7.7420、=3.3110
则判断得出该厂家产品为滞销品。利用判别分析,预测到的结果完全一致。
方法二:classify函数判别法
用matlab中的classify函数直接求解,文件cxp.m程序如下:
clear,clc
sample=input('sample=');%输入要测试的产品
training=[9,8,7;7,6,6;8,7,8;8,5,5;8,9,7;9,9,3;7,5,6;4,4,4;3,6,6;6,3,3;3,4,5;1,2,2];%将表格中的数据按列优先输入
group=[1;1;1;1;1;1;1;2;2;2;2;2];%将键入每个厂家的产品的分类
class=classify(sample,training,group)%用classify函数需要测试的产品的分类
在命令行输入[6,4,5]
运行结果:class = 1
故该厂家产品为畅销品。
再输入其它数据如(7,5,6)、(2,3,4)分别得出两个数据测试的class值为1 2
则判定两个厂家的产品分别为畅销品和滞销品。
三、模型评价与改进
3.1模型分析与评价
经SPSS软件中的分析得到各个因素对于产品畅销与滞销影响的程度如下表所示:
表(4)
其中wilks' Lambda值越小说明该因素对模型的影响效果就越显著。由表可得式样对产品的畅销与滞销影响效果最明显,包装次之,耐久性影响效果最不显著。另外还可以从另一个角度来分析,式样和包装的Sig值均小于0.05,且式样的Sig值最小,故影响效果最明显,包装的Sig值稍大,故影响效果较好,耐久性的Sig值大于0.05故影响效果最不显著。模型中耐久性对产品是畅销品还是滞销品的影响不大,但是由下表所示的wilks' Lambda可知该模型的总体情况还不错。
表(5)
优点:利用贝叶斯判断法,构造了合理函数,为产品的判定提供了更准确的依据,减少了评价的误差,为消费者和厂家提供了清晰、准确的关系图,有利于产品的综合评定。
3.2误差分析
对数据用SPSS软件进行方差分析,分析后输出方差表如下所示:
表(6)
由表中的F值和Sig值可以看出式样的F值和Sig值为27.021、0.000和包装的F值和Sig值为13.281、0.004均,而耐久性的Sig值为0.059大于0.05,故耐久性对产品是畅销品还是滞销品判断的影响不大反而对模型起到了反面作用,引起较大的误差,降低模型的准确性。
用SPSS软件做一次信度分析,得到总体内在信度分析表如下:
表(7)
Cronbach’s Alpha值为0.814,虽然数值大于0.7但是不足0.9,故模型不是很合理。
表(8)
再通过表(8),我们看到最后一列,耐久性这个条目被删除后,另外两个的因数层面系数都有所降低了,说明耐久性对厂品是否畅销没有强烈的相关性。
3.3模型改进
改进后方法一:由上模型分析可得耐久性对产品是畅销品还是滞销品的影响程度并不大,所以,只考虑式样与包装对产品是畅销品还是滞销品判断的影响。用SPSS软件再做一次聚类分析,只考虑式样和包装两个因素的影响得到函数系数表如下:
表(9)
可得到新的判别函数如下:
畅销品判断函数(5)
滞销品判断函数(6)
将(6,4,5)代入、得到两个值=8.0680、=8.0560,>得到该厂家的产品属于畅销品,受消费者欢迎。当代入(7,5,6)得=13.5780、=10.5970,>得到该厂家的产品属于畅销品;当代入(2,3,4)得= -9.4510、= 0.8620,<得到该厂家的产品属于滞销品。与原模型所得的结果一致。
通过判别分析法验证,后验概率型与先验概率型完全一致。
改进后方法二:只考虑式样和包装两个因素,文件cxp1.m程序如下:
clear,clc
sample=input('sample=');%输入要测试的产品
training=[9,8;7,6;8,7;8,5;8,9;9,9;7,5;4,4;3,6;6,3;3,4;1,2];%将表格中的数据按列优先输入
group=[1;1;1;1;1;1;1;2;2;2;2;2];%将键入每个厂家的产品的分类
class=classify(sample,training,group)%用classify函数需要测试的产品的分类
在命令行输入[6,4]
运行结果:class = 1
故该厂家产品为畅销品。
再输入其它数据如(7,5)、(2,3)分别得出两个数据测试的class值为1 2
则判定两个厂家的产品分别为畅销品和滞销品。
四、参考文献
[1]陈汝栋 于延荣,数学模型与数学建模,北京.国防工业出版社,2006年;
[2]唐焕文,数学模型引论,北京. 高等教育出版社,2001;
[3]姜健飞 胡良剑等,数值分析及其MATLAB实验,北京.科学出版社,2004年;
[4]高祥宝 董寒青,数据分析与SPSS应用,北京,清华大学出版社,2007年。
[5]薛 薇,SPSS统计分析方法及应用,北京,电子工业出版社,2004年。
展开阅读全文