1、网络购物分析【摘要】 本题是对网购问题的分析,由于商场旨在追求利益的最大化,因此对商品聚类分析、找出利益最高的组合,为商家呈现出最好的营销方式,是本题主旨。同时由于本题数据繁杂庞多,其结果也与数据有着直观和密切的联系,所以对于数据的处理极其准确程度也显得尤为重要。(本题所给数据皆真实有效)。 对于问题一,求其商品之间的关联程度,即指如果买一副镜框,一般情况下也要买一副镜片,此时可认为镜片和镜框的关联度很高。故解决此问题可以运用聚类的方法和概率论知识相结合的办法,建立相应的模型,找出关联度很高的组合,即为所求的的结果。 对于问题二,利用穷举法以及第一问的模型,便可以找出同时被频繁购买的商品的组合
2、,便可以据此进行第三问的求解,所以第二问是一个承接的作用。对于问题三,在问题二的基础上得出促销方案.故需知道各种组合的利益,运用最优解法,结合购买的次数最多以及商品的价格较高两个因素,找出各种组合中的利益最大的组合,促销在此基础上进行。例如:在最大利益的组合中,有一利益最小的商品,则可以对此商品进行打折,以此达到薄利多销的营销策略。经过市场调查,可以得到使其利润最大的打折率f(i),那么f(i)便是我们的促销打折率,以此便可制定促销方案.与此,也可运用其他的策略.问题一,问题二结果如下表所示:问题一结果:组合商品编号数目关联度V368 6822860.07732872V368 5293290。
3、076986159V956 538 4131200。005608505V368 937 829 413720.00003998 问题二结果:组合商品编号数目V368 529329V368 829307 V368 489 682122V368 937 829 41372问题三结果:一种商品: 最高获利382255。74元, 商品编号为368。二种商品组合:最高获利189487.55元, 商品编号为(368 529)。三种商品组合:最高获利76468元, 商品编号为(V368 829 529)。四种商品组合: 最高获利737.6688元, 商品编号为(V489 438 956 722)。【关键词】
4、0,1变量,关联度,聚类分析,穷举法,最优解法,促销,spss软件,matlab软件。一、问题重述网店老板经常关心的问题是顾客的购物习惯,即什么商品组或集合顾客会在一次购物时同时购买。 他们可以把这些“同类商品相互关联在网页内,以便于顾客浏览商品,引导顾客消费,进而增加销量.已知某购物网站一段时期所有顾客购买物品的清单和相应商品的利润,需要我们给网店老板一个合理的顾客购物习惯分析报告,并提供一个促销计划的初步方案. 问题1 试建立一种数学模型,该模型能定量表达网站中多种商品间的关联关系的密切程度.数据见附件1。 问题2 根据在问题1中建立的模型,分析出哪些商品是最频繁被同时购买的,并且找到的最
5、频繁被同时购买的商品数量越多越好。例如:如果商品 1、商品 2、商品 3,商品 4 在 4625 个购物记录中同时出现了 200 次,则可以认为这三个商品同时频繁出现了 200 次,商品数量是4。 问题3 附件 2 给出了这 999 中商品的对应的利润,根据在问题1、问题2中建立的模型,给出一种初步的促销方案,使购物网站的效益进一步增大.二、问题分析本题旨在为商家做出商品分析报告,提出合理的建议,达到利益最大化的目标。由于本题问题层层递进,而且数据量庞大,问题所问与初始数据密切相关,故数据的处理显得至关重要.对此,将matlab与spss,excel等软件相结合,便可对原始数据进行处理以得到更
6、为直观的数据。问题一运用聚类分析和概率相结合的办法。现将原始数据转换为0,1变量,所谓0,1变量,即指把商品编号和人数组成二维表,若某人买了某编号的商品,则在此对应的位置标1,反之为0.这样便得到利于计算和直观反映的数据。此过程由spss和matlab进行,具体详见模型解答过程.在0,1变量的基础上,对商品进行各种组合,若某人买了一种组合中的全部商品,即对应的0,1变量皆为1,则重新标记为1,反之则为0。以之求和,便可得到购买数量最多的组合,再用其模型求得其关联度。问题二在问题一的基础上求解,利用穷举法和问题一中的结果,可将频繁购买的组合求出来。问题三利用最优解法,把各种组合中的最大利益求出来
7、,在其组合中找出利益最小的商品,则此种商品为需要打折促销的商品,再根据f(i)决定促销策略。同时也根据问题二的结果,列出需要放在一起进行广告的商品组合数,至此则此题已完全解决。三、模型假设1. 对于问题三中,各个商品利润保持不变。2. 表格中的数据能真实反映当地消费者购物情况。3. 短时期内商品销售不会变化,即种类数目不会有太大的变化。4. 关于商品的关联度,如果买一种商品的同时买另一种商品,则就说明它们有关联度,如眼镜框和镜片,排除无意间同时购买的因素,如面包和衣服等,故此题中的同时购买即认为全为有关系的,即是有关联度的.5. 题中的打折率f(i)可以从现实中得到,以至于促销策略可以实行。6
8、. 不存在打破这种商品购买格局的因素。7. 商场是追求利润的最大化,由于数据众多,故提取单笔购买数量从大到小排列的5作为数据样本。对实际结果分析没多大的影响.四、符号说明Ni 表示i商品购买的频率; Nj 表示j商品购买的频率;表示k商品购买的频率;表示l商品购买的频率; 表示i和j商品同时购买的频率;表示打折后i和j商品同时购买的频率;表示i,j,k商品同时购买的频率;表示i,j,k,l商品同时购买的频率;表示i,j商品的关联度;表示i,j,k商品的关联度;表示i,j,k,l商品的关联度; T表示商品的总利润; m表示购买的人数; n表示商品的数目; 表示购买商品i的利润; d(i,j)表示
9、第i人是否购买了第j种商品,用0,1表示买与不买,d为0,1的矩阵; f(i)表示打折率;Z表示促销前销售量;Z表示促销后的销售量。五、模型的建立对于此题的模型,为求其关联度,我们运用概率方面的知识:P(A/B)=P(AB)/P(B)P(B/A)=P(AB)/P(A)则有:P(A/B) P(B/A)= P(AB)/P(B)* P(AB)/P(A);故此联系上面的公式,我们可以得到以下模型:其中:Ni 表示i商品购买的频率;Nj 表示j商品购买的频率;表示i和j商品同时购买的频率;表示i,j商品的关联度。这样便是两个商品的模型。三个商品和四个商品等的以此类推:对于第二题的模型,则在第一题基础上,
10、求出,中最大的几组,便是可以得到结果。第三题模型:在第二组求出的最大的,中,求其组合中的最大利益:T1= Ni;T2=*(+);T3=(+);T4=(+); 其中T1,T2,T3,T4分别为一个商品,两个商品组合,三个商品组合,四个商品组合的最大利润。 在促销过程中,设商品i在组合中利润最小,则对其打折,打折率为f(i),打折前销售量为Z,打折后销售量为Z,购买i,j的人数为,则其利润为:T=*(+ f(i)则多获益:t=*(+ f(i))*(+)这样以此类推,三种组合,四种组合皆为如此。六、模型求解 问题一:首先将消费记录数据用spss进行整理,然后用matlab求其0,1矩阵,其程序如附录
11、中程序一。d(i,j)=1 第i人买了第j种商品0 第i人没买第j种商品然后求和,求得各种商品的购买量,根据假设取其前50种,结果如下:(V368表示商品编号,第二列数字为购买量)V368 1314V8291079V5291070V510944V419927V217909V489868V438833V956824V914809V766807V682805V692802V937781V205768V722744V720741V883730V145676V362676V895669V897667V283660V8658V177647V480641V752636V966635V470633V7163
12、2V541622V204621V140620V12616V538616V775614V890611V120609V413607V450607V354606V676595V55592V694586V401581V597568V72553V236552V110549V161548然后对这五十种商品进行处理,任意进行组合,例如,对于i和j号商品,若某人同时买了,则记为1,反之为0.然后对4625名顾客求和,得到i和j商品共同购买的数目,再用公式,此过程用matlab做,其程序如附件中的程序2,取其前最高关联度的十组,得到结果如下:组合商品编号数目关联度V368 6822860.07732872V36
13、8 5293290.076986159V529 6922510.07341576V368 4892890.073228577V368 829307 0。066475244V368 2172800.065638223V368 937258 0.0648624V829 6922360.064361802V529 4382370。063018478V368 7202460。062152219对于三种商品的组合,类似两种组合的处理办法,使用公式,利用matlab,其程序见附件程序3。取其前最高关联度的四组,得到如下结果:组合商品编号数目关联度V956 538 4131200。005608505V368
14、 489 6821220。001977737V368 529 2171010.00080616V368 829 5291000。000659173对于四种商品的组合,类似三种组合的处理办法,使用公式,利用matlab,其程序见附件程序4。取其前最高关联度的二组,得到如下结果:组合商品编号数目关联度V368 937 829 413720.00003998 V489 438 956 722470。00001101 问题二:根据问题一得到的中间结果,得到组合为两种,三种,四种的最高销售量的组合,其销售量和商品编号如下:1两种组合:组合商品编号数目利润V368 529329189487。55V368
15、829307 147249。48V368 48928985578。3332V368 68228690164。074V368 21728082913.264V368 41926683858.894V368 937258 76398。6504V368 510256100071.4242三种组合:组合商品编号数目利润V368 489 68212239097。0716V956 538 41312057274。68V368 529 21710158697。0388V368 829 529100764683四种组合:组合商品编号数目利润V368 937 829 41372673.5788V489 438
16、956 72247737。6688问题三:在第二组求出的较大的,中,求其组合中的最大利益:T1= Ni;T2=(+);T3=*(+);T4=(+);得到结果如下:MaxT1=382255.74,说明368号商品获利最高。MaxT2=189487。55,说明其组合为368号商品和529号商品在两种商品的组合中获利最高;MaxT3=76468,说明其组合为368号商品和829号商品以及529号商品在三种商品的组合中获利最高;MaxT4=737。6688, 说明其组合为489号商品和438商品和956 号商品以及722号商品在四种商品的组合中获利最高。在促销中盈利如下:两种组合:其中529号商品盈利
17、少,对其打折,设打折率为f(529),打折后同时购买此两种商品的数量增加u1,则获利T=(368+u1)*(290.91+285。04f(529)较促销之前多获利:t=(368+u1)*(290.91+285。04*f(529)) 189487。55三种组合:其中829号商品盈利少,对其打折,设打折率为f(829),打折后同时购买此三种商品的数量增加u2,则获利T=(100+u2)290。91+188.73f(829)+285。04较促销之前多获利:t=(100+u2)*290.91+188.73f(829)+285。04-76468四种组合:其中489号 商品盈利少,对其打折,设打折率为f(
18、489),打折后同时购买此四种商品的数量增加u3,则获利T=(47+u3)(5.2088f(489)+274.78+264.21+193.47)较促销之前多获利:t=(47+u3)*(5.2088f(489)+274.78+264。21+193.47)737。6688同时还有其他如下的促销策略:把组合(368 529),(368 829),(368 489),(368 682),(368 217),(368 419),(368 937),(368 510),(368 489 682),(956 538 413),(368 529 217),(368 829 529),(368 937 829
19、413),(489 438 956 722)等组合中的商品在网站上置于同一板块,便于吸引消费者的眼球,出于消费者省钱以及图方便的心理,便可以增加商品的出售额,获取更多的利益。七模型评价(一).优点:1、本题研究了网购情况,首先对于问题的较为庞杂的数据用matlab和spss等程序做了处理,使数据更为直观明了,同时有利于计算。2、在具体题目中运用了聚类分析的方法,使结果更为直观,形式更为简明,由于本题讨论市场商业问题,故此与商业方面报告的结论易读化相吻合.3、本题还运用了最优解法,使结论更具说服力,模型更加详细。(二).缺点:1、由于数据量的庞大,本题取其前五十种商品,对结论有一定的影响,但是影
20、响不大,一般情况下可以忽略不计.2、本题也采用了穷举法,由于穷举法的局限性,不能得到最好的效果,但由于此题数据的特殊性,对结果影响不大,也可以忽略不计。3、采用聚类分析时,在样本量较大时,要获得聚类结论有一定的困难在样本量较大时.八、模型的推广 本题是关于网购问题的分析,现代社会,经济日益发展,商品经济逐渐成为主流,电子商务更是重中之重,同时大型超市也将逐步替代小型商店,本题中的模型,既适用于电子商务方面,也适用与大型超市,也即“购物篮”问题。故此只要有商品经济存在的地方,本模型就会使用,并且有一定的效益.所以本模型的使用范围也会越来越广。当然,也不局限于商品经济中,但凡用到聚类的地方,就有本
21、模型存在的价值。参考文献1姜启源 谢金星 叶俊,数学模型(第四版),北京:高等教育出版社,2011年;2韩中庚,数学建模方法及其应用,北京市:高等教育出版社 ,2009年;3卓金武,MATLAB在数学建模中的应用,北京市:北京航空航天大学出版社,2011年;4赫孝良,数学建模实验,西南交通大学出版社,1999.10;5雷功炎,中国大学生数学建模竞赛,高等教育出版社,2001。12。附录:程序一:b=zeros(4625,999);c=zeros(1,999);for i=1:4625 for j=1:72 l=a(i,j); if l0 if l0 u(j,j)=u(j,j)+1;end en
22、ddisp(u)endfor j=1:49 for k=(j+1):50for h=1:4625 if d(h,j)0 if d(h,k)0 u(j,k)=u(j,k)+1;u(k,j)=u(j,k); endendend enddisp(u);end 程序三:e=zeros(20,4);h=1;for j=1:48 for k=j+1:49 for m=k+1:50 t=0; for i=1:4625 if d(i,j)=1&d(i,k)=1d(i,m)=1 t=t+1; end end if t94 e(h,1)=j; e(h,2)=k; e(h,3)=m; e(h,4)=t; h=h+1; end end end disp(e)end 程序四:e=zeros(50,5); endh=1; end for j=1:47 end for k=j+1:48 end for m=k+1:49 disp(e); for l=m+1:50 end t=0; for i=1:4625 if d(i,j)=1&d(i,k)=1&d(i,m)=1&d(i,l)=1 t=t+1; end end if t40 e(h,1)=j; e(h,2)=k; e(h,3)=m; e(h,4)=l; e(h,5)=t; h=h+1;