1、 实验报告 学院:理学院 系:数学系 专业:应用数学 实验名称:计算实验 年级: 姓名: 学号: 组号: 实验时间:2010.12.1 成绩: 指导教师签字: 实验题目:实验四 回归分析与逐步回归 目的和要求: 1. 学会对实际问题进行数学抽象。 2. 熟悉用MINITAB软件中进行方差分析和回归分析的基本命令的操作; 3. 学会用MINITAB进行多因素试验的回归分析的程序设计。 主要仪器设备:多媒体计算机 实验内容:牙膏的销售量 问题:某大型牙膏制造企业为了更好的拓展产品市场,有效地管理库存,公
2、司董事会要求销售部门根据市场调查,找出公司生产的牙膏销售量价格,广告投入等之间的关系,从而预测出在不同价格和广告费用下的销售量。为此,销售部的研究人员收集了过去30个销售周期(每个销售周期为4周)公司生产的牙膏销量,销售价格,投入的广告费用,以及同期其他厂家生产的同类牙膏的平均销售价格,见表1。试根据这些数据建立一个数学模型,分析牙膏销售量与其他因素的关系,为制定价格策略和广告投入策略提供数据依据。 销售 周期 公司销售价格(元) 其他厂家平均价格(元) 广告费用(百万元) 价格差 (元) 销售量 (百万支) 1 2 3 4 5 6 7 8 9 10
3、 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 3.85 3.75 3.70 3.70 3.60 3.60 3.60 3.80 3.80 3.85 3.90 3.90 3.70 3.75 3.75 3.80 3.70 3.80 3.70 3.80 3.80 3.75 3.70 3.55 3.60 3.65 3.70 3.75 3.80 3.70 3.80 4.00 4.30 3.70 3.85 3.80 3.7
4、5 3.85 3.65 4.00 4.10 4.00 4.10 4.20 4.10 4.10 4.20 4.30 4.10 3.75 3.75 3.65 3.90 3.65 4.10 4.25 3.65 3.75 3.85 4.25 5.50 6.75 7.25 5.50 7.00 6.50 6.75 5.25 5.25 6.00 6.50 6.25 7.00 6.90 6.80 6.80 7.10 7.00 6.80 6.50 6.25 6.00 6.50 7.00 6.80 6.80 6.5
5、0 5.75 5.80 6.80 -0.05 0.25 0.60 0 0.25 0.20 0.15 0.05 -0.15 0.15 0.20 0.10 0.40 0.45 0.35 0.30 0.50 0.50 0.40 -0.05 -0.05 -0.10 0.20 0.10 0.50 0.60 -0.05 0 0.05 0.55 7.38 8.51 9.52 7.50 9.33 8.28 8.75 7.87 7.10 8.00 7.89 8.15 9.10 8.86 8.90 8.87 9.2
6、6 9.00 8.75 7.95 7.65 7.27 8.00 8.50 8.75 9.21 8.27 7.67 7.93 9.26 表1 牙膏销售量与销售价格,广告费用等数据 (其中价格差指其他厂家平均价格与公司销售价格之差) 1.实验设计方案 1) 前期分析: 牙膏的销售量受到多种因素影响,例如:产品销售价格、同类产品销售价格、广告费用投入量、产品质量等因素。但是我们只考虑两个对结果有显著性影响的因素,广告费用投入量及同类价格产品。在考虑同类产品价格时不好处理,在这里我们仅考虑其他产品同本公司产品的价格差 2) 模型假设: 1 在一定时期内假设
7、市场总需求量没有太大的变化。 2 同类产品在一定时期内价格无明显变化。 3 通过调节本公司的价格调整都能够达到理想的价格差 3) 建立模型: 4) 编写程序:[b,bint,r,rint,stats]=regress(y,x,alpha) 5) 对结果进行分析,讨论诸如:结果的合理性、正确性,算法的收敛性,模型的适用性和通用性,算法效率与误差等。 2.基本模型 为了大致分析y与和的关系,首先利用散点图观察销售量y与价格差及y与广告投入量之间的关系。 Y与的关系: 图1 Y对散点图(1) 从图(1)发现,随着增加,y的
8、值有明显的线性增加趋势,图中直线用线性模型 (1) Y与的关系: 图2 y对的散点图 拟合的(其中是随机误差)在图2 中,当增大时,y有向上弯曲增加的趋势,图中的曲线用二次函数模型: (2) 拟合。 综上分析,结合模型(1)和(2)建立如下回归模型 (3) 其中,y是建立的模型,我们用对y进行估计,其中是我们待估计的参数。 3.模型求解 利用MATLAB统计工具箱中的命令regress求解,
9、使用格式为: [b,bint,r,rint,stats]=regress(y,x,alpha) 具体实验操作过程如下: x1=[-0.05 0.25 0.6 0 0.25 0.2 0.15 0.05 -0.15 0.15 0.2 0.1 0.4 0.45 0.35 0.3 0.5 0.5 0.4 -0.05 -0.05 -0.1 0.2 0.1 0.5 0.6 -0.05 0 0.05 0.55]'; x2=[5.5 6.75 7.25 5.5 7 6.5 6.75 5.25
10、5.25 6 6.5 6.25 7 6.9 6.8 6.8 7.1 7 6.8 6.5 6.25 6 6.5 7 6.8 6.8 6.5 5.75 5.8 6.8]'; x3=[30.25 45.5625 52.5625 30.25 49 42.25 45.5625 27.5625 27.5625 36 42.25 39.0625 49 47.61 46.24 46.24 50.41 49 46.24 42.25 39.0625 36 42.25 49 46.24 46.24 42.2
11、5 33.0625 33.64 46.24]'; Y=[7.38 8.51 9.52 7.5 9.33 8.28 8.75 7.87 7.1 8 7.89 8.15 9.1 8.86 8.9 8.87 9.26 9 8.75 7.95 7.65 7.27 8 8.5 8.75 9.21 8.27 7.67 7.93 9.26]'; X=[ones(30,1) x1 x2 x3]; [b,bint,r,rint,stats]=regress(Y,X)
12、 rcoplot(r,rint) 结果如下: b = 17.3244 1.3070 -3.6956 0.3486 bint = 5.7282 28.9206 0.6829 1.9311 -7.4989 0.1077 0.0379 0.6594 r = -0.0988 -0.0795 -0.1195 -0.0441 0.4660 -0.0133 0.2912 0.2735 -0.235
13、1 0.1031 -0.4033 0.1747 0.0400 -0.1504 0.1284 0.1637 -0.0527 -0.1907 -0.0870 -0.0165 -0.1292 -0.3002 -0.2933 -0.1679 -0.2177 0.1116 0.3035 0.0693 0.2474 0.2270 rint = -0.5270 0.3294 -0.530
14、9 0.3718 -0.5106 0.2716 -0.4731 0.3848 0.0813 0.8507 -0.4609 0.4343 -0.1374 0.7197 -0.0870 0.6340 -0.5960 0.1258 -0.3280 0.5341 -0.8190 0.0125 -0.2618 0.6112 -0.4032 0.4832 -0.5933 0.2925 -0.3207 0.5775
15、 -0.2841 0.6116 -0.4830 0.3776 -0.6248 0.2434 -0.5348 0.3609 -0.4423 0.4092 -0.5609 0.3024 -0.7181 0.1177 -0.7243 0.1377 -0.5548 0.2190 -0.6449 0.2095 -0.2994 0.5226 -0.1037 0.7106 -0.3714 0.5099 -0.1807 0
16、6755 -0.1890 0.6430 stats = 0.9054 82.9409 0.0000 0.0490 得到模型(3)的回归系数的估计值及其置信区间(置信水平)、检验统计量的结果见下表1 参数 参数估计 参数置信区间 17.3244 [5.7282 28.9206] 1.3070 [0.6829 1.9311] -3.6956 [-7.4989 0.1077] 0.3486 [0.0379 0.6594] =0.9054 =82.9409 <0.0001
17、 表 1 4.结果分析 y为模型(3)中的数据,x为对应与回归系数的数据矩阵[1 ],alpha为置信水平,缺省时=0.05;输出b为的估计值,常记作,bint为b的置信区间,r为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有3个值回归方程决定系数、F统计量、F统计量对应的概率值P。 由表中的数据显示,=0.9054指因变量的y的90.54%可由模型确定,值远远超过检验的临界值,远远小于,因而模型(3)可用。 表2的回归系数给出了模型(3)中,,,的估计值=17.3244,=1.3070,=-3.6956,=0.3486。检查它们的置信区
18、间发现,只有的置信区间包含零点(但区间右端点距零点很近),表明回归变量(对因变量的影响)不是太显著的,但由于是显著的,我们仍将变量保留在模型中。 5.销售量预测 经回归系数的估计值代入模型(3),即可预测公司未来某个销售周期牙膏的销售量,将预测值记为,得到模型(3)的预测方程: = (4) 只需知道该销售周期的价格差和投入的广告费用,就可以计算预测值。 公司无法直接确定价格差,只能制定公司的牙膏销售价格,但是其它厂家的平均价格一般可以通过根据市场情况及原材料的价格变化等估计。模型中用价格差做为回归变量的好处在于公司可以更灵活地来预测产品的销售量或市场需求量,因为其它厂家的平均价
19、格不是公司所能控制的。预测时只要调整公司的牙膏销售价格达到设定的回归变量价格差的值。 回归模型的一个重要应用是,对于给定的回归变量的取值,可以以一定的置信度预测因变量的取值范围,即预测区间。 6.模型改进 模型(3)中回归变量,对因变量的影响是相互独立的,即牙膏销售量的均值和广告费用的二次关系由回归系数,确定,而不依赖与价格差,同样,的均值与的线性关系由回归系数确定,不依赖于。根据经验可参想,和之间的交互作用会对有影响,简单的用,的乘积代表他们的交互作用,将模型(3)增加一项,得到: (5) 在这个模型中,的均值与的二次关系为,由系数,,确定,并依赖与价格差。 讨论:对实验中存在的问题、进一步的想法等进行讨论。






