1、_1 下面是7个地区2000年的人均国内生产总值(GDP)与人均消费水平的统计数据: 地区 人均GDP/元 人均消费水平/元 北京 辽宁 上海 江西 河南 贵州 陕西 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(
2、)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95的置信区间与预测区间。解:(1)可能存在线性关系。(2)相关系数:系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a. 因变量: 人均消费水平有很强的线性关系。(3)回归方程:系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)734.693139.5405.265.003人均GDP.3
3、09.008.99836.492.000.998.998.998a. 因变量: 人均消费水平回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)%(4)模型汇总模型RR 方调整 R 方标准 估计的误差1.998a.996.996247.303a. 预测变量: (常量), 人均GDP。人均GDP对人均消费
4、的影响达到99.6%。%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。模型摘要模型RR 方调整的 R 方估计的标准差1.998(a)0.9960.996247.303a. 预测变量:(常量), 人均GDP(元)。%(5)F检验:Anovab模型平方与df均方FSig.1回归81444968.680181444968.6801331.692.000a残差305795.034561159.007总计81750763.7146a. 预测变量: (常量), 人均GDP。b. 因变量: 人均消费水平回归系数的检验:t检验系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏
5、部分1(常量)734.693139.5405.265.003人均GDP.309.008.99836.492.000.998.998.998a. 因变量: 人均消费水平%注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)734.693139.5405.2650.003人均GDP(元)0.3090.0080.99836.4920.000a. 因变量: 人均消费水平(元)%(6)某地区的人均GDP为5000元,预测其人均消费水平为(元)。(7)人均GDP为5000元时,人均消费水平95的置信区间为1990.74915,
6、2565.46399,预测区间为1580.46315,2975.74999。2 从n=20的样本中得到的有关回归结果是:SSR(回归平方与)=60,SSE(误差平方与)=40。要检验x与y之间的线性关系是否显著,即检验假设:。 (1)线性关系检验的统计量F值是多少? (2)给定显著性水平,是多少? (3)是拒绝原假设还是不拒绝原假设? (4)假定x与y之间是负相关,计算相关系数r。 (5)检验x与y之间的线性关系是否显著?解:(1)SSR的自由度为k=1;SSE的自由度为n-k-1=18; 因此:F=27(2)=4.41(3)拒绝原假设,线性关系显著。(4)r=0.7746,由于是负相关,因此
7、r=-0.7746(5)从F检验看线性关系显著。3 随机抽取7家超市,得到其广告费支出与销售额数据如下: 超市 广告费支出/万元 销售额/万元 A B C D E F G l 2 4 6 10 14 20 19 32 44 40 52 53 54求:(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。(2)检验广告费支出与销售额之间的线性关系是否显著()。(3)绘制关于x的残差图,你觉得关于误差项的假定被满足了吗? (4)你是选用这个模型,还是另寻找一个更好的模型?解:(1)系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.116
8、0.002广告费支出(万元)1.5470.4630.8313.3390.021a. 因变量: 销售额(万元)(2)回归直线的F检验:ANOVA(b)模型 平方与df均方F显著性1回归691.7231691.72311.147.021(a)残差310.277562.055合计1,002.0006a. 预测变量:(常量), 广告费支出(万元)。b. 因变量: 销售额(万元)显著。回归系数的t检验:系数(a)模型 非标准化系数标准化系数t显著性B标准误Beta1(常量)29.3994.8076.1160.002广告费支出(万元)1.5470.4630.8313.3390.021a. 因变量: 销售额
9、(万元)显著。(3)未标准化残差图:_标准化残差图:学生氏标准化残差图:看到残差不全相等。(4)应考虑其他模型。可考虑对数曲线模型:y=b0+b1ln(x)=22.471+11.576ln(x)。4 根据下面SPSS输出的回归结果,说明模型中涉及多少个自变量?多少个观察值?写出回归方程,并根据F,se,R2及调整的的值对模型进行讨论。模型汇总b模型RR 方调整 R 方标准 估计的误差10.8424070.7096500.630463109.429596Anovab模型平方与df均方FSig.1回归321946.80183107315.60068.9617590.002724残差131723.1
10、9821111974.84总计45367014系数a模型非标准化系数tSig.B标准 误差1(常量)657.0534167.4595393.9236550.002378VAR00002VAR00003VAR000045.710311-0.416917-3.4714811.7918360.3221931.4429353.186849-1.293998-2.4058470.0086550.2221740.034870解:自变量3个,观察值15个。回归方程:=657.0534+5.710311X1-0.416917X2-3.471481X3拟合优度:判定系数R2=0.70965,调整的=0.6304
11、63,说明三个自变量对因变量的影响的比例占到63%。 估计的标准误差=109.429596,说明随即变动程度为109.429596回归方程的检验:F检验的P=0.002724,在显著性为5%的情况下,整个回归方程线性关系显著。回归系数的检验:的t检验的P=0.008655,在显著性为5%的情况下,y与X1线性关系显著。的t检验的P=0.222174,在显著性为5%的情况下,y与X2线性关系不显著。的t检验的P=0.034870,在显著性为5%的情况下,y与X3线性关系显著。因此,可以考虑采用逐步回归去除X2,从新构建线性回归模型。5 下面是随机抽取的15家大型商场销售的同类产品的有关数据(单位
12、:元)。企业编号 销售价格y 购进价格x1 销售费用x2 l 2 3 4 5 6 7 8 9 10 11 12 13 14 15 l238 l266 l200 1193 1106 1303 1313 1144 1286 l084 l120 1156 1083 1263 1246 966 894 440 664 791 852 804 905 77l 511 505 85l 659 490 696 223 257 387 310 339 283 302 214 304 326 339 235 276 390 316求: (1)计算y与x1、y与x2之间的相关系数,是否有证据表明销售价格与购进价格
13、、销售价格与销售费用之间存在线性关系? (2)根据上述结果,你认为用购进价格与销售费用来预测销售价格是否有用? (3)求回归方程,并检验模型的线性关系是否显著()。 (4)解释判定系数R2,所得结论与问题(2)中是否一致?(5)计算x1与x2之间的相关系数,所得结果意味着什么?(6)模型中是否存在多重共线性?你对模型有何建议?解:(1)y与x1的相关系数=0.309,y与x2之间的相关系数=0.0012。对相关性进行检验:相关性 销售价格购进价格销售费用销售价格Pearson 相关性10.3090.001显著性(双侧)0.2630.997N151515购进价格Pearson 相关性0.3091
14、-.853(*)显著性(双侧)0.2630.000N151515销售费用Pearson 相关性0.001-.853(*)1显著性(双侧)0.9970.000N151515*. 在 .01 水平(双侧)上显著相关。可以看到,两个相关系数的P值都比较的,总体上线性关系也不现状,因此没有明显的线性相关关系。(2)意义不大。(3)回归统计Multiple R0.593684R Square0.35246Adjusted R Square0.244537标准误差69.75121观测值15方差分析dfSSMSFSignificance F回归分析231778.153915889.083.2658420.0
15、73722残差1258382.77944865.232总计1490160.9333Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%(常量)375.6018339.4105621.106630.290145-363.911115.114-363.911115.114购进价格x10.5378410.210446742.5557110.02520.0793170.9963650.0793170.996365销售费用x21.4571940.667706592.1823860.0496810.0023862.9120010.0
16、023862.912001从检验结果看,整个方程在5%下,不显著;而回归系数在5%下,均显著,说明回归方程没有多大意义,并且自变量间存在线性相关关系。(4)从R2看,调整后的R2=24.4%,说明自变量对因变量影响不大,反映情况基本一致。(5)方程不显著,而回归系数显著,说明可能存在多重共线性。(6)存在多重共线性,模型不适宜采用线性模型。 6 一家电器销售公司的管理人员认为,每月的销售额是广告费用的函数,并想通过广告费用对月销售额作出估计。下面是近8个月的销售额与广告费用数据: 月销售收入y/万元 电视广告费用x1 /万元 报纸广告费用x2/万元 96 90 95 92 95 94 94 9
17、4 5.0 2.0 4.0 2.5 3.0 3.5 2.5 3.0 1.5 2.0 1.52.5 3.3 2.3 4.2 2.5求: (1)用电视广告费用作自变量,月销售额作因变量,建立估计的回归方程。 (2)用电视广告费用与报纸广告费用作自变量,月销售额作因变量,建立估计的回归方程。 (3)上述(1)与(2)所建立的估计方程,电视广告费用的系数是否相同?对其回归系数分别进行解释。 (4)根据问题(2)所建立的估计方程,在销售收入的总变差中,被估计的回归方程所解释的比例是多少?(5)根据问题(2)所建立的估计方程,检验回归系数是否显著()。解:(1)回归方程为:(2)回归方程为:(3)不相同,
18、(1)中表明电视广告费用增加1万元,月销售额增加1.6万元;(2)中表明,在报纸广告费用不变的情况下,电视广告费用增加1万元,月销售额增加2.29万元。(4)判定系数R2= 0.919,调整的= 0.8866,比例为88.66%。(5)回归系数的显著性检验:Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept83.230091.57386952.882484.57E-0879.1843387.2758579.1843387.27585电视广告费用工:x1 (万元)2.2901840.3040657.53
19、18990.0006531.5085613.0718061.5085613.071806报纸广告费用x2(万元)1.3009890.3207024.0566970.0097610.4765992.1253790.4765992.125379假设:H0:=0 H1:0t=7.53=2.57,认为y与x1线性关系显著。(3)回归系数的显著性检验:假设:H0:=0 H1:0t=4.05=2.57,认为y与x2线性关系显著。7 某农场通过试验取得早稻收获量与春季降雨量与春季温度的数据如下: 收获量y(kghm2) 降雨量x1(mm) 温度x2() 2250 3450 4500 6750 7200 7500 8250 25 33 45 105 110 115 120 6 8 10 13 14 16 17求: (1)试确定早稻收获量对春季降雨量与春季温度的二元线性回归方程。(2)解释回归系数的实际意义。(3)根据你的判断,模型中是否存在多重共线性?解:(1)回归方程为:(2)在温度不变的情况下,降雨量每增加1mm,收获量增加22.386kghm2,在降雨量不变的情况下,降雨量每增加1度,收获量增加327.672kghm2。(3)与的相关系数=0.965,存在多重共线性。Welcome ToDownload !欢迎您的下载,资料仅供参考!精品资料