1、统计分析与SPSS得应用(第五版)(薛薇)课后练习答案第9章SPSS得线性回归分析1、利用第2章第9题得数据,任意选择两门课程成绩作为解释变量与被解释变量,利用SPSS提供得绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩得散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二与第三条分别针对男生样本与女生样本,并对各回归直线得拟与效果进行评价。选择fore与phy两门成绩体系散点图步骤:图形旧对话框散点图简单散点图定义将fore导入Y轴,将phy导入X轴,将sex导入设置标记确定。接下来在SPSS输出查瞧器中,双击上图,打开图表编辑在图表编辑器中,选择“
2、元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线性应用。分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定得线性关系。但回归直线得拟合效果都不就是很好。2、请说明线性回归分析与相关分析得关系就是怎样得?相关分析就是回归分析得基础与前提,回归分析则就是相关分析得深入与继续。相关分析需要依靠回归分析来表现变量之间数量相关得具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化得相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关得具体形式才有意义。如果在没有对变量之间就是否相关以及相关方向与程度做出正确判断之前,就进行回归分析,很
3、容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关得方向与程度,不能推断变量之间相互关系得具体形式,也无法从一个变量得变化来推测另一个变量得变化情况,因此,在具体应用过程中,只有把相关分析与回归分析结合起来,才能达到研究与分析得目得。线性回归分析就是相关性回归分析得一种,研究得就是一个变量得增加或减少会不会引起另一个变量得增加或减少。3、 请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量得影响显著、哪些不显著。主要包括回归方程得拟合优度检验、显著性检验、回归系数得显著性检验、残差分析等。线性回归方程能够较好地反映被解释变量与解释变量之
4、间得统计关系得前提就是被解释变量与解释变量之间确实存在显著得线性关系。 回归方程得显著性检验正就是要检验被解释变量与解释变量之间得线性关系就是否显著,用线性模型来描述她们之间得关系就是否恰当。一般包括回归系数得检验,残差分析等。4、 请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略?向前、向后、逐步。5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量得主要因素。数据文件名为“粮食总产量、sav”。方法:采用“前进“回归策略。步骤:分析回归线性将粮食总产量导入因变量、其余变量导入自变量方法项选“前进”确定。 如下图
5、:(也可向后、或逐步)已输入/除去变量a模型已输入变量已除去变量方法1施用化肥量(kg/公顷)、向前(准则:Ftoenter 得概率 = 、050)2风灾面积比例(%)、向前(准则:Ftoenter 得概率 = 、050)3年份、向前(准则:Ftoenter 得概率 = 、050)4总播种面积(万公顷)、向前(准则:Ftoenter 得概率 = 、050)a、 因变量:粮食总产量(y万吨)模型摘要模型RR 平方调整后得 R 平方标准估算得错误1、960a、922、9192203、301542、975b、950、9471785、901953、984c、969、9661428、736174、994
6、d、989、987885、05221a、 预测变量:(常量),施用化肥量(kg/公顷)b、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%)c、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份d、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)ANOVAa模型平方与自由度均方F显著性1回归1887863315、61611887863315、616388、886、000b残差160199743、070334854537、669总计2048063058、686342回归1946000793、42229
7、73000396、711305、069、000c残差102062265、263323189445、789总计2048063058、686343回归1984783160、3293661594386、776324、106、000d残差63279898、356312041287、044总计2048063058、686344回归2024563536、0114506140884、003646、150、000e残差23499522、67530783317、423总计2048063058、68634a、 因变量:粮食总产量(y万吨)b、 预测变量:(常量),施用化肥量(kg/公顷)c、 预测变量:(常量),
8、施用化肥量(kg/公顷), 风灾面积比例(%)d、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份e、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)系数a模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)17930、148504、30835、554、000施用化肥量(kg/公顷)179、2879、092、96019、720、0002(常量)20462、336720、31728、407、000施用化肥量(kg/公顷)193、7018、1061、03723、897、000风灾面积比例(%)327、22276、6
9、43、1854、269、0003(常量)460006、046110231、4784、173、000施用化肥量(kg/公顷)137、66714、399、7379、561、000风灾面积比例(%)293、43961、803、1664、748、000年份244、92056、190、3234、359、0004(常量)512023、30768673、5797、456、000施用化肥量(kg/公顷)139、9448、925、74915、680、000风灾面积比例(%)302、32438、305、1717、893、000年份253、11534、827、3347、268、000总播种面积(万公顷)2、451、
10、344、1417、126、000a、 因变量:粮食总产量(y万吨)结论:如上4个表所示,影响程度中大到小依次就是:施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)。(排除农业劳动者人数(百万人)与粮食播种面积(万公顷)对粮食总产量得影响) 剔除农业劳动者人数(百万人)与粮食播种面积(万公顷)后:步骤:分析回归线性将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)导入自变量方法项选“输入”确定。 如下图:系数a模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)512023、30768673、57
11、97、456、000年份253、11534、827、3347、268、000总播种面积(万公顷)2、451、344、1417、126、000施用化肥量(kg/公顷)139、9448、925、74915、680、000风灾面积比例(%)302、32438、305、1717、893、000a、 因变量:粮食总产量(y万吨)粮食总产量回归方程:Y=7、893X1+15、68X2+7、126X3+7、268X47、4566、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司得销售价格(x1)、各地区得年人均收入(x2)、广告费用(x3)之间得关系,搜集到30个地区得有关数据。进
12、行多元线性回归分析所得得部分分析结果如下:ModelSum of SquaresDfMean SquareFSig、Regression4008924、78、88341E13ResidualTotal13458586、729Unstandardized CodfficientstSig、BStd、Error(Constant)7589、10252445、02133、10390、00457X1117、886131、89743、69580、00103X280、610714、76765、45860、00001X30、50120、12593、98140、000491) 将第一张表中得所缺数值补齐。2)
13、 写出销售量与销售价格、年人均收入、广告费用得多元线性回归方程,并解释各回归系数得意义。3) 检验回归方程得线性关系就是否显著?4) 检验各回归系数就是否显著?5) 计算判定系数,并解释它得实际意义。6) 计算回归方程得估计标准误差,并解释它得实际意义。(1)模型平方与自由度均方F显著性1回归12026774、134008924、772、88、88341E13b残差1431812、62655069、7154总计13458586、729(2)Y=7589、1117、886 X1+80、6X2+0、5X3(3)回归方程显著性检验:整体线性关系显著(4)回归系数显著性检验:各个回归系数检验均显著(5
14、)略(6)略7、对参加 SAT 考试得同学成绩进行随机调查,获得她们阅读考试与数学考试得成绩以及性别数据。通常阅读能力与数学能力具有一定得线性相关性,请在排除性别差异得条件下,分析阅读成绩对数学成绩得线性影响就是否显著。方法:采用进入回归策略。步骤:分析回归线性将MathSAT导入因变量、其余变量导入自变量确定。结果如下: 已输入/除去变量a模型已输入变量已除去变量方法1Gender, Verbal SATb、输入a、 因变量:Math SATb、 已输入所有请求得变量。模型摘要模型RR 平方调整后得 R 平方标准估算得错误1、710a、505、49969、495a、 预测变量:(常量),Ge
15、nder, Verbal SATANOVAa模型平方与自由度均方F显著性1回归782588、4682391294、23481、021、000b残差767897、9511594829、547总计1550486、420161a、 因变量:Math SATb、 预测变量:(常量),Gender, Verbal SAT系数a模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)184、58234、0685、418、000Verbal SAT、686、055、69612、446、000Gender37、21910、940、1903、402、001a、 因变量:Math SAT因概率P值小于显著性水平(
16、0、05),所以表明在控制了性别之后,阅读成绩对数学成绩有显著得线性影响。8、试根据“粮食总产量、sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外得粮食总产量进行外推预测,并对平均预测误差进行估计。采用二次曲线步骤:图形旧对话框拆线图简单个案值定义将粮食总产量导入线得表征确定结果如下:再双击上图“元素”菜单添加标记应用接下来:分析回归曲线估计粮食总产量导入因变量、年份导入变量,点击年份在模型中选择二次项、立方、幂点击“保存”按钮选择保存”预测值”继续确定。曲线拟合附注已创建输出03MAY2018 09:28:44注释输入数据F:SPSS薛薇统计分析与spss得应用(第五版)PPT
17、jwd第9章 SPSS回归分析习题粮食总产量、sav活动数据集数据集1过滤器宽度(W)拆分文件工作数据文件中得行数35缺失值处理对缺失得定义用户定义得缺失值被视作缺失。已使用得个案任何变量中带有缺失值得个案不用于分析。语法CURVEFIT /VARIABLES=lscl WITH nf /CONSTANT /MODEL=LINEAR QUADRATIC CUBIC POWER /PRINT ANOVA /PLOT FIT /SAVE=PRED 、资源处理器时间00:00:00、19用时00:00:00、25使用从第一个观测值到最后一个观测值预测从使用周期后得第一观察到最后一个观测值变量已创建或
18、已修改FIT_1CURVEFIT 与 MOD_1 LINEAR 中具有 nf 得 lscl 得拟合FIT_2CURVEFIT 与 MOD_1 QUADRATIC 中具有 nf 得 lscl 得拟合FIT_3CURVEFIT 与 MOD_1 CUBIC 中具有 nf 得 lscl 得拟合FIT_4CURVEFIT 与 MOD_1 POWER 中具有 nf 得 lscl 得拟合时间序列设置 (TSET)输出量PRINT = DEFAULT保存新变量NEWVAR = CURRENT自相关或偏自相关图中得最大滞后数MXAUTO = 16每个交叉相关图得最大延迟数MXCROSS = 7每个过程生成得最大
19、新变量数MXNEWVAR = 4每个过程得最大新个案数MXPREDICT = 1000用户缺失值处理MISSING = EXCLUDE置信区间百分比值CIN = 95在回归方程中输入变量得容差TOLER = 、0001最大迭代参数变化CNVERGE = 、001计算标准得方法自相关得错误ACFSE = IND季节周期长度未指定值在绘图中标记观测值得变量未指定包括方程CONSTANT警告由于模型项之间存在接近共线性,该二次模型无法拟合。由于模型项之间存在接近共线性,该立方模型无法拟合。模型描述模型名称MOD_1因变量1粮食总产量(y万吨)方程式1线性(L)2二次项(Q)3立方(U)4幂a自变量年
20、份常量已包括值在绘图中标记观测值得变量未指定对在方程式中输入项得容许、0001a、 此模型需要所有非缺失值为正。个案处理摘要数字个案总计35排除得个案a0预测得个案0新创建得个案0a、 任何变量中带有缺失值得个案无需分析。变量处理摘要变量从属自变量粮食总产量(y万吨)年份正值得数目3535零得数目00负值得数目00缺失值得数目用户缺失00系统缺失00粮食总产量(y万吨)线性(L)模型摘要RR 平方调整后得 R 平方标准估算得错误、935、874、8702795、862自变量为 年份。ANOVA平方与自由度均方F显著性回归(R)1790107249、41211790107249、412229、0
21、06、000残差257955809、274337816842、705总计2048063058、68634自变量为 年份。系数非标准化系数标准系数t显著性B标准错误贝塔年份708、11846、793、93515、133、000(常量)1369647、90492136、77514、865、000二次项(Q)模型摘要RR 平方调整后得 R 平方标准估算得错误、936、875、8722782、149自变量为 年份。ANOVA平方与自由度均方F显著性回归(R)1792631355、01411792631355、014231、596、000残差255431703、672337740354、657总计204
22、8063058、68634自变量为 年份。系数非标准化系数标准系数t显著性B标准错误贝塔年份 * 2、180、012、93615、218、000(常量)673013、92645845、33814、680、000已排除得项输入贝塔t显著性偏相关最小容差年份a125、0617、851、000、811、000a、 已达到输入变量得容许界限。立方(U)模型摘要RR 平方调整后得 R 平方标准估算得错误、936、877、8732768、471自变量为 年份。ANOVA平方与自由度均方F显著性回归(R)1795136897、27411795136897、274234、217、000残差252926161、
23、411337664429、134总计2048063058、68634自变量为 年份。系数非标准化系数标准系数t显著性B标准错误贝塔年份 * 36、097E5、000、93615、304、000(常量)440802、44130416、17114、492、000已排除得项输入贝塔t显著性偏相关最小容差年份a62、0467、785、000、809、000年份 * 2124、0597、779、000、809、000a、 已达到输入变量得容许界限。幂模型摘要RR 平方调整后得 R 平方标准估算得错误、938、880、877、108自变量为 年份。ANOVA平方与自由度均方F显著性回归(R)2、82512、825242、844、000残差、38433、012总计3、20934自变量为 年份。系数非标准化系数标准系数t显著性B标准错误贝塔ln(年份)55、3913、554、93815、583、000(常量)7、936E179、000、因变量为 ln(粮食总产量(y万吨)。分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为00、05,故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。预测值:
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100