收藏 分销(赏)

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章).doc

上传人:精**** 文档编号:1650492 上传时间:2024-05-07 格式:DOC 页数:16 大小:788KB 下载积分:8 金币
下载 相关 举报
《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章).doc_第1页
第1页 / 共16页
《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章).doc_第2页
第2页 / 共16页


点击查看更多>>
资源描述
《统计分析与SPSS得应用(第五版)》(薛薇) 课后练习答案 第9章SPSS得线性回归分析 1、利用第2章第9题得数据,任意选择两门课程成绩作为解释变量与被解释变量,利用SPSS提供得绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩得散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二与第三条分别针对男生样本与女生样本,并对各回归直线得拟与效果进行评价。 选择fore与phy两门成绩体系散点图 步骤:图形à旧对话框à散点图à简单散点图à定义à将fore导入Y轴,将phy导入X轴,将sex导入设置标记à确定。 接下来在SPSS输出查瞧器中,双击上图,打开图表编辑 在图表编辑器中,选择“元素”菜单à选择总计拟合线à选择线性à应用à再选择元素菜单à点击子组拟合线à选择线性à应用。 分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定得线性关系。但回归直线得拟合效果都不就是很好。 2、请说明线性回归分析与相关分析得关系就是怎样得? 相关分析就是回归分析得基础与前提,回归分析则就是相关分析得深入与继续。相关分析需要依靠回归分析来表现变量之间数量相关得具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化得相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关得具体形式才有意义。如果在没有对变量之间就是否相关以及相关方向与程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关得方向与程度,不能推断变量之间相互关系得具体形式,也无法从一个变量得变化来推测另一个变量得变化情况,因此,在具体应用过程中,只有把相关分析与回归分析结合起来,才能达到研究与分析得目得。 线性回归分析就是相关性回归分析得一种,研究得就是一个变量得增加或减少会不会引起另一个变量得增加或减少。 3、 请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验? 检验其可信程度并找出哪些变量得影响显著、哪些不显著。 主要包括回归方程得拟合优度检验、显著性检验、回归系数得显著性检验、残差分析等。 线性回归方程能够较好地反映被解释变量与解释变量之间得统计关系得前提就是被解释变量与解释变量之间确实存在显著得线性关系。 回归方程得显著性检验正就是要检验被解释变量与解释变量之间得线性关系就是否显著,用线性模型来描述她们之间得关系就是否恰当。一般包括回归系数得检验,残差分析等。 4、 请说明SPSS多元线性回归分析中提供了哪几种解释变量筛选策略? 向前、向后、逐步。 5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量得主要因素。数据文件名为“粮食总产量、sav”。 方法:采用“前进“回归策略。 步骤:分析à回归à线性à将粮食总产量导入因变量、其余变量导入自变量à方法项选“前进”à确定。 如下图:(也可向后、或逐步) 已输入/除去变量a 模型 已输入变量 已除去变量 方法 1 施用化肥量(kg/公顷) 、 向前(准则:Ftoenter 得概率 <= 、050) 2 风灾面积比例(%) 、 向前(准则:Ftoenter 得概率 <= 、050) 3 年份 、 向前(准则:Ftoenter 得概率 <= 、050) 4 总播种面积(万公顷) 、 向前(准则:Ftoenter 得概率 <= 、050) a、 因变量:粮食总产量(y万吨) 模型摘要 模型 R R 平方 调整后得 R 平方 标准估算得错误 1 、960a 、922 、919 2203、30154 2 、975b 、950 、947 1785、90195 3 、984c 、969 、966 1428、73617 4 、994d 、989 、987 885、05221 a、 预测变量:(常量),施用化肥量(kg/公顷) b、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%) c、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份 d、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷) ANOVAa 模型 平方与 自由度 均方 F 显著性 1 回归 1887863315、616 1 1887863315、616 388、886 、000b 残差 160199743、070 33 4854537、669 总计 2048063058、686 34 2 回归 1946000793、422 2 973000396、711 305、069 、000c 残差 102062265、263 32 3189445、789 总计 2048063058、686 34 3 回归 1984783160、329 3 661594386、776 324、106 、000d 残差 63279898、356 31 2041287、044 总计 2048063058、686 34 4 回归 2024563536、011 4 506140884、003 646、150 、000e 残差 23499522、675 30 783317、423 总计 2048063058、686 34 a、 因变量:粮食总产量(y万吨) b、 预测变量:(常量),施用化肥量(kg/公顷) c、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%) d、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份 e、 预测变量:(常量),施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷) 系数a 模型 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 1 (常量) 17930、148 504、308 35、554 、000 施用化肥量(kg/公顷) 179、287 9、092 、960 19、720 、000 2 (常量) 20462、336 720、317 28、407 、000 施用化肥量(kg/公顷) 193、701 8、106 1、037 23、897 、000 风灾面积比例(%) 327、222 76、643 、185 4、269 、000 3 (常量) 460006、046 110231、478 4、173 、000 施用化肥量(kg/公顷) 137、667 14、399 、737 9、561 、000 风灾面积比例(%) 293、439 61、803 、166 4、748 、000 年份 244、920 56、190 、323 4、359 、000 4 (常量) 512023、307 68673、579 7、456 、000 施用化肥量(kg/公顷) 139、944 8、925 、749 15、680 、000 风灾面积比例(%) 302、324 38、305 、171 7、893 、000 年份 253、115 34、827 、334 7、268 、000 总播种面积(万公顷) 2、451 、344 、141 7、126 、000 a、 因变量:粮食总产量(y万吨) 结论:如上4个表所示,影响程度中大到小依次就是:施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷)。(排除农业劳动者人数(百万人)与粮食播种面积(万公顷)对粮食总产量得影响) 剔除农业劳动者人数(百万人)与粮食播种面积(万公顷)后: 步骤:分析à回归à线性à将粮食总产量导入因变量、其余4个变量(施用化肥量(kg/公顷), 风灾面积比例(%), 年份, 总播种面积(万公顷))导入自变量à方法项选“输入”à确定。 如下图: 系数a 模型 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 1 (常量) 512023、307 68673、579 7、456 、000 年份 253、115 34、827 、334 7、268 、000 总播种面积(万公顷) 2、451 、344 、141 7、126 、000 施用化肥量(kg/公顷) 139、944 8、925 、749 15、680 、000 风灾面积比例(%) 302、324 38、305 、171 7、893 、000 a、 因变量:粮食总产量(y万吨) 粮食总产量回归方程:Y=7、893X1+15、68X2+7、126X3+7、268X47、456 6、一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司得销售价格(x1)、各地区得年人均收入(x2)、广告费用(x3)之间得关系,搜集到30个地区得有关数据。进行多元线性回归分析所得得部分分析结果如下: Model  Sum of Squares Df Mean Square F Sig、 Regression     4008924、7   8、88341E13 Residual           Total 13458586、7 29           Unstandardized Codfficients t Sig、 B Std、Error (Constant) 7589、1025 2445、0213 3、1039 0、00457 X1 117、8861 31、8974 3、6958 0、00103 X2 80、6107 14、7676 5、4586 0、00001 X3 0、5012 0、1259 3、9814 0、00049 1) 将第一张表中得所缺数值补齐。 2) 写出销售量与销售价格、年人均收入、广告费用得多元线性回归方程,并解释各回归系数得意义。 3) 检验回归方程得线性关系就是否显著? 4) 检验各回归系数就是否显著? 5) 计算判定系数,并解释它得实际意义。 6) 计算回归方程得估计标准误差,并解释它得实际意义。 (1) 模型 平方与 自由度 均方 F 显著性 1 回归 12026774、1 3 4008924、7 72、8 8、88341E13b 残差 1431812、6 26 55069、7154 总计 13458586、7 29 (2)Y=7589、1117、886 X1+80、6X2+0、5X3 (3)回归方程显著性检验:整体线性关系显著 (4)回归系数显著性检验:各个回归系数检验均显著 (5)略 (6)略 7、对参加 SAT 考试得同学成绩进行随机调查,获得她们阅读考试与数学考试得成绩以及性别数据。通常阅读能力与数学能力具有一定得线性相关性,请在排除性别差异得条件下,分析阅读成绩对数学成绩得线性影响就是否显著。 方法:采用进入回归策略。 步骤:分析à回归à线性à将MathSAT导入因变量、其余变量导入自变量à确定。 结果如下: 已输入/除去变量a 模型 已输入变量 已除去变量 方法 1 Gender, Verbal SATb 、 输入 a、 因变量:Math SAT b、 已输入所有请求得变量。 模型摘要 模型 R R 平方 调整后得 R 平方 标准估算得错误 1 、710a 、505 、499 69、495 a、 预测变量:(常量),Gender, Verbal SAT ANOVAa 模型 平方与 自由度 均方 F 显著性 1 回归 782588、468 2 391294、234 81、021 、000b 残差 767897、951 159 4829、547 总计 1550486、420 161 a、 因变量:Math SAT b、 预测变量:(常量),Gender, Verbal SAT 系数a 模型 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 1 (常量) 184、582 34、068 5、418 、000 Verbal SAT 、686 、055 、696 12、446 、000 Gender 37、219 10、940 、190 3、402 、001 a、 因变量:Math SAT 因概率P值小于显著性水平(0、05),所以表明在控制了性别之后,阅读成绩对数学成绩有显著得线性影响。 8、试根据“粮食总产量、sav”数据,利用SPSS曲线估计方法选择恰当模型,对样本期外得粮食总产量进行外推预测,并对平均预测误差进行估计。 采用二次曲线 步骤:图形à旧对话框à拆线图à简单à个案值à定义à将粮食总产量导入线得表征à确定 结果如下: 再双击上图à“元素”菜单à添加标记à应用 接下来:分析à回归à曲线估计à粮食总产量导入因变量、年份导入变量,点击年份à在模型中选择二次项、立方、幂à点击“保存”按钮à选择保存”预测值”à继续à确定。 曲线拟合 附注 已创建输出 03MAY2018 09:28:44 注释 输入 数据 F:\SPSS\薛薇《统计分析与spss得应用(第五版)》\PPTjwd\第9章 SPSS回归分析\习题\粮食总产量、sav 活动数据集 数据集1 过滤器 <无> 宽度(W) <无> 拆分文件 <无> 工作数据文件中得行数 35 缺失值处理 对缺失得定义 用户定义得缺失值被视作缺失。 已使用得个案 任何变量中带有缺失值得个案不用于分析。 语法 CURVEFIT /VARIABLES=lscl WITH nf /CONSTANT /MODEL=LINEAR QUADRATIC CUBIC POWER /PRINT ANOVA /PLOT FIT /SAVE=PRED 、 资源 处理器时间 00:00:00、19 用时 00:00:00、25 使用 从 第一个观测值 到 最后一个观测值 预测 从 使用周期后得第一观察 到 最后一个观测值 变量已创建或已修改 FIT_1 CURVEFIT 与 MOD_1 LINEAR 中具有 nf 得 lscl 得拟合 FIT_2 CURVEFIT 与 MOD_1 QUADRATIC 中具有 nf 得 lscl 得拟合 FIT_3 CURVEFIT 与 MOD_1 CUBIC 中具有 nf 得 lscl 得拟合 FIT_4 CURVEFIT 与 MOD_1 POWER 中具有 nf 得 lscl 得拟合 时间序列设置 (TSET) 输出量 PRINT = DEFAULT 保存新变量 NEWVAR = CURRENT 自相关或偏自相关图中得最大滞后数 MXAUTO = 16 每个交叉相关图得最大延迟数 MXCROSS = 7 每个过程生成得最大新变量数 MXNEWVAR = 4 每个过程得最大新个案数 MXPREDICT = 1000 用户缺失值处理 MISSING = EXCLUDE 置信区间百分比值 CIN = 95 在回归方程中输入变量得容差 TOLER = 、0001 最大迭代参数变化 CNVERGE = 、001 计算标准得方法自相关得错误 ACFSE = IND 季节周期长度 未指定 值在绘图中标记观测值得变量 未指定 包括方程 CONSTANT 警告 由于模型项之间存在接近共线性,该二次模型无法拟合。 由于模型项之间存在接近共线性,该立方模型无法拟合。 模型描述 模型名称 MOD_1 因变量 1 粮食总产量(y万吨) 方程式 1 线性(L) 2 二次项(Q) 3 立方(U) 4 幂a 自变量 年份 常量 已包括 值在绘图中标记观测值得变量 未指定 对在方程式中输入项得容许 、0001 a、 此模型需要所有非缺失值为正。 个案处理摘要 数字 个案总计 35 排除得个案a 0 预测得个案 0 新创建得个案 0 a、 任何变量中带有缺失值得个案无需分析。 变量处理摘要 变量 从属 自变量 粮食总产量(y万吨) 年份 正值得数目 35 35 零得数目 0 0 负值得数目 0 0 缺失值得数目 用户缺失 0 0 系统缺失 0 0 粮食总产量(y万吨) 线性(L) 模型摘要 R R 平方 调整后得 R 平方 标准估算得错误 、935 、874 、870 2795、862 自变量为 年份。 ANOVA 平方与 自由度 均方 F 显著性 回归(R) 1790107249、412 1 1790107249、412 229、006 、000 残差 257955809、274 33 7816842、705 总计 2048063058、686 34 自变量为 年份。 系数 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 年份 708、118 46、793 、935 15、133 、000 (常量) 1369647、904 92136、775 14、865 、000 二次项(Q) 模型摘要 R R 平方 调整后得 R 平方 标准估算得错误 、936 、875 、872 2782、149 自变量为 年份。 ANOVA 平方与 自由度 均方 F 显著性 回归(R) 1792631355、014 1 1792631355、014 231、596 、000 残差 255431703、672 33 7740354、657 总计 2048063058、686 34 自变量为 年份。 系数 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 年份 ** 2 、180 、012 、936 15、218 、000 (常量) 673013、926 45845、338 14、680 、000 已排除得项 输入贝塔 t 显著性 偏相关 最小容差 年份a 125、061 7、851 、000 、811 、000 a、 已达到输入变量得容许界限。 立方(U) 模型摘要 R R 平方 调整后得 R 平方 标准估算得错误 、936 、877 、873 2768、471 自变量为 年份。 ANOVA 平方与 自由度 均方 F 显著性 回归(R) 1795136897、274 1 1795136897、274 234、217 、000 残差 252926161、411 33 7664429、134 总计 2048063058、686 34 自变量为 年份。 系数 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 年份 ** 3 6、097E5 、000 、936 15、304 、000 (常量) 440802、441 30416、171 14、492 、000 已排除得项 输入贝塔 t 显著性 偏相关 最小容差 年份a 62、046 7、785 、000 、809 、000 年份 ** 2 124、059 7、779 、000 、809 、000 a、 已达到输入变量得容许界限。 幂 模型摘要 R R 平方 调整后得 R 平方 标准估算得错误 、938 、880 、877 、108 自变量为 年份。 ANOVA 平方与 自由度 均方 F 显著性 回归(R) 2、825 1 2、825 242、844 、000 残差 、384 33 、012 总计 3、209 34 自变量为 年份。 系数 非标准化系数 标准系数 t 显著性 B 标准错误 贝塔 ln(年份) 55、391 3、554 、938 15、583 、000 (常量) 7、936E179 、000 、 、 因变量为 ln(粮食总产量(y万吨))。 分析:如上表所示,粮食总产量总体呈现上升趋势,在对回归进行检验时,sig值为0<0、05,故拒绝原假设,即认为回归方程中解释变量与被解释变量间显著。 预测值:
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服