收藏 分销(赏)

统计学一元线性回归课后习题答案市公开课获奖课件省名师优质课赛课一等奖课件.ppt

上传人:精**** 文档编号:10319711 上传时间:2025-05-22 格式:PPT 页数:53 大小:667.04KB
下载 相关 举报
统计学一元线性回归课后习题答案市公开课获奖课件省名师优质课赛课一等奖课件.ppt_第1页
第1页 / 共53页
统计学一元线性回归课后习题答案市公开课获奖课件省名师优质课赛课一等奖课件.ppt_第2页
第2页 / 共53页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。本资料仅供参考,不能作为科学依据。谢谢。本资料仅供参考,不能作为科学依据。,一元线性回归课后习题讲解,-第九组,1/53,11.1,从某一行业中随机抽取12家企业,所得产量与生产费用数据以下:,企业编号,产量(台),生产费用,1,40,130,2,42,150,3,50,155,4,55,140,5,65,150,6,78,154,7,84,165,8,100,170,9,116,167,10,125,180,11,130,175,12,140,185,2/53,产量和费用存在正线性相关系数,(1)绘制产量与生产费用散点图,判断二者之间关系形态。,3/53,r=0.9202,2)计算产量与生产费用之间线性相关系数。,4/53,1、提出假设:,H,0:,;,H,1:,0,2、计算检验统计量,依据显著性水平,0.05,查,t,分布表得,t,(,n,-2)=2.2281因为,t,=7.435453,t,(12-2)=2.2281,拒绝,H,0,产量与生产费用之间存在着显著正线性相关关系,(3)对相关系数显著性进行检验(,0.05,),并说明二者之间关系强度。,t,(12-2)=2.2281,5/53,11.2,学生在期末考试之前用于复习时间(单位:小时)和考试分数(单位:分)之间是否相关系?为研究这一问题,一位研究者抽取了由8名学生组成一个随机样本,取得数据以下:,复习时间X,20,16,34,23,27,32,18,22,考试分数Y,64,61,84,70,88,92,72,77,6/53,复习时间和考试分数存在正线性相关关系,复习时间和考试分数存在正线性相关关系,复习时间和考试分数存在正线性相关关系,要求:(1)绘制复习时间和考试分数散点图,判断二者之间关系形态。,7/53,r=0.8621,(2)计算相关系数,说明两个变量之间关系强度。,8/53,11.3,、依据一组数据建立线性回归方程,要求:,1,)解释截距 意义。,1)解释斜率 意义。,2)当=6时E(y),1)表示在没有自变量X影响时其它各种原因对因变量Y影响为10,2)斜率意义在于:自变量X改变对Y影响程度。回归方程中,当x增加一个单位时,y将降低0.5个单位。,3)x=6时,代入方程,则,y=10-0.5 6=7,9/53,11.4,设SSR=36,SSE=4,n=18,要求:1)计算判定系数R2并解释其意义,回归直线对观察值拟合程度为0.9,说明变量Y变异性中有90%是由自变量x引发。,2)计算预计标准误差 并解释其意义,表示实际值与预计值之间差异程度是0.5,10/53,11.5,一家物流企业管理人员想研究货物运输距离和运输时间关系,为此,他抽出了企业最近10个卡车运货统计随机样本,得到运输距离(单位:km)和运输时间(单位:天)数据以下表:,运输距离x,825,215,1070,550,480,920,1350,325,670,1215,运输时间y,3.5,1.0,4.0,2.0,1.0,3.0,4.5,1.5,3.0,5.0,(1)绘制运输距离和运输时间散点图,判断二者之间关系形态,(2)计算线性相关系数,说明两个变量之间关系强度。,(3)利用最小二乘法求出预计回归方程,并解释回归系数实际意义。,11/53,依据图表显示,二者可能存在正线性相关关系,(1)绘制运输距离和运输时间散点图,判断二者之间关系形态,12/53,x与y简单相关系数是0.9489,两变量之间展现高度正相关关系,运输距离x,运输时间y,运输距离x,1,运输时间y,0.94894,1,(2)计算线性相关系数,说明两个变量之间关系强度,13/53,最小二乘预计:,y,=,0,+,1,x,将表中数据代入公式得:,=0.118129,=0.003585,y=0.118129+0.003585x,(3)利用最小二乘法求出预计回归方程,并解释回归系数实际意义。,y关于x回归方程为y=0.118129+0.003585x表示运输距离每增加1公里,运输时间平均增加 0.003585天。,14/53,11.6 下面是7个地域人均国内生产总值(GDP)和人均消费水平统计数据:,地域,人均GDP(元),人均消费水平(元),北京,辽宁,上海,江西,河南,贵州,陕西,22 460,11 226,34 547,4 851,5 444,2 662,4 549,7 326,4 490,11 546,2 396,2 208,1 608,2 035,15/53,要求:,(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间关系形态。,产量和生产费用之间存在着正线性相关关系,16/53,(2)计算两个变量之间线性相关系数,说明两个变量之间关系强度。,说明两个变量之间高度相关,17/53,(3)利用最小二乘法求出预计回归方程,并解释回归系数实际意义。,y=,734.6928,+,0.308683,x,回归系数含义:人均GDP每增加1元,人均消费增加0.309元。,18/53,(4)计算判定系数,并解释其意义。,人均GDP对人均消费影响到达99.6%。,19/53,(5)检验回归方程线性关系显著性(a=0.05)。,提出假设,H,0:,1=0 人均消费水平与人均GDP之间线性关系不显著,计算检验统计量,F,确定显著性水平,=0.05,并依据分子自由度1和分母自由度7-2找出临界值,F,=6.61,作出决议:若,F,F,拒绝,H,0,线性关系显著,20/53,(6)假如某地域人均GDP为5 000元,预测其人均消费水平。,某地域人均GDP为5 000元,预测其人均消费水平为2278.1078元。,21/53,(7)求人均GDP为5 000元时,人均消费水平95置信区间和预测区间。,解,:,已知,n,=7,,t,(7-2)=2.5706,置信区间为,人均GDP为5 000元时,人均消费水平95,置信区间为1990.74915,2565.46399,1990.74915,t,=2.201,拒绝,H,0,回归系数显著,提出假设,H,0:,b,1=0,H,1:,b,1,0,计算检验统计量,3)检验回归系数显著性(a=0.05),=2.201,27/53,解:,已知,n,=10,,t,(10-2)=2.306,置信区间为,计算得,4)假如航班正点率为80%,预计用户投诉次数,5)求航班正点率为80%,用户投诉次数95%置信区间和预测区间,28/53,已知,n,=10,,t,(10-2)=2.306,预测区间为,计算得,29/53,11.8,下面是20个城市写字楼出租率和每平方米月租金数据。设月租金为自变量,出租率为因变量,用excel进行回归,并对结果进行解释和分析。,地域编号,出租率(%),每平方米月租金(元),1,70.6,99,2,69.8,74,3,73.4,83,4,67.1,70,5,70.1,84,6,68.7,65,7,63.4,67,8,73.5,105,9,71.4,95,10,80.7,107,11,71.2,86,12,62,86,13,78.7,106,14,69.5,70,15,68.7,81,16,69.5,75,17,67.7,82,18,68.4,94,19,72,92,20,67.9,76,30/53,回归统计,Multiple R,0.79508,R Square,0.632151,Adjusted R Square,0.611715,标准误差,8.568399,观察值,20,方差析,df,SS,MS,F,Significance F,回归分析,1,2271.036,2271.036,30.93318,2.8E-05,残差,18,1321.514,73.41746,总计,19,3592.55,31/53,Coefficients,标准误差,t Stat,P-value,Lower 95%,Upper 95%,下限 95.0%,上限 95.0%,Intercept,-94.2498,32.07947,-2.93801,0.008792,-161.646,-26.8534,-161.646,-26.8534,X Variable 1,2.536492,0.456059,5.561761,2.8E-05,1.578347,3.494637,1.578347,3.494637,32/53,11.9 某汽车生产商欲了解广告费用(x)对销售量(y)影响,搜集了过去相关数据。经过计算得到下面相关结果:,方差分析表,变差起源,df,SS,MS,F,SignificanceF,回归,2.17E09,残差,40158.07,总计,11,1642866.67,参数预计表,Coefficients,标准误差,tStat,Pvalue,Intercept,363.6891,62.45529,5.823191,0.000168,XVariable1,1.41,0.071091,19.97749,2.17E09,33/53,(1)完成上面方差分析表,。,变差起源,df,SS,MS,F,SignificanceF,回归,1,1602708.6,1602708.6,399.1000065,2.17E09,残差,10,40158.07,4015.807,总计,11,1642866.67,SSR=SST-SSE=1642866.67-40158.07=1602708.6,MSR=SSR/1=1602708.6,MSE=SSE/10=4015.807,F=MSR/MSE=399.1000065,34/53,(2)汽车销售量变差中有多少是因为广告费用变动引发?,汽车销售量变差中有97.56%是因为广告费用变动引发,(3)销售量与广告费用之间相关系数是多少?,35/53,(4)写出预计回归方程并解释回归系数实际意义。,回归系数意义:广告费用每增加一个单位,,汽车销量就增加1.42个单位。,(5)检验线性关系显著性(a0.05)。,p=2.17E09,显著。,36/53,11.10,依据下面数据建立回归方程,计算残差,判定R2,预计标准误差se,并分析回归方程拟合程度。,37/53,残差,预计标准误差se,38/53,本题判定系数,R2=0.937348,,能够看出拟合程度好。,判定R2,39/53,11.11,从20样本中得到相关回归结果是:SSR=60,SSE=40。,要检验x与y之间线性关系是否显著,即检验假设:,。,(1)线性关系检验统计量F值是多少?,解:(1)SSR自由度为1;SSE自由度为n-2=18;,F=,=,=27,(2)给定显著性水平a0.05,Fa是多少?,=,=4.41,(3)是拒绝原假设还是不拒绝原假设?,拒绝原假设,线性关系显著。,40/53,(4)假定x与y之间是负相关,计算相关系数r,r=,=,=0.7746,因为是负相关,所以r=-0.7746,(5)检验x与y之间线性关系是否显著?,从F检验看线性关系显著。,F=,27,=4.41,41/53,11.12,从n=20样本中得到相关回归结果是:,y=5+3x,=1 =2,,要求,1)当x=4时,构建y平均值95%置信区间,42/53,2)当x=4时,构建y平均值95%预测区间,43/53,11.13 一家企业拥有多家子企业,企业管理者想经过广告支出来预计销售收入,为此抽取了8家子企业,得到广告支出和销售收入数据以下(单位:万元),广告支出X,12.5,3.7,21.6,60,37.6,6.1,16.8,41.2,销售收入Y,148,55,338,994,541,89,126,379,建立线性回归模型,当x=40万元时,构建销售收入95%置信区间,。,44/53,45/53,y,0,=-46.2918+15.23977x,当x=40万元时 E(y,0,)=-46.2918+15.23977*40=563.299,t,/2,=t,0.025,(6)=2.4469,置信区间为441.559,685.039,46/53,11.14,从两个回归分析中得到残差以下:,绘制残差图,你会得出什么结论。,47/53,回归1:,观察图像能够看出,残差值基本上集中在两条平行线之间,表明对于全部值,方差都相同,所以认定其假定描述变量x和y之,间关系回归模型是合理。,48/53,回归2,:,对于不一样x值残差相差也较大,且其残差值基本上集中在两条曲线之间,这就意味着其违反了方差相等,表明所选择,回归模型不合理,应该考虑曲线回归或多元回归。,49/53,11.15 随机抽取7家超市,得到其广告费支出和销售额数据以下:,11.15 随机抽取7家超市,得到其广告费支出和销售额数据以下:,超市,广告费支出(万元),销售额(万元),A,B,C,D,E,F,G,l,2,4,6,10,14,20,19,32,44,40,52,53,54,50/53,解,:(1),(1)用广告费支出作自变量x,销售额作因变量y,,求出预计回归方程。,Coefficients,标准误差,t Stat,P-value,Lower 95%,Upper 95%,下限 95.0%,上限 95.0%,Intercept,29.39911,4.807253,6.115573,0.001695,17.04167,41.75655,17.04167,41.75655,X Variable 1,1.547478,0.463499,3.338688,0.020582,0.356016,2.738939,0.356016,2.738939,51/53,(2)回归直线F检验:,显著。,(2)检验广告费支出与销售额之间线性关系是否显著(a0.05)。,方差分析,df,SS,MS,F,Significance F,回归分析,1,691.7226,691.7226,11.14684,0.020582,残差,5,310.2774,62.05549,总计,6,1002,Coefficients,标准误差,t Stat,P-value,Lower 95%,Upper 95%,下限 95.0%,上限 95.0%,Intercept,29.39911,4.807253,6.115573,0.001695,17.04167,41.75655,17.04167,41.75655,X Variable 1,1.547478,0.463499,3.338688,0.020582,0.356016,2.738939,0.356016,2.738939,广告费支出与销售额之间线性关系显著,52/53,显著。,回归系数t检验:,(3)绘制关于x残差图,你以为关于误差项,假定被满足了吗?,3).大约有95%标准化残差在-2,2之间表明误差项假定条件成立。从图中能够看出不满足这个条件,所以,关于误差项假定没有被满足。,(4)你是选取这个模型,还是另寻找一个更加好模型?,4).可考虑选取非线性模型,53/53,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服