实验一--一元线性回归演示教学.doc

资源描述

精品文档实验一一元线性回归一实验目的：掌握一元线性回归的估计与应用，熟悉EViews的基本操作。二实验要求：应用教材P59第12题做一元线性回归分析并做预测。三实验原理：普通最小二乘法。四预备知识：最小二乘法的原理、t检验、拟合优度检验、点预测和区间预测。五实验内容：第2章练习12 下表是中国2007年各地区税收和国内生产总值GDP的统计资料。单位：亿元地区 Y GDP 地区 Y GDP 北京 1435.7 9353.3 湖北 434.0 9230.7 天津 438.4 5050.4 湖南 410.7 9200.0 河北 618.3 13709.5 广东 2415.5 31084.4 山西 430.5 5733.4 广西 282.7 5955.7 内蒙古 347.9 6091.1 海南 88.0 1223.3 辽宁 815.7 11023.5 重庆 294.5 4122.5 吉林 237.4 5284.7 四川 629.0 10505.3 黑龙江 335.0 7065.0 贵州 211.9 2741.9 上海 1975.5 12188.9 云南 378.6 4741.3 江苏 1894.8 25741.2 西藏 11.7 342.2 浙江 1535.4 18780.4 陕西 355.5 5465.8 安徽 401.9 7364.2 甘肃 142.1 2702.4 福建 594.0 9249.1 青海 43.3 783.6 江西 281.9 5500.3 宁夏 58.8 889.2 山东 1308.4 25965.9 新疆 220.6 3523.2 河南 625.0 15012.5 要求，以手工和运用Eviews软件： (1)作出散点图，建立税收随国内生产总值GDP变化的一元线性回归方程，并解释斜率的经济意义； (2)对所建立的回归方程进行检验； (3)若2008年某地区国内生产总值为8500亿元，求该地区税收收入的预测值及预测区间。六实验步骤 1.建立工作文件并录入数据： (1)双击桌面快速启动图标，启动Microsoft Office Excel, 如图1，将题目的数据输入到excel表格中并保存。 (2)双击桌面快速启动图标，启动EViews6程序。 (3)点击File/New/ Workfile…，弹出Workfile Create对话框。在Workfile Create对话框左侧Workfile structure type栏中选择Unstructured/Undated选项，在右侧Data Range中填入样本个数31.在右下方输入Workfile的名称P53.如图2所示。图 1 图 2 (4)下面录入数据，点击File/Import/Read Text-Lotus-Excel...选中第(1)步保存的excel表格，弹出Excel Spreadsheet Import对话框，在Upper-left data cell栏输入数据的起始单元格B2，在Excel 5+sheet name栏中输入数据所在的工作表sheet1，在Names for series or Number if named in file栏中输入变量名Y GDP，如图3所示，点击OK，得到如图4所示界面。图 3 图 4 (5)按住Ctrl键同时选中Workfile界面的gdp表跟y表，点击鼠标右键选Open/as Group得到完整表格如图5，并点击Group表格上菜单命令Name，在弹出的对话框中命名为group01. 图 5 图 6 2.数据的描述性统计和图形统计：以上建立的序列GDP和Y之后，可对其做描述统计和统计以把握该数据的一些统计属性。 (1)描述属性：点View/Descriptive Stats\Common Sample，得描述统计结果，如图6所示，其中：Mean为均值，Std.Dev为标准差。 (2)图形统计：双击序列GDP，打开GDP的表格形式，点击表格左边View/Graph，可得图7。同样可查看序列Y的线形图。很多时候需要把两个序列放在一个图形中来查看两者的相互关系，用线图或散点图都可以。在命令栏键入：scat GDP Y，然后回车，就可以得到用散点图来查看GDP和Y的关系，如图8所示。图 7 图 8 3.设定模型，用最小二乘法估计参数：设定模型为。按住Ctrl键，同时选中序列Y和序列GDP，点击右键，在所出现的右键菜单中，选择Open/as Equation…后弹出一对话框，在框中一次输入“y c gdp ”，（注意被解释变量在最前，变量间要空格，如图9）点击其下的确定，即可得到回归结果（如图10）。图 9 图 10 由图10数据结果，可得到回归分析模型为：，，其中，括号内的数为相应的t检验值。是可决系数，与是有关的两个检验统计量。 4.模型检验： (1)经济意义检验。斜率为边际可支国内生产总值GDP，表明2007年，中国内地各省区GDP每增加1亿元时，税收平均增加0.071047亿元。 (2)t检验和拟合优度检验。在显著性水平下，自由度为31-2=29的t分布的临界值。因此，从参数的t检验值看，斜率项显然不为零，但不拒绝截距项为零的假设。另外，拟合优度表明，税收的76%的变化也以由GDP的变化来解释，因此拟合情况较好。在Eqution界面点击菜单命令View/Actual,Fitted,Residual/Actual,Fitted.Residual Graph可得到图11，可直观看到实际观测站和拟合值非常接近。图 11 图 12 5.应用：回归预测： (1)被解释变量Y的个别值和平均值的点预测：由第二章第五节知道，个别值和平均值点预测的预测公式均为内插预测：在Equation框中，点击“Forecast”，在Forecast name框中可以为所预测的预测值序列命名，计算机默认为yf，点击“OK”，得到样本期内被解释变量的预测值序列yf（也称拟合值序列）的图形形式（图12）。同时在Workfile中出现一个新序列对象yf。外推预测： ① 录入2008年某地区国内生产总值GDP为8500亿元的数据。双击Workfile菜单下的Range所在行，出现将Workfile structured对话框，讲右侧Observation旁边的数值改为32，然后点击OK，即可用将Workfile的Range以及Sample的Range改为32；双击打开GDP序列表格形式，将编辑状态切换为“可编辑”，在GDP序列中补充输入GDP=8500（如图13所示）。图13 图 14 ② 进行预测在Equation框中，点击“Forecast”，弹出一对话框，在其中为预测的序列命名，如yf2。点击OK即可用得到预测结果的图形形式（如图14所示）。点击Workfile中新出现的序列yf2，可以看到预测值为593.2667（图15）（注意：因为没有对默认预测区间1-32做改变，这时候得到的是所有内插预测与外插预测的值，若将区间改为32 32，则只会得到外推预测结果）。图 15 图 16 ③ 结果查看按住Ctrl键，同时选中y、yf、resid，点击右键，在右键菜单中选Open/as Group可打开实际值、预测值、残差序列，在view菜单选择Graph...，画折线图（如图16所示）。 (2)区间预测原理：当2007年中国某省区GDP为8500亿元时，预测的税收为被解释变量Y的个别值区间预测公式为：，被解释变量Y的均值区间预测公式为：。具体地说，可以在前面点预测序列中找到；可以查t分布表得到；样本数n=31为已知；中的为已知，，可以在序列GDP的描述统计中找到，；，从而；由X总体方差的无偏估计式，可以计算 (可在序列X的描述统计中找到)。 (3)区间预测的Eviews操作： ①个别值置信区间的计算：在命令栏输入：（yfu为个别值的置信上界，yfl为个别值的置信下界） “scalar yfu=593.2667+2.045*@sqrt(95183.1*(1+1/31+152979.5/55957878.6))” “scalar yfl=593.2667-2.045*@sqrt(95183.1*(1+1/31+152979.5/55957878.6))” 得到： yfu=1235.12876632 yfl=-48.5953663235 于是95%的置信度下预测的2008年某省区税收入个值的置信区间为：（-48.5953663235,1235.12876632）。 ②均值的置信区间的计算：在命令栏输入：（eyfu为均值的置信上界，eyfl为均值的置信下界） “scalar eyfu=593.2667+2.045*@sqrt(95183.1*(1/31+152979.5/55957878.6))” “scalar eyfl=593.2667-2.045*@sqrt(95183.1*(1/31+152979.5/55957878.6))” 得到： eyfu=711.287072849 eyfl=475.246327151 于是在95%的置信度下，预测省区的2008年的税收收入均值的置信区间为：（475.246327151，711.287072849）。实验二多元线性回归一实验目的： (1) 掌握多元线性回归模型的估计方法 (2) 模型方程的F检验，参数的t检验 (3) 模型的外推预测与置信区间预测二实验要求：应用教材P107习题14做多元线性回归模型估计，对回归方程和回归参数进行检验并做出单点预测与置信区间预测三实验原理：最小二乘法四预备知识：最小二乘法估计原理、t检验、F检验、点预测和置信区间预测五实验内容：在一项对某社区家庭对某种消费品的消费需要调查中，得到书中的表所示的资料。序号对某商品的消费支出Y 商品单价X1 家庭月收入X2 序号对某商品的消费支出Y 商品单价X1 家庭月收入X2 1 591.9 23.56 7620 6 644.4 34.14 12920 2 654.5 24.44 9120 7 680.0 35.3 14340 3 623.6 32.07 10670 8 724.0 38.7 15960 4 647.0 32.46 11160 9 757.1 39.63 18000 5 674.0 31.15 11900 10 706.8 46.68 19300 请用手工与软件两种方法对该社区家庭对该商品的消费需求支出作二元线性回归分析。 (1)估计回归方程的参数及及随机干扰项的方差，计算及。 (2)对方程进行F检验，对参数进行t检验，并构造参数95%的置信区间. (3)如果商品单价变为35元，则某一月收入为20000元的家庭的消费支出估计是多少？构造该估计值的95%的置信区间。六实验步骤： 6.1 建立工作文件并录入全部数据如图1所示：图 1 6.2 建立二元线性回归模型点击主界面菜单Quick\Estimate Equation 选项，在弹出的对话框中输入：Y C X1 X2 点击确定即可得到回归结果，如图2所示图 2 根据图2的信息，得到回归模型的估计结果为：随机干扰项的方差估计值为 6.3 结果的分析与检验 6.3.1 方程的F检验回归模型的F值为：因为在5%的显著性水平下，F统计量的临界值为所以有所以回归方程通过F检验，方程显著成立。 6.3.2 参数的t检验由图2的估计结果，常数项、X1、X2系数的参数估计的t值分别为：在5%的显著性水平下，t统计量的临界值为：显然有所以拒绝原假设，即回归方程的三个估计参数均显著，通过t检验。 6.4 参数的置信区间由图2的结果，可以看到: 因为参数的区间估计为：又因为在的显著性水平下，所以得：于是，常数项的95%的置信区间为：同样的有：于是，X1项的系数的95%的置信区间为：同样的有：于是，X2项的系数的95%的置信区间为： 6.5 回归预测 6.5.1 内插预测在Equation框中，点击“Forecast”，在Forecast name框中可以为所预测的预测值序列命名，计算机默认为yf，点击“OK”，得到样本期内被解释变量的预测值序列yf（也称拟合值序列）的图形形式，如图3所示。同时在Workfile中出现一个新序列对象yf。图 3 图 4 6.5.2 外推预测 (1)录入数据双击Workfile菜单下的Range所在行，出现将Workfile structured对话框，将右侧Observation旁边的数值改为11，然后点击OK，即可用将Workfile的Range以及Sample的Range改为11；双击打开group01序列表格形式，将编辑状态切换为“可编辑”，在X1序列中补充输入X1=35.同样的方法录入X2=20000 (2)进行预测在Equation框中，点击“Forecast”，弹出一对话框，在其中为预测的序列命名，如yf2。点击OK即可用得到预测结果的图形形式，如图4所示。点击Workfile中新出现的序列yf2，可以看到预测值为856.2025（如图5所示）图 5 图 6 (3)结果查看按住Ctrl键，同时选中y、yf、resid，点击右键，在右键菜单中选Open/as Group可打开实际值、预测值、残差序列，在view菜单选择Grap/Line，画折线图，如图6所示。 6.6 置信区间的预测消费支出Y的个别值的预测置信区间为: 其中, 为Y的个别值预测的标准差为: 消费支出Y的均值的预测置信区间为: 其中，为Y的均值预测的标准差为: 6.6.1 Y个别值的置信区间的预测在Equation框中，点击“Forecast”，弹出Forecast话框,如图7所示图 7 图 8 在图7中S.E.那一栏为预测值的标准差，命名为yczbzc，然后点解OK，即可在Workfile界面看到一个名为yczbzc的序列。双击打开这一序列，如图8所示，在第11行（预测行）即可直接显示个别值的预测值标准差为：把结果代入，即可得到Y个别值的95%的置信区间为： 6.6.2 Y均值的置信区间的预测：由于且所以可计算得：代入公式即可得到Y均值的预测标准差为：再把结果代入均值的置信区间公式得到Y均值的95%的置信区间为：精品文档

展开阅读全文