1、2.1 一元线性回归模型有哪些基本假定?答:1. 解释变量 是非随机变量,观测值是常数。2. 等方差及不相关的假定条件为 这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M条件。在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。 3. 正态分布的假定条件为 在此条件下便可得到关于回归系数的最小二乘估计及估计的进一步结果,如它们分别是回归系数的最及的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。4. 通常为了便于数学上的处理,还要求及样本容量的个数要多于解释变量的个数。 在整
2、个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进行处理。因此,线性回归模型的理论和应用是本书研究的重点。1. 如何根据样本求出及方差的估计;2. 对回归方程及回归系数的种种假设进行检验;3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。2.2 考虑过原点的线性回归模型 误差仍满足基本假定。求的最小二乘估计。答:令即解得即的最小二乘估计为2.3 证明:Q (,)= (-)2 因为Q (,)=min Q (, )而Q
3、(, ) 非负且在上可导,当Q取得最小值时,有即-2(-)=0 -2(-) =0又=-( +)= - =0, =0(即残差的期望为0,残差以变量x的加权平均值为零)2.4 解:参数0,1的最小二乘估计与最大似然估计在iN(0, 2 ) i=1,2,n的条件下等价。 证明:因为 所以 其最大似然函数为 已知使得Ln(L)最大的,就是,的最大似然估计值。 即使得下式最小 : 因为恰好就是最小二乘估计的目标函数相同。 所以,在 的条件下, 参数0,1的最小二乘估计与最大似然估计等价。2.5.证明是的无偏估计。 证明:若要证明是的无偏估计,则只需证明E()=。 因为,的最小二乘估计为 其中E()=E(
4、)=E()=E =E =E()+E()+E() 其中=由于=0,所以= =)=0又因为一元线性回归模型为所以E()=0所以E()+E()+E( = =所以是的无偏估计。2.6 解:因为 , , 联立 式,得到。 因为,所以 2.7 证明平方和分解公式:SST=SSE+SSR证明:2.8 验证三种检验的关系,即验证:(1);(2)证明:(1)因为,所以又因为,所以故 得证。(2)2.9 验证(2.63)式: 证明: 其中: 注:各个因变量是独立的随机变量 2.10 用第9题证明是的无偏估计量 证明: 注:2.11验证证明:所以有以上表达式说明r 与F 等价,但我们要分别引入这两个统计量,而不是只
5、引入其中一个。理由如下:r 与F,n都有关,且当n较小时,r较大,尤其当n趋向于2时,|r|趋向于1,说明x与y的相关程度很高;但当n趋向于2或等于2时,可能回归方程并不能通过F的显著性检验,即可能x与y都不存在显著的线性关系。所以,仅凭r较大并不能断定x与y之间有密切的相关关系,只有当样本量n较大时才可以用样本相关系数r判定两变量间的相关程度的强弱。 F检验检验是否存在显著的线性关系,相关系数的显著性检验是判断回归直线与回归模型拟合的优劣,只有二者结合起来,才可以更好的回归结果的好坏。2.12 如果把自变量观测值都乘以2,回归参数的最小二乘法估计和会发生什么变化?如果把自变量观测值都加上2,
6、回归参数的最小二乘估计和会发生什么变化?解: 解法(一):我们知道当,时,用最小二乘法估计的和分别为当时有 将带入得到当时 有 将带入得到解法(二): 当,时,有 当时 当 , ,由最小二乘法可知,离差平方和时,其估计值应当有 。即回归参数的最小二乘估计和在自变量观测值变化时不会变。2.13 如果回归方程相应的相关系数r很大,则用它预测时,预测误差一定较小。这一结论能成立吗?对你的回答说明理由。解:这一结论不成立。因为相关系数r表示x与线性关系的密切程度,而它接近1的程度与数据组数有关。n越小,r越接近1。n=2时,|r|=1。因此仅凭相关系数说明x与有密切关系是不正确的。只有在样本量较大时,
7、用相关系数r判定两变量之间的相关程度才可以信服,这样预测的误差才会较小。2.14 解:(1)散点图为:(2)x与y大致在一条直线上,所以x与y大致呈线性关系。(3)得到计算表:XY1104100206(-14)2(-4)221011001013(-7)2(3)2320000200042010027727254044004034142(-6)2和15100和Lxx=10Lyy=600和Lxy=70和100SSR=490SSE=110均3均20均20 所以回归方程为:(4)= 所以,(5)因为 ,的置信区间为; 同理,因为,所以,的置信区间为。查表知, 所以,的置信区间为(-21.21,19.21
8、),的置信区间为(0.91,13.09)。(6)决定系数 (7)计算得出,方差分析表如下:方差来源平方和自由度均方F值SSR490149013.364SSE110336.667SST6004 查表知,F0.05(1,3)=10.13,F值F0.05(1,3),故拒绝原假设,说明回归方程显著。(8) 做回归系数1的显著性检验 计算t统计量: 查表知, ,所以,tt0.05/2(3),所以接受原假设,说明x和Y有显著的线性关系。(9)做相关系数r的显著性检验:因为 所以,相关系数 因为查表知,n-2等于3时,%的值为0.959,%的值为0.878 。 所以,%|r|5.32, 所以拒绝原假设,说明
9、回归方程显著,即x与y有显著的线性关系。(8)做回归系数显著性的检验; 由“回归系数显著性检验表(表2)”可得, 的t检验统计量为t=8.509,对应p-值近似为0,p, 说明每周签发的新报单数目x对每周加班工作时间y有显著的影响。(9)做相关系数的显著性检验; 分析相关双变量,得到“相关分析表(表5)”如下:Correlations每周签发的新保单数目x每周加班工作时间y每周签发的新保单数目xPearson Correlation1.949*Sig. (2-tailed).000N1010每周加班工作时间yPearson Correlation.949*1Sig. (2-tailed).00
10、0N1010*. Correlation is significant at the 0.01 level (2-tailed). 由上表可知,相关系数为0.949,说明x与y显著线性相关。(10)对回归方程作残差图并作相应的分析; 从上图可以看出,残差是围绕e=0随即波动的,满足模型的基本假设。(11)该公司预计下一周签发新保单=1000张,需要的加班时间是多少? 当=1000张时,=0.118+0.0041000=4.118小时。(12)给出的置信水平为95%的精确预测区间和近似预测区间。(13)给出E()置信水平为95%的区间估计。 最后两问一起解答: 在计算回归之前,把自变量新值输入样
11、本数据中,因变量的相应值空缺,然后在Save对话框中点选Individul和Mean计算因变量单个新值和因变量平均值E()的置信区间。结果显示在原始数据表中,如下图所示(由于排版问题,中间部分图省略): 的精确预测区间为:2.519,4.887 E()的区间估计为:3.284,4.123而的近似预测区间则根据2手动计算,结果为: 4.118-20.48,4.118+20.48=3.158,5.078 2.16 解答:(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?如图所示:(2)由上图可以看出,y与x的散点分布大致呈直线趋势,所以可以用直线回归描述两者之间的关系。(3)建立y对x
12、的线性回归。利用SPSS建立y对x的线性回归,输出结果如下: 表1 模型汇总模型RR 方调整 R 方标准 估计的误差1.835a.697.6912323.256a. 预测变量: (常量), x。表2 方差分析表Anovab模型平方和df均方FSig.1回归6.089E816.089E8112.811.000a残差2.645E8495397517.938总计8.734E850a. 预测变量: (常量), x。b. 因变量: y 表3 系数表系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)12112.6291197.76810.113.000x3.314.312.83510.6
13、21.000a. 因变量: y(a)由表1可知,x与y决定系数为,说明模型的拟合效果一般。x与y线性相关系数R=0.835,说明x与y有较显著的线性关系。(b)由表2(方差分析表中)看到,F=112.811,显著性Sig.p,说明回归方程显著。(c)由表3 可见对的显著性t检验P值近似为零,故显著不为0,说明x对y有显著的线性影响。(d)综上,x与y的线性回归方程为:用线性回归的Plots功能绘制标准残差的直方图和正态概率图,检验误差项的正态性假设。如图所示:图1 标准残差的直方图 图2 标准残差的正态概率图由图1可见图形略呈右偏,由图2可见正态概率图中的各个散点基本呈直线趋势,残差在0附近波
14、动,以认为残差服从正态分布。 3、通过活动,使学生养成博览群书的好习惯。B比率分析法和比较分析法不能测算出各因素的影响程度。C采用约当产量比例法,分配原材料费用与分配加工费用所用的完工率都是一致的。C采用直接分配法分配辅助生产费用时,应考虑各辅助生产车间之间相互提供产品或劳务的情况。错 C产品的实际生产成本包括废品损失和停工损失。C成本报表是对外报告的会计报表。C成本分析的首要程序是发现问题、分析原因。C成本会计的对象是指成本核算。C成本计算的辅助方法一般应与基本方法结合使用而不单独使用。C成本计算方法中的最基本的方法是分步法。XD当车间生产多种产品时,“废品损失”、“停工损失”的借方余额,月
15、末均直接记入该产品的产品成本 中。D定额法是为了简化成本计算而采用的一种成本计算方法。F“废品损失”账户月末没有余额。F废品损失是指在生产过程中发现和入库后发现的不可修复废品的生产成本和可修复废品的修复费用。F分步法的一个重要特点是各步骤之间要进行成本结转。()G各月末在产品数量变化不大的产品,可不计算月末在产品成本。错G工资费用就是成本项目。()G归集在基本生产车间的制造费用最后均应分配计入产品成本中。对J计算计时工资费用,应以考勤记录中的工作时间记录为依据。()J简化的分批法就是不计算在产品成本的分批法。()J简化分批法是不分批计算在产品成本的方法。对 J加班加点工资既可能是直接计人费用,
16、又可能是间接计人费用。J接生产工艺过程的特点,工业企业的生产可分为大量生产、成批生产和单件生产三种,XK可修复废品是指技术上可以修复使用的废品。错K可修复废品是指经过修理可以使用,而不管修复费用在经济上是否合算的废品。P品种法只适用于大量大批的单步骤生产的企业。Q企业的制造费用一定要通过“制造费用”科目核算。Q企业职工的医药费、医务部门、职工浴室等部门职工的工资,均应通过“应付工资”科目核算。 S生产车间耗用的材料,全部计入“直接材料”成本项目。 S适应生产特点和管理要求,采用适当的成本计算方法,是成本核算的基础工作。()W完工产品费用等于月初在产品费用加本月生产费用减月末在产品费用。对Y“预
17、提费用”可能出现借方余额,其性质属于资产,实际上是待摊费用。对 Y引起资产和负债同时减少的支出是费用性支出。XY以应付票据去偿付购买材料的费用,是成本性支出。XY原材料分工序一次投入与原材料在每道工序陆续投入,其完工率的计算方法是完全一致的。Y运用连环替代法进行分析,即使随意改变各构成因素的替换顺序,各因素的影响结果加总后仍等于指标的总差异,因此更换各因索替换顺序,不会影响分析的结果。()Z在产品品种规格繁多的情况下,应该采用分类法计算产品成本。对Z直接生产费用就是直接计人费用。XZ逐步结转分步法也称为计列半成品分步法。A按年度计划分配率分配制造费用,“制造费用”账户月末(可能有月末余额/可能有借方余额/可能有贷方余额/可能无月末余额)。A按年度计划分配率分配制造费用的方法适用于(季节性生产企业)