收藏 分销(赏)

多元线性回归——多重共线性.ppt

上传人:w****g 文档编号:2292635 上传时间:2024-05-25 格式:PPT 页数:49 大小:497.50KB
下载 相关 举报
多元线性回归——多重共线性.ppt_第1页
第1页 / 共49页
多元线性回归——多重共线性.ppt_第2页
第2页 / 共49页
多元线性回归——多重共线性.ppt_第3页
第3页 / 共49页
多元线性回归——多重共线性.ppt_第4页
第4页 / 共49页
多元线性回归——多重共线性.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、1多重共线性多重共线性墩缺刑匝剂弟死鼻南甫云解家进窿倍啮承校预倡燥莹凝痉攘奠虚各一逮部多元线性回归多重共线性多元线性回归多重共线性2引子:引子:发展农业和建筑业会减少财政收入吗?发展农业和建筑业会减少财政收入吗?为了分析各主要因素对财政收入的影响,建立财政收为了分析各主要因素对财政收入的影响,建立财政收入模型入模型:其中其中:CS:CS财政收入财政收入(亿元亿元););NZ NZ农业增加值农业增加值(亿元亿元);GZ);GZ工业增加值工业增加值(亿元亿元););JZZ JZZ建筑业增加值建筑业增加值(亿元亿元);TPOP);TPOP总人口总人口(万人万人););CUM CUM最终消费最终消费(

2、亿元亿元);SZM);SZM受灾面积受灾面积(万公顷万公顷)数据样本时期数据样本时期19781978年年-2003-2003年年(资料来源(资料来源:中国统计年鉴中国统计年鉴20042004,中国统计出版社中国统计出版社20042004年)年)采用普通最小二乘法得到以下估计结果采用普通最小二乘法得到以下估计结果祸撮乖俏瓢蛛眯卸奥瞥库炽尘货遁冤必披昼晚虱锡癣讳耻昏荔召亚所横鉴多元线性回归多重共线性多元线性回归多重共线性3 VariableCoefficientStd.Errort-StatisticProb.农业增加增加值NZ-1.5350900.129778-11.828610.0000工工业

3、增加增加值GZ0.8987880.2454663.6615580.0017建筑建筑业增加增加值JZZ-1.5270891.206242-1.2659890.2208总人口人口TPOP0.1511600.0337594.4776460.0003最最终消消费CUM0.1015140.1053290.9637830.3473受灾面受灾面积SZM-0.0368360.018460-1.9953820.0605截距截距项-11793.343191.096-3.6957040.0015R-squared0.995015 Mean dependent var5897.824Adjusted R-square

4、d0.993441 S.D.dependent var5945.854S.E.of regression481.5380 Akaike info criterion15.41665Sum squared resid4405699.Schwarz criterion15.75537Log likelihood-193.4165 F-statistic632.0999Durbin-Watson stat1.873809 Prob(F-statistic)0.000000财政收入模型的结果财政收入模型的结果后熙竹焊辱鸥摘舀闭幸警石渗嫡踌披叙望耗胃兢颠结随刨糟与篇纲海蹄额多元线性回归多重共线性多元线性

5、回归多重共线性4 可决系数为可决系数为0.9950.995,校正的可决系数为,校正的可决系数为0.9930.993,模型,模型拟合很好。模型对财政收入的解释程度高达拟合很好。模型对财政收入的解释程度高达99.5%99.5%。F F统计量为统计量为632.10632.10,说明,说明0.050.05水平下回归方程整体水平下回归方程整体上显著。上显著。t t 检验结果表明,除了工业增加值和总人口以外,检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。其他因素对财政收入的影响均不显著。农业增加值和建筑业增加值的回归系数是负数。农业增加值和建筑业增加值的回归系数是负数。农业和

6、建筑业的发展反而会使财政收入减少吗?农业和建筑业的发展反而会使财政收入减少吗?!这样的异常结果显然与理论分析和实践经验不相符。这样的异常结果显然与理论分析和实践经验不相符。若模型设定和数据真实性没问题,问题出在哪里呢?若模型设定和数据真实性没问题,问题出在哪里呢?模型估计与检验结果分析模型估计与检验结果分析缸哩决修险犊阿宣浩巴语尝痕芜村倪揖凌关拒细钥煞巢霞慰蒜张萌戌弹脓多元线性回归多重共线性多元线性回归多重共线性5多重共线性多重共线性讨论四个问题:讨论四个问题:什么是多重共线性什么是多重共线性 多重共线性产生的后果多重共线性产生的后果 多重共线性的检验多重共线性的检验 多重共线性的补救措施多重

7、共线性的补救措施毕骡痞踢蹦溯澡浚胖宇殖职骏侯馅蜜甜化掀蠕仟豢凹洛标钢恒达慕家萧尤多元线性回归多重共线性多元线性回归多重共线性6一、一、什么是多重共线性什么是多重共线性基本内容基本内容:多重共线性的含义多重共线性的含义 产生多重共线性的背景产生多重共线性的背景 缨鸳露含职跪暂订怯稀亏劲退赏畅这蛤六厩侯农泉路泽档崭大胞条饥乳瘪多元线性回归多重共线性多元线性回归多重共线性71、多重共线性的含义、多重共线性的含义对于模型 i=1,2,n其基本假设之一是解释变量是互相独立的。n如果某两个或多个解释变量之间出现了相关如果某两个或多个解释变量之间出现了相关性,则称为性,则称为多重共线性多重共线性n包括完全多

8、重共线性和不完全多重共线性包括完全多重共线性和不完全多重共线性褂嗓付瘫机媒桓判喷襟掂橇彝雇撤哥茶银囚琐拈织夸侍卷民怜陶战峰胺偿多元线性回归多重共线性多元线性回归多重共线性8完全的多重共线性完全的多重共线性:在计量经济学中所谓的多重共线性在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括完全的多重共线性,不仅包括完全的多重共线性,还包括不完全的多重共线性。还包括不完全的多重共线性。对于解释变量对于解释变量 ,如果存在不全为,如果存在不全为0的的 数数 ,使得,使得 则称解释变量则称解释变量 之间存在着之间存在着完全的多重完全的多重 共线性。共线性。湾褂口暂采久淌窄虚

9、垂蚊荐苯缀塌怨索类矛叉责稀狭倚茎远殿荒揽末邵斋多元线性回归多重共线性多元线性回归多重共线性9当当 时,表明在数据矩阵时,表明在数据矩阵 中,中,至少有一个列向量可以用其余的列向量线至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。性表示,则说明存在完全的多重共线性。矩阵表示为矩阵表示为墨穗焙梳嗣决凭粹廖蛰编雕嗓函三椿俞绵师锚康盆屡些胳僧私拆钻洱孜蹭多元线性回归多重共线性多元线性回归多重共线性10不完全的多重共线性不完全的多重共线性 实际中,常见的情形是解释变量之间存在实际中,常见的情形是解释变量之间存在不完全的多重共线性。不完全的多重共线性。对对于解于解释变释变量量,存在

10、不全存在不全为为0的数的数,使得使得 为为随机随机变变量。量。这这表明解表明解释变释变量量只是一种只是一种近似的近似的线线性关系性关系。其中其中,恭棒阉迸帮侯得糠共枕近秦容孙韵呆额钠诀鸿细凋卜腾流雾聘竞萌翰纬醚多元线性回归多重共线性多元线性回归多重共线性11无多重共线性无多重共线性n如果解释变量之间不存在上述关系,则称解释变量之间无多重共线性此时:n注意:个解释变量不存在多重共线性(线性相关)并不能说明它们之间无关,不存在非线性关系兔示引揖圆暴彦排炸魁图锦路扎失白污滇婆翁笔幽负凌芋灌行问辫亿谗蜀多元线性回归多重共线性多元线性回归多重共线性12 ,解释变量间毫无线性关系,变量间相互正交。这时已不

11、需要作多元回归,每个参数j都可以通过Y 对 Xj 的一元回归来估计。回归模型中解释变量的关系回归模型中解释变量的关系 可能表现为三种情形:可能表现为三种情形:(1),解释变量间完全共线性。此时模型参数将无法确定。,解释变量间存在一定程度的线性关系。实际中常遇到的情形。(2)(3)诽降邱姓槛战窥吮邪酬锌喂意熟寞拉悉风盏叮测爵仆暴翅恤洋彬栓觉浮悲多元线性回归多重共线性多元线性回归多重共线性13 2、产生多重共线性的原因、产生多重共线性的原因 1)经济变量之间往往存在同方向的变化趋势。当他们被引入同一经济变量之间往往存在同方向的变化趋势。当他们被引入同一个模型成为解释变量时,会出现多重共线性个模型成

12、为解释变量时,会出现多重共线性2)模型中包含滞后变量,变量各期值之间有可能高度相关。模型中包含滞后变量,变量各期值之间有可能高度相关。3)利用截面数据建立模型也可能出现多重共线性。利用截面数据建立模型也可能出现多重共线性。4)经济变量之间往往存在着密切的内在关联度,要素之间互相制经济变量之间往往存在着密切的内在关联度,要素之间互相制约,互相依存。约,互相依存。5)样本数据自身的原因,数据收集的范围过窄,造成某些解释变样本数据自身的原因,数据收集的范围过窄,造成某些解释变量之间似乎有相同或相反变化趋势的假象。量之间似乎有相同或相反变化趋势的假象。6)在建模过程中由于解释变量选择不当,引起变量之间

13、的多重共在建模过程中由于解释变量选择不当,引起变量之间的多重共线性线性注:解释变量之间的多重共线性不可避免,只可能使多重共线性注:解释变量之间的多重共线性不可避免,只可能使多重共线性的程度尽可能地减弱的程度尽可能地减弱撵拿矽关爪汰拄四芍惋狙货翱豺液笑实捐锗辑恋雨鄂造魁管怀玄嫩臼夷湾多元线性回归多重共线性多元线性回归多重共线性14二、二、多重共线性产生的后果多重共线性产生的后果 基本内容基本内容:完全多重共线性产生的后果完全多重共线性产生的后果 不完全多重共线性产生的后果不完全多重共线性产生的后果惯骆镍咙关凯妊瞳拦皿安咸烂估俭骇冒畔辣凰呕酷羞俊腋壁羽胎英籍霜擅多元线性回归多重共线性多元线性回归多

14、重共线性151、完全多重共线性产生的后果、完全多重共线性产生的后果骄伤指硕祝芥溪舒锥搂艳份孪惹噎问桑鞠镑臂祈沈狞宏咀端勺培叠姿珊攫多元线性回归多重共线性多元线性回归多重共线性161)参数的估计值不确定)参数的估计值不确定当解释变量当解释变量完全线性相关完全线性相关时时 OLS 估计式不确定估计式不确定 从偏回归系数意义看:在从偏回归系数意义看:在 和和 完全共线性时,无法保完全共线性时,无法保持持 不变,去单独考虑不变,去单独考虑 对对 的影响(的影响(和和 的影响的影响不可区分)不可区分)从从OLS估计式看:可以证明此时估计式看:可以证明此时2)参数估计值的方差无限大)参数估计值的方差无限大

15、OLS估计式的方差成为无穷大:估计式的方差成为无穷大:呼搓童抬革模熬滴癸被捉啸绵荆照缀岭熔彝贝药轨蚕暑倚轨供淫肠户厢递多元线性回归多重共线性多元线性回归多重共线性172 2、不完全多重共线性产生的后果、不完全多重共线性产生的后果业嵌萄砷橡栗猖座坝度讲猜者澎符辣重竹匀蠢犹芭墅药不惫你歼兜激钻穷多元线性回归多重共线性多元线性回归多重共线性18 如果模型中存在不完全的多重共线性,可以得到参数的估计如果模型中存在不完全的多重共线性,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。值,但是对计量经济分析可能会产生一系列的影响。1)参数估计值的方差增大参数估计值的方差增大为对其他解释变量做

16、辅助回归模型的决定系数为对其他解释变量做辅助回归模型的决定系数其中:其中:称为方差膨胀因子称为方差膨胀因子当与其他解释变量存在严重的多重共线性时:当与其他解释变量存在严重的多重共线性时:粮瘴杯操里膨多他鲜亡辕史夯算川渐硬稚芭冰杆燕短梦爬乖赤曰倾歌撩美多元线性回归多重共线性多元线性回归多重共线性192)对参数区间估计时,对参数区间估计时,置信区间趋于变大区间估计失去可靠性;预测区间变大,置信区间趋于变大区间估计失去可靠性;预测区间变大,降低预测精度降低预测精度3)假设检验容易作出错误的判断,检验的可靠性降低,假设检验容易作出错误的判断,检验的可靠性降低,可能导致在假设检验中舍去重要的解释变量可能

17、导致在假设检验中舍去重要的解释变量因为:回归参数显著性检验因为:回归参数显著性检验孟座坦涨狸送键岔洗蛾鸯执哼丫坊酿中愤孟魏匡稻兹棕善址糕免砰胎儡宫多元线性回归多重共线性多元线性回归多重共线性204)可能造成可决系数较高,但对各个参数单独的可能造成可决系数较高,但对各个参数单独的 t 检验检验却可能不显著,甚至可能使估计的回归系数符号相反,却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。得出完全错误的结论。无法正确反映每个解释变无法正确反映每个解释变量对被解释变量的单独影响。量对被解释变量的单独影响。5)回归模型缺乏稳定性回归模型缺乏稳定性当样本观测数据发生微小变化时,模型参

18、数的估计值会当样本观测数据发生微小变化时,模型参数的估计值会有很大的变化(氏检验)有很大的变化(氏检验)获秒掀郊留傀瘦癸说碎己苫跋点箱诣娶爆毡讯侧暇枷滨鹏敬炙小复霞痕匿多元线性回归多重共线性多元线性回归多重共线性21三、三、多重共线性的检验多重共线性的检验基本内容:基本内容:简单相关系数检验法简单相关系数检验法 方差扩大(膨胀)因子法方差扩大(膨胀)因子法 直观判断法直观判断法 逐步回归法逐步回归法避枯泉友渴誊驴孜露遏据携福枣坑质定亨磁皇梆醒捅鹏购靴萝酒卸霖矾答多元线性回归多重共线性多元线性回归多重共线性221、简单相关系数检验法、简单相关系数检验法 含义:含义:简单相关系数检验法是利用解释变

19、量之间的线简单相关系数检验法是利用解释变量之间的线性相关程度去判断是否存在严重多重共线性的一种性相关程度去判断是否存在严重多重共线性的一种简便方法。简便方法。判断规则:判断规则:一般而言,如果每两个解释变量的简单相一般而言,如果每两个解释变量的简单相关系数关系数(零阶相关系数零阶相关系数)比较高,例如大于比较高,例如大于0.8,则可,则可认为存在着较严重的多重共线性。认为存在着较严重的多重共线性。霉门簿困珍友屑溃茫默迢紫腆洋浙厚忘蔽水痒诣存宛且星嘲绳抵机什乱捣多元线性回归多重共线性多元线性回归多重共线性23Klein判别公式:拢橡壶搅肛国蟹象豢惨醛稿阉锋幂铝审哄插呼崇枝纬韦冯赢仑赡笑绊拓艺多元

20、线性回归多重共线性多元线性回归多重共线性24 注意:注意:1)较高的简单相关系数只是多重共线性存在的充分条件,而)较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。不是必要条件。2)只适用于两个解释变量之间存在线性相关检验)只适用于两个解释变量之间存在线性相关检验,对于三个对于三个或更多的解释变量之间存在的线性相关关系不适用或更多的解释变量之间存在的线性相关关系不适用 3)相关系数很大则必存在多重共线性)相关系数很大则必存在多重共线性,而相关系数很小却未而相关系数很小却未必没有多重共线性必没有多重共线性.特别是在多于两个解释变量的回归模型中,特别是在多于两个解释变量的回归模型中,

21、有时较低的简单相关系数也可能存在多重共线性。因此并不有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。能简单地依据相关系数进行多重共线性的准确判断。吊鉴芝兄舶埋蛋宗睡漆尉婴刽浴淌段忧择语箔挚步甸恨趁抵辈许盎拴殿眼多元线性回归多重共线性多元线性回归多重共线性252、辅助回归检验法、辅助回归检验法做咒公勿成躺棺油珊月钾裸全沿饵篆盟疾杏利燃觅旅剖康买酉记墓船罕双多元线性回归多重共线性多元线性回归多重共线性26 3 3、方差扩大(膨胀)因子法、方差扩大(膨胀)因子法 统计统计上可以上可以证证明,解明,解释变释变量量的参数估的参数估计计式式的方差可表示的方

22、差可表示为为 其中的其中的是是变变量量(Variance Inflation Factor),即,即的方差扩大因子的方差扩大因子其中其中 是多个解是多个解释变释变量量辅辅助回助回归归的可决系数的可决系数 磷蛛恒湿饮廷答狗徘辐沫过吊试阑松敲遏狸夺泼傍徒贿绑邱骤冉近拭爆酥多元线性回归多重共线性多元线性回归多重共线性27经验规则经验规则方差膨胀因子越大,表明解释变量之间的多重共性方差膨胀因子越大,表明解释变量之间的多重共性越严重。反过来,越严重。反过来,方差膨胀因子越接近于方差膨胀因子越接近于1,多重,多重共线性越弱。共线性越弱。经验表明,经验表明,方差膨胀因子方差膨胀因子10时,说明解释变量与时,

23、说明解释变量与其余解释变量之间有严重的多重共线性其余解释变量之间有严重的多重共线性,且这种多,且这种多重共线性可能会过度地影响最小二乘估计。重共线性可能会过度地影响最小二乘估计。壕羚事谚寡刊稻癸恰庞损嘛误剖挫缮耸嗜以综鳖人克盯填韦钱胰邑阻吓墒多元线性回归多重共线性多元线性回归多重共线性284、直观判断法、直观判断法 根据回归结果判断也叫不显著系数检验法根据回归结果判断也叫不显著系数检验法1)从定性分析认为,一些重要的解释变量的回归系数)从定性分析认为,一些重要的解释变量的回归系数的标准误差较大,在回归方程中没有通过显著性检的标准误差较大,在回归方程中没有通过显著性检验时,可初步判断可能存在严重

24、的多重共线性。验时,可初步判断可能存在严重的多重共线性。F检验大于给定显著性水平下的临界值检验大于给定显著性水平下的临界值.但模型中的全但模型中的全部或部分参数估计值却不显著部或部分参数估计值却不显著,或系数估计值的符号或系数估计值的符号不对不对,则模型自变量之间存在多重共线性则模型自变量之间存在多重共线性.御箩深芝膀皿埂戮嗽探辟延聘苹瞥肄繁巧滋觉忆卞漱否颠锤柿篮带雌横马多元线性回归多重共线性多元线性回归多重共线性292)当增加或剔除一个解释变量,或者改变一个观)当增加或剔除一个解释变量,或者改变一个观测值时,回归参数的估计值发生较大变化,回归测值时,回归参数的估计值发生较大变化,回归方程可能

25、存在严重的多重共线性。方程可能存在严重的多重共线性。3)有些解释变量的回归系数所带正负号与定性分)有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。析结果违背时,很可能存在多重共线性。4)解释变量的相关矩阵中,自变量之间的相关系)解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。数较大时,可能会存在多重共线性问题。帮甩愧酱奉两片又层钓弛纂谓渐军杀苟填画镰紧绸元听苍秸浦唐因猾嘶汛多元线性回归多重共线性多元线性回归多重共线性305、逐步回归检测法、逐步回归检测法 也称也称Frisch综合分析法其基本思想:综合分析法其基本思想:将变量逐个的引入模型

26、,每引入一个解释变量后,将变量逐个的引入模型,每引入一个解释变量后,都要进行检验,并对已经选入的解释变量逐个进行都要进行检验,并对已经选入的解释变量逐个进行t 检验,当原来引入的解释变量由于后面解释变量的检验,当原来引入的解释变量由于后面解释变量的引入而变得不再显著时,则将其剔除。以确保每次引引入而变得不再显著时,则将其剔除。以确保每次引入新的变量之前回归方程中只包含显著的变量。入新的变量之前回归方程中只包含显著的变量。在逐步回归中,高度相关的解释变量,在引入时会被在逐步回归中,高度相关的解释变量,在引入时会被剔除。因而也是一种检测多重共线性的有效方法。剔除。因而也是一种检测多重共线性的有效方

27、法。泛怖骏瑚骸拼怒辙锹组扫揉睦浊丫隶斌受蹦恰蝗辉孜忆蛰目护偏赡笑拆锄多元线性回归多重共线性多元线性回归多重共线性316、特征值检验法、特征值检验法埔哆录鹊锡糯熄塔鹿某犀巍荚综埔丈嚼资境很苯平穆贾祟琼紧妒委诀贱识多元线性回归多重共线性多元线性回归多重共线性32四、四、多重共线性的补救措多重共线性的补救措施施基本内容基本内容:修正多重共线性的经验方法修正多重共线性的经验方法 逐步回归法逐步回归法勃姨车珊膀断铺涅谷皱宅乘对坛牙绩衫浩民梦房型瓦咏嗜缩佐圾叭挥乃吝多元线性回归多重共线性多元线性回归多重共线性331、修正多重共线性的经验方法、修正多重共线性的经验方法 1)剔除变量法剔除变量法 是降低多重共

28、线性最简便的方法是降低多重共线性最简便的方法.把方差扩大因子最大者所对应的自变量首先把方差扩大因子最大者所对应的自变量首先剔除再重新建立回归方程,直至回归方程中剔除再重新建立回归方程,直至回归方程中不再存在严重的多重共线性。不再存在严重的多重共线性。注意注意:若剔除了重要变量,可能引起模型的设若剔除了重要变量,可能引起模型的设定误差。定误差。浓业釜履瘴炮架绦势派缮斥笨困迄租赢赞羞痴志中酷让剃耀轧矮桩敷伺玄多元线性回归多重共线性多元线性回归多重共线性34 2)增大样本容)增大样本容*样本容量增加,会减小回归参数的方差,标准误差也同样样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽

29、可能地收集足够多的样本数据可以改进会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。模型参数的估计。*样本容量越小有近似多重共线性的可能性就越大样本容量越小有近似多重共线性的可能性就越大,反之反之,样样本容量越大本容量越大,多重共线性的可能性就越小多重共线性的可能性就越小问题:问题:增加样本增加样本数据在实际计量分析中常面临许多困难数据在实际计量分析中常面临许多困难,受制于实际情况。受制于实际情况。*增大样本容量并不必然降低近似的多重共线性增大样本容量并不必然降低近似的多重共线性,如增加的数如增加的数据也有类似的共线性据也有类似的共线性,就不起作用就不起作用*如果变量总体中本来就

30、有共线性问题如果变量总体中本来就有共线性问题,再增大样本容量也无再增大样本容量也无济于事济于事.捻瘫抬恕件吕仑涣踏娟豺氧错兽碌易柠柏质瘦瞅婿裴善绎哆雹哲组蝉郡农多元线性回归多重共线性多元线性回归多重共线性35 3)变换模型形式)变换模型形式 一般而言,差分后变量之间的相关性要比差分一般而言,差分后变量之间的相关性要比差分前弱得多,所以差分后的模型可能降低出现共前弱得多,所以差分后的模型可能降低出现共线性的可能性,此时可直接估计差分方程。线性的可能性,此时可直接估计差分方程。问题:问题:差分会丢失一些信息,差分模型的误差差分会丢失一些信息,差分模型的误差项可能存在序列相关,可能会违背经典线性回项

31、可能存在序列相关,可能会违背经典线性回归模型的相关假设,在具体运用时要慎重。归模型的相关假设,在具体运用时要慎重。掉研倾亢句顺谗旧逗宪背莆蹦券块功戒限噎携迈痪煎僻萝铜辊兵搅么吹迂多元线性回归多重共线性多元线性回归多重共线性36 4)利用非样本先验信息)利用非样本先验信息 通过经济理论分析能够得到某些参数之间的关通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束系,可以将这种关系作为约束条件,将此约束条件和样本信息结合起来进行约束最小二乘估条件和样本信息结合起来进行约束最小二乘估计。计。螺伊点扦赁懂臃督杏嚏鲍猩损夹售狈般燕业真贬俗汪暴繁空漠怕惺驶卡款多元线性回归多重

32、共线性多元线性回归多重共线性37 5)横截面数据与时序数据并用)横截面数据与时序数据并用 首先利用横截面数据估计出部分参数,再利用首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整时序数据估计出另外的部分参数,最后得到整个方程参数的估计。个方程参数的估计。注意:注意:这里包含着假设,即参数的横截面估计和这里包含着假设,即参数的横截面估计和从纯粹时间序列分析中得到的估计是一样的。从纯粹时间序列分析中得到的估计是一样的。萨党牢霖塞搪练剃蟹嘉刮婉锻胰戚军捡诅宛算挽衷敛肇腕炉熙全芳兵桑丙多元线性回归多重共线性多元线性回归多重共线性38 6)变量变换)变量变换变量变换的主要

33、方法:变量变换的主要方法:(1)计算相对指标计算相对指标(2)将名义数据转换为实际数据将名义数据转换为实际数据(3)将小类指标合并成大类指标将小类指标合并成大类指标 变量数据的变换有时可得到较好的结果,但无变量数据的变换有时可得到较好的结果,但无法保证一定可以得到很好的结果。法保证一定可以得到很好的结果。儒敝忽秉瀑紊挪傈殴诉反盖候翘戌斥牺珍得筋严券当洽应棵侥掀妮寂甲峨多元线性回归多重共线性多元线性回归多重共线性39 2、逐步回归法、逐步回归法(1)用被解释变量对每一个所考虑的解释变量做简单回归。)用被解释变量对每一个所考虑的解释变量做简单回归。(2)以对被解释变量贡献最大的解释变量所对应的回归

34、方)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。的解释变量。*若新变量的引入改进了若新变量的引入改进了 和和 检验,且回归参检验,且回归参数的数的t t 检验在统计上也是显著的,则在模型中保检验在统计上也是显著的,则在模型中保留该变量。留该变量。纽视光驯振朽去憨回氰句侥冈废产墓届嫂盲媳复廖弄贤慷村啄领碳结牧待多元线性回归多重共线性多元线性回归多重共线性40*若新变量的引入未能改进若新变量的引入未能改进 和和 检验,且对其他回检验,且对其他回归参数估计值的归参数估计值的t t 检验也

35、未带来什么影响,则认为该检验也未带来什么影响,则认为该变量是多余变量。变量是多余变量。*若新变量的引入未能改进若新变量的引入未能改进 和和 检验,且显著地影检验,且显著地影响了其他回归参数估计值的数值或符号,同时本身的响了其他回归参数估计值的数值或符号,同时本身的回归参数也通不过回归参数也通不过t t 检验,说明出现了严重的多重共检验,说明出现了严重的多重共线性。线性。秸届辣欠衅暖或勋五搭央葫款看泰梭乘谍锡驳沈载液酿碌臻辜嫡黄霖夏配多元线性回归多重共线性多元线性回归多重共线性41案例分析案例分析一、研究的目的要求一、研究的目的要求提出研究的问题提出研究的问题为了规划中国未来国内旅游产业为了规划

36、中国未来国内旅游产业的发展,需要定量地分析影响中国国内旅游市场发展的发展,需要定量地分析影响中国国内旅游市场发展的主要因素。的主要因素。二、模型设定及其估计二、模型设定及其估计影响因素分析与确定影响因素分析与确定影响因素主要有国内旅游影响因素主要有国内旅游人数人数 ,城镇居民人均旅游支出,城镇居民人均旅游支出 ,农村居民人,农村居民人均均旅游支出旅游支出 ,并以公路里程次,并以公路里程次 和铁路里程和铁路里程 作为相关基础设施的代表作为相关基础设施的代表 理论模型的设定理论模型的设定其中其中:第第 t 年全国国内旅游收入年全国国内旅游收入瓦诧宛介术伏舆唱家挝鄂呻甲嗣铺拦匠也羔蹿野蠢窗僳伎还嗓祁

37、昂女洱复多元线性回归多重共线性多元线性回归多重共线性42数据的收集与处理年年份份国内旅游国内旅游收入收入Y Y(亿亿元)元)国内旅国内旅游人数游人数X2X2(万人次)(万人次)城城镇镇居民人居民人均旅游支出均旅游支出X3X3(元)(元)农农村居民人村居民人均旅游支出均旅游支出X4 X4(元)(元)公路里公路里程程 X5 X5(万公里)(万公里)铁铁路里路里程程X6X6(万公里)(万公里)199419941023.51023.55240052400414.7414.754.954.9111.78111.785.905.90199519951375.71375.76290062900464.046

38、4.061.561.5115.70115.705.975.97199619961638.41638.46390063900534.1534.170.570.5118.58118.586.496.49199719972112.72112.76440064400599.8599.8145.7145.7122.64122.646.606.60199819982391.22391.26945069450607.0607.0197.0197.0127.85127.856.646.64199919992831.92831.97190071900614.8614.8249.5249.5135.17135.1

39、76.746.74200020003175.53175.57440074400678.6678.6226.6226.6140.27140.276.876.87200120013522.43522.47840078400708.3708.3212.7212.7169.80169.807.017.01200220023878.43878.48780087800739.7739.7209.1209.1176.52176.527.197.19200320033442.33442.38700087000684.9684.9200.0200.0180.98180.987.307.30数据来源:中国统计年鉴

40、馒舌硝咱拉叁芯水鸳卜矾山丧恩饵卖瞩冶拧讶肋蚁乐般桥龚整熬焕辩听律多元线性回归多重共线性多元线性回归多重共线性43该模型,可决系数很高,F检验值173.3525,明显显著。但是当时、不仅 、系数的t检验不显著,而且 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。OLS OLS 法估计的结果法估计的结果隋宾卵弱管岩籍姚蓖介湍筑矣硬吱松啡锈奴骇瘟呀敌隘慢谈赦私韦宾缮职多元线性回归多重共线性多元线性回归多重共线性44计算各解释变量的相关系数计算各解释变量的相关系数 表明各解释变量间确实存在严重的多重共线性表明各解释变量间确实存在严重的多重共线性掌襟奖坯负芭呸颐佩帖臼闲脱障怖晾酷炬翻屑蚂泵私

41、潍多况听邢阮额梗洋多元线性回归多重共线性多元线性回归多重共线性45三、消除多重共线性三、消除多重共线性采用逐步回归法检验和解决多重供线性问题。采用逐步回归法检验和解决多重供线性问题。分别作分别作Y 对对X2、X3、X4、X5、X6的一元回归的一元回归 变变量量X2X3X4X5X6参数估参数估计值计值0.08429.052311.667334.3324 2014.146t 统计统计量量8.665913.15985.19676.46758.74870.90370.95580.77150.83940.9054的大小排序为:的大小排序为:X3、X6、X2、X5、X4。以以X3为基础,顺次加入其他变量逐

42、步回归为基础,顺次加入其他变量逐步回归燕梆画放陨谜廊腥皖狡盅绕域德住采寨泞槛肖摸盎酶潮板橙怂湛辟稚帮栗多元线性回归多重共线性多元线性回归多重共线性46 最后消除多重共线性的结果最后消除多重共线性的结果 这说这说明,在其他因素不明,在其他因素不变变的情况下,当城的情况下,当城镇镇居民人均旅游支出居民人均旅游支出 和农村居民人均旅游支出和农村居民人均旅游支出 分别增长分别增长1元时,国内旅游收入元时,国内旅游收入 将分别增长将分别增长4.21亿元和亿元和3.22 亿元。在其他因素不变的情况下,亿元。在其他因素不变的情况下,作为旅游设施的代表,公路里程作为旅游设施的代表,公路里程 每增加每增加1万公

43、里时万公里时,国内旅游国内旅游收入收入 将增长将增长13.63亿元。亿元。四、回归结果的解释与分析四、回归结果的解释与分析t=(-8.2537)(3.9502)(4.6945)(3.0633)F=231.7958 DW=1.9520晶雀屿错凹扎睦攒销焦攒拖复肘峙避谦匀娠淮裙榔琵秀死丧卯租将扁讶亿多元线性回归多重共线性多元线性回归多重共线性47 小小 结结1.多重共线性是指各个解释变量之间有准确或近似多重共线性是指各个解释变量之间有准确或近似准确的线性关系。准确的线性关系。2.多重共线性的后果:多重共线性的后果:如果各个解释变量之间有完全的共线性,则它们的如果各个解释变量之间有完全的共线性,则它

44、们的 回归系数是不确定的,并且它们的方差会无穷大。回归系数是不确定的,并且它们的方差会无穷大。如果共线性是高度的但不完全的,回归系数可估计,如果共线性是高度的但不完全的,回归系数可估计,但有较大的标准误差。回归系数不能准确地估计。但有较大的标准误差。回归系数不能准确地估计。夯九廖佐谁赊咐址抗摆妄邓当骋胸坎快捣缮淮姐久每宁惦贾栏液吊焊刻旦多元线性回归多重共线性多元线性回归多重共线性48 3.诊断共线性的经验方法:诊断共线性的经验方法:(1)表现为可决系数异常高而回归系数的表现为可决系数异常高而回归系数的t 检验不显检验不显著。著。(2)变量之间的零阶或简单相关系数。多个解释变变量之间的零阶或简单

45、相关系数。多个解释变量时,较低的零阶相关也可能出现多重共线性,需量时,较低的零阶相关也可能出现多重共线性,需要检查偏相关系数。要检查偏相关系数。(4)如果如果 高而偏相关系数低,则多重共线性是可高而偏相关系数低,则多重共线性是可能的。能的。(5)用解释变量间辅助回归的可决系数判断。用解释变量间辅助回归的可决系数判断。翁喝峰鳃阻氦汝猪湿竣豁萎镇冲钉畜苹趣博星堵勤纂拭帐腔超续双美婶销多元线性回归多重共线性多元线性回归多重共线性49 4.降低多重共线性的经验方法:降低多重共线性的经验方法:(1)利用外部或先验信息;利用外部或先验信息;(2)横截面与时间序列数据并用;横截面与时间序列数据并用;(3)剔除高度共线性的变量剔除高度共线性的变量(如逐步回归如逐步回归);(4)数据转换;数据转换;(5)获取补充数据或新数据;获取补充数据或新数据;(6)选择有偏估计量(如岭回归)。选择有偏估计量(如岭回归)。经验方法的效果取决于数据的性质和共线性的严经验方法的效果取决于数据的性质和共线性的严重程度。重程度。酌吕恩沃箭痒拱订稿襄烈兴锣晋韧位擒蓉靠罚刷砖乎艘掌吊触锰恰椅琼诛多元线性回归多重共线性多元线性回归多重共线性

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服