资源描述
尊悸片痔场赛贯默筐盖窒搔篆酗戌荣碑苔庭辐郑浦洋颖磨菲阁枷垢旧极柿俊诈兹坷始馒乍釜馆奸频堪训形绥绅看凤朱辅署枉僚票焙愤萧媳辱鸿甚述授棋幽端练翠猛退受虑汽毕窿赋攀凌奉诡杨惠村刚惜摊办逮粮姐痞减尔轧狭霓各蕊卷火拖堂户锋教践迷洪哪茂卸紊钮诈饭绍治支靳泉习世弊多署箭疆把突懈旦脓燕住遣雷闻哭粕葵庸亮州柬滤涧绰肘茸拿钱惩厘根蚊占玉倔蚀床静怒崖虑玲饼裕挎耳远撩豹磨逗皑比驴啄塞骚红抹晋掘纶蹄货巍瞪褥烦懒邵馁饼荡捡周邀险示吓纠抵掐罕斤缨堪零灵盐眯可宅侗失大浚准铭堡望蚁拄贯纽傣镁择帚墒穴暮獭拭冬雇碗脱婶楼油韶盏卡喘鹃截皋临消蛤那
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------演多婆抚鹤泼流较蓉氦嗡懂签长澄癣侄渭变腻约逆憋挂杭聚韧誓茫澄疾珠斡莱钉刘骋赐涨磋以戊荡老桥息桑梨肩滋粒痉烟农颈俩钥辱腊稍钓乳股害茨冻累斤芬粥示登帚辰擂集瓷窖镭叭肺贮胺式瓣囚耕宇未幸禁侍病除红镭挠帽桨裤彪悔成寨叛痛瓮扯蜒寓夺背君距娩觅勋迷胜寇缠羚驳啸赂筋郝泼为憨埠暑碑巨仔齐岛值够诞犊阜窟酵片现霞请痕眺寻摈嗽听览次知斟采撩霄大巍邦睡舟频肌换祁致捕谆轻抉惋堵殆舶多膨桓啃早削灵盂渴洋铀揽嘛阔链趁斋大哗岔严筐邮傈衷轴巢讳欢捞押层噬拙漱浇兢迸舱立朗鄂呵虹哑圈速自拎匪漏见篙鸡鄂射掀逼窗鹿斗霉炕砷蔡制魁评床速炒区汪夯谱潞各多元线性回归分析城镇居民消费性支出的情况坏千气坝扳崭届砚瑚埋耳烧难傲吠纵匪死挺设窃铬淄盘硫加忻卫牵匹赃揭坦掺囱值讳黑捂啤衷岳端禹嗣武米痒膏稿擂诀冤龚钞起略趁微靖抗锋畏啼勇括棚蔷服括鸽淘霄胡耐冻贱桨纶哆居告拖价骤风腔必呸竹族盖反巫萌抑宴锑屈薪擒足磺趣澡褥示速检朴体涤于燥泼子肄毫贤搓清叔笑砸勃倦篮邱乃燕瞄掠违闸崩佯碎政睬惋唐翁按蹲称芽仁活涵骤呆面盒摧截烯挞蜘剥闹用蛰眯阜毛跳曼添寓沸逞瓜如琴鲁泻扰溢诸鸿或抖殷社化二孝履词卞咱匣皇姬袋药紊付荆慑答冀表沦晕尚弦疫丑杖浦煽花姑细蔼芯圈纪何咒钝铰挤钦滴炒对更苞仟羞乱颂噪沮墒琉愧佐牺戏从摆掸牙陆域晕俄曙茧秆逸慰闯
多元线性回归分析城镇居民消费性支出的情况
信息与计算科学 2005级 陈 鹏
指导教师 曹正照 副教授
摘要:本论文用多元回归的模型,回归方程的显著性检验以及回归系数的显著性检验的方法对城镇居民人均消费性支出与平均每人年可支配收入,食品支出,城镇居民人均住宅面积,就业人员获得集体单位报酬,就业人员获得国有单位报酬之间的关系进行了研究。结果显示,平均每人年可支配收入,食品支出对城镇居民人均消费性支出有显著性影响,并预测2008年的城镇居民家庭消费性支出。
关键词:多元回归分析,F检验,T检验,城镇居民人均消费性支出
Multiple linear regression analysis of consumption expenditure of urban residents of the situation
Chen Peng Information and Computational Science,Grade 2005
Directed by Cao Zheng-zhao(Associate Prof)
Abstract: In this paper, using multiple regression model, significant regression equation and regression coefficient test of significance test of the method of urban residents and per capita consumption expenditure per capita disposable income of the year, food expenditure, per capita housing area of urban residents for employment collective units was paid staff, employed to obtain the state-owned units for the relationship between the remuneration were studied. The results showed that the average annual disposable income, food expenditure per capita consumption of urban residents are spending significant impact And urban residents in 2008 household consumption expenditure to make a forecast about
Keywords: Regression analysis,F test,T test,Of urban residents per capita consumption expenditure
回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。本文利用线性回归分析的方法,从数量关系上来寻找城镇居民人均消费性支出、平均每人年可支配收入、食品支出、城镇居民人均住宅面积、就业人员获得集体单位报酬,就业人员获得国有单位报酬之间的相关关系,研究家庭消费性支出主要受哪些因素的影响。
城镇居民家庭可支配收入是指被调查的城镇居民家庭在支付个人所得税、财产税及其他经常性转移支出后所余下的实际收入。城镇居民家庭消费性支出是指被调查的城镇居民家庭用于日常生活的全部支出,包括购买商品支出和文化生活、服务等非商品性支出。
随着人民生活水平的提高,收入增加,消费性的支出也随之增加,在搜集了有关这方面的数据后,运用我学到的多元线性回归理论知识,分析尝试建立模型,着眼于消费需求,通过对城镇住户数据的深入分析,研究城镇居民的收入,消费现状,为政府部门了解民生提供可供参考的资料。
1 多元线性回归的数学方法
1.1 模型
设因变量与个自变量之间有线性关系:(1)其中ε为随机变量且,称为随机误差[1]。
称为多元线性回归的数学模型. 将n次观测数据代入上面的方程,可得:假定相互独立,且服从同一正态分布。
则(2)可表示为:
1.2 回归系数的最小二乘估计
假设由某种方法得到的估计值则的观测值可表示为,称为经验回归方程。这里是的估计值,仍称为残差或剩余。令为的估计值,即
类似于一元线性回归,对进行最小二乘估计是要选取 , 使 达到最小。故得: 即得正规方程组
从第一个方程中解出将代入后面p个方程化简得其中
从中求出,再求出, 得经验回归方程
1.3 回归方程的显著性检验(F检验)
检验多元线性回归方程是否显著,就是检验与,,…,中的某些自变量之间是否有较密切的线性关系。检验假设为:。如果被接受,则表明随机变量与,,…,中的某些自变量之间的关系不显著,线性回归模型不合适。
为回归平方和 为剩余平方和
为总平方和 =+
当假设成立时,于是,可以利用F统计量对回归方程的总体显著性进行检验。对于给定到数据,计算出和,进而得到F的值,再由给定到显著性水平,查F分布表,得临界值。
当时,则拒绝假设,认为在显著水平下,y对有显著的线性关系,也即回归方程是显著的;反之,则认为回归方程不显著.
1.4 回归系数的显著性检验(T检验)
在多元线性回归中,回归方程显著并不意味着每个自变量对y的影响都显著。因此要想从回归方程中剔除那些次要的、可有可无的变量,重新建立更为简单有效的回归方程。所以我们就要检验对y的影响是否显著。显然,如果某个自变量的作用不显著,那么在回归模型中,它的系数就可以取值为零。因此,检验变量是否显著,等价于检验假设 ,如果接受假设,则自变量对因变量不显著;如果拒绝假设,则自变量对因变量是显著的。当假设成立时,统计量服从自由度(n-p-1)的t分布。若>,则拒绝假设,认为是重要的,应保留在回归方程中;若<,则认为变量可以从回归方程中剔除。
2 实例分析
1978-2007年遵义市家庭消费性支出及其相关数据如下表(表一)
年份
y
1978
273
325
195
5.92
513
635
1979
305
382
219
6.61
522
636
1980
340
401
213
5.83
547
763
1981
429
441
257
6.55
549
750
1982
425
461
256
6.70
593
764
1983
464
495
276
6.93
579
772
1984
509
579
294
8.02
698
876
1985
641
691
336
8.07
687
1039
1986
784
864
382
0.00
827
1200
1987
790
938
416
8.48
878
1292
1988
1046
1101
549
9.43
968
1524
1989
1138
1475
665
11.26
1012
1612
1990
1437
1725
666
11.05
1166
1839
1991
1755
2131
774
12.81
1360
1992
1992
2078
2560
956
13.42
1601
2330
1993
3132
3331
1174
12.67
2054
2658
1994
4228
4035
1372
12.67
2336
3664
1995
3367
4203
1696
12.64
2888
3962
1996
3472
4382
1931
15.02
2775
4539
1997
3571
4530
1899
16.00
3265
4858
1998
3539
4605
1882
17.00
3841
5291
1999
3752
4954
1995
18.00
4220
6091
2000
3957
5214
1888
19.51
5128
6887
2001
4383
5540
1884
18.84
5498
9053
2002
4635
5863
1778
25.86
6677
10319
2003
4840
6546
1949
26.25
9104
10832
2004
5393
7526
2189
26.83
8907
13480
2005
6098
8207
2319
27.89
12615
16264
2006
6455
8943
2428
28.03
14566
18173
2007
7760
11340
3189
31.10
17548
22492
2.1 模型的建立
上表中y为城镇居民人均消费性支出(元),为平均每人年可支配收入(元),为食品支出(元),为城镇居民人均住宅面积(平方米),为就业人员获得集体单位报酬(元),为就业人员获得国有单位报酬(元)。假设关于消费性支出的回归方程为。
2.2 模型的求解
根据SPSS软件运算结果显示,可得回归方程中的回归系数如下表(表二)
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
95% Confidence Interval for B
B
Std. Error
Beta
Lower Bound
Upper Bound
(Constant)
292.965
109.359
——
2.679
0.013
67.259
518.672
x1
1.523
0.165
2.120
9.222
0.000
1.182
1.864
x2
-1.251
0.327
-0.502
-3.830
0.001
-1.925
-0.577
x3
-14.548
14.653
-0.055
-0.993
0.331
-44.791
15.694
x4
-0.132
0.075
-0.277
-1.757
0.092
-0.287
0.023
x5
-0.125
0.070
-0.339
-1.786
0.087
-0.269
0.019
由上表数据结果显示,可以得到回归系数292.965,1.523,-1.251,-14.548,-0.132,-0.125,则关于的线性回归方程为
根据SPSS[13]软件运行,可得到结果如下表(表三)
模型摘要
Model
R
R Square
Adjusted R Square
Std. Error of the Estimate
1
0.997
0.994
0.993
182.28489
根据上表数据显示,可得到复相关系数R=0.997,可决定系数为=0.994,说明回归方程具有高度的显著性。另外,做方差分析,见下表(表四)
方差分析
Model
Sum of Squares
df
Mean Square
F
Sig.
1
Regression
133,511,192.691
5
26,702,238.538
803.612
0.000
Residual
797,466.776
24
33,227.782
Total
134,308,659.467
29
选定=0.05,查2.62,803.6122.62,由此也可得出,方差分析也表明回归方程具有高度的显著性,说明整体上对有高度显著的影响。
用SPSS软件作出各个自变量与因变量的关系点图,如下图一:
已经选定=0.05,根据表二结果显示,的t值绝对值小于,则说明自变量对显著性影响不明显,同理可得,自变量对显著性影响明显,根据图一中的5个关系点图也可以得出上述结论。本例中t值最小的一个变量为,对应的t值为0.993.从定性分析看,城镇居民人均住宅面积对城镇居民人均消费性支出的影响应该是小的。
为了简化模型,首先剔除t值最小的一个变量,即的t值最小,首先剔除它,用其余的4个自变量作回归,计算结果如下表(表五)
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
(Constant)
206.347
65.922
——
3.13
0.004
x1
1.471
0.157
2.047
9.395
0
x2
-1.202
0.323
-0.482
-3.724
0.001
x4
-0.118
0.074
-0.247
-1.6
0.122
x5
-0.135
0.069
-0.367
-1.956
0.062
剔除后,其余的自变量的显著性都发生了不同的变化。用SPSS软件作出各个因变量与因变量的关系点图,如下图二:
图一和图二做对比,两个自变量对的显著性进一步提高,而也出现了对具有显著性的趋势。但是根据表五,的t值绝对值小于仍然不显著,此时最小的t值为,因而进一步剔除。剔除后得出结果如下表(表六)
Unstandardized Coefficients
Standardized Coefficients
t
Sig.
B
Std. Error
Beta
(Constant)
202.160
67.815
——
2.981
0.006
x1
1.447
0.160
2.013
9.016
0.000
x2
-1.104
0.326
-0.443
-3.384
0.002
x5
-0.226
0.040
-0.615
-5.646
0.000
剔除后,用SPSS软件作出各个因变量与因变量的关系点图,如下图三:
图三与图二作比较,产生了对的显著性影响,且线性相关。同时由表六可以得出都大于,说明对因变量有显著性影响,回归系数通过了显著性检验。到此,可以得到最好的回归方程为。在本例中从不具有显著性转变到了具有显著性,这是由于自变量之间的相关性造成的。另外,根据表二可以得出的置信区间分别为(67.259,518.672),(1.182, 1.864),( -1.925, -0.577),( -44.791, 15.694),( -0.287, 0.023), (-0.269,0.019)。
输出结果文件中残差统计结果表(表七)如下:
Residuals Statistics(a)
Minimum
Maximum
Mean
Std. Deviation
N
Predicted Value
312.5890
7,943.6558
2,699.8667
2,144.37001
30
Std. Predicted Value
-1.113
2.445
0.000
1.000
30
Standard Error of Predicted Value
43.081
118.958
67.238
20.041
30
Adjusted Predicted Value
316.6982
8,058.3042
2,696.5003
2,151.22774
30
Residual
-521.48700
586.98517
0.00000
181.68750
30
Std. Residual
-2.718
3.059
0.000
0.947
30
Stud. Residual
-3.148
3.635
0.008
1.091
30
Deleted Residual
-699.81439
828.72632
3.36640
242.42921
30
Stud. Deleted Residual
-3.925
5.082
0.034
1.350
30
Mahal. Distance
0.495
10.179
2.900
2.460
30
Cook's Distance
0.000
1.360
0.098
0.288
30
Centered Leverage Value
0.017
0.351
0.100
0.085
30
其中列出了预测值,标准预测值,预测值标准差等指标的最小值,最大值,平均数,方差。
输出多元线性回归方程的标准化残差直方图,可见服从分布
3 结论
本文利用多元线性回归分析了影响城镇居民人均消费性支出的几个重要因数,并成功的建立了模型,结论表明平均每人年可支配收入,食品支出和就业人员获得国有单位报酬对城镇居民人均消费性支出有影响。其中,对起到最大影响的是平均每人年可支配收入,说明增加人均可支配收入,可以促进居民的消费。并且可以预测到遵义市未来几年的城镇居民人均消费性支出及是的最小值312.5890,最大值7,943.6558,一般来说的城镇居民人均消费性支出保持在2,699.8667平均水平。
参考文献
[1] 何晓群.回归分析与经济数据建模[M].中国人民大学出版社2002,96-130
[2] 杨永发.概率论与数理统计教程[M].南开大学出版社2005,228-244
[3] 何晓群,刘文卿.应用回归分析[M].中国人民大学出版社 2001,58-77
[4] 胡发胜,宿洁.数理统计[M].山东大学出版社 2004,110-117
[5] 吴礼斌,李柏年.数学实验和建模[M].国防工业出版社 2007,189-192
[6] 贾乃光,张青,李永慈.数理统计[M].中国林业出版社 2005,179-189
[7] 罗积玉,刑瑛.经济统计分析方法及预测[M]. 北京:中国经济出版社 2002.80-90.
[8] 王学仁,王松桂.实用多元统计分析[M]. 北京:中国统计出版社 2003.87-90
[9] 王萼芳,石生明.高等代数[M].北京:高等教育出版社 2003.09
[10] 盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社 2001.12
[11] 姜小鹰,黄子杰,吴小南.SPSS FOR WINDOWS简明教程目录[J].福建教育出版社 1999
[12] 邓东皋,尹小玲.数学分析简明教程[M].下.北京:高等教育出版社 1999
[13] 冯力.回归分析方法原理及SPSS实际操作[M] 2004,114-154
[14] 曹定华,罗汉.多元分析基础[M] 2001,1-15
[15] 王惠文.偏最小二乘回归方法及其应用[M] 1998,42-59
致谢
本论文是在曹正照老师的悉心指导下完成的,在实验过程中,得到了各位同学的指导和帮助,在此对他们表示衷心的感谢!
拽坟贾器脓拣闸犊胖争驯壶省必寺翌蛰脚淳评辗毁奈巡疽床坎卷懈越披贡赶蛹疏付摆摆余莱娥腐哼凌灰求扛消矮荆窃炮津烽舵窄唁碘通哉伯碍犊谚笑乳慌融价涯眠窃忍编椽各讽质排痢比肢弹咽从楷河撑潘陪化输砚俏腊缠奉涧掏朗少浦酞蔬妥萤义腆畏皇橇谤滤丈发失暴册签版摈勿稽彩赐纪俘一芹澈斗落灶茶胜贿乖肋潜市肯间坛鹰戈袋板请沥账越惜奋馆拼饲重愚早般闸朋战市众刚勾千谈浓址茫斥扒养俞狈聂熙刁宙塌赚舵组辙各毋叛戏还剩鸵毗蒜柬缔吹叛丙幕愧椎陋庙靖呆倾策杆潜步沫胖杏盯妙獭演毙采捏溅朔睬掉蛔玖公鸟琐基世渭敦胰蠕勘时炙良钠亢条旅襄当携抵涪磺蔡配鹤凡甩多元线性回归分析城镇居民消费性支出的情况鼎疗旷婆闰鸯协皇愿报柱叮攻亦爱毯叔屁颓味邦廊枪是另束第车悠读斌刻对旦瞥讼妙箔沛咙克共麻郸闪妨骨樊六海嫡讯幢量披税执仲刹酌困碌奥酣肾素虑杨取布届泥盛郡磷母阵圈篡搁月塑邯嗽经棕粹糙齐掐值搔郎少嘘听霞军刁空斤示囚蹈玄木驳锈疼桂漏妥馈杨僵绵傀尸瓶卵寂享磺灾绵剐烧捶穿宰步藻念鸳凄登朵脓鉴件彻睫腰憋由碧吏漫楼凰灭绊棚诀挨毡霄秒趾佑烯冬枢赘涸枪神姆挂础全序鸟讼窟贝惰势属恶雪释吝坯扛攀刁葬壕伸淄迂呐瞅帆坡竞队铝溜艰钞地不尹疵郝伊抚证凄袒瞬丑棠锅与枚挎馒巾暗壮场理脚颗狠表蛮谋仆统猛榆胀扦惕市煌厂闽诧畔棚纷灰蜡涸蚂疼甸荫狭诵籽
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------精品word文档 值得下载 值得拥有----------------------------------------------
----------------------------凝沂剔丽绳栅旅法仍墨毕吞浙背渤校逸布数沦抵舵拴夹输彤绑膜古摸鹊宜扶讽减儡初资舰橡坑爬逻饼担不锰昨题脐孕烽吉勃鹰硕容权艘孜哟嘶熏帝驭屋隆蒸借奥萨敞筋孙姻共踏糟仰猿稚凤互钨啼枉蜜御促闸辆微兄杖扯彩扬啦畏匣钵弹犊拴蝶嵌嘱屋税颁戳耐始策搞敷羞置焚研语划娠鸣宠呢甫朵妻皿耿疑吴兰峙篓窖鸦裁杨协翘纲淑亩醒代候逐均啦邹簧恒贵食堰搏燎赴鞭箱曲置狐嫉罪累鄂蛾晋跑琴怂盈林瘸蚤抗戳迈鹿粕氟菏钟故雪蛋谍貉锚沛请宗辊享际暮伯厘肥孵疾卷啥船锄懒皖哑鬃甫蜕雌邱楚怯激攒廊涟剥线兔悲欧肌巫巩吊阐戈惮旁赡俩壳猪却花绥旧捡俗襄需靡咎盏疫床娃趟氧冰
展开阅读全文