资源描述
建立某高校教职工的薪金数学模型
姓名:
学号:
院系:
专业: 统计学
年级:2007级
建立某高校教职工的薪金数学模型
一、摘要:本论文针对某高校为研究教职工的薪金与他们的资历、学历、职称等因素之间的关系的问题,利用多元线性回归模型建立数学模型,利用Matlab软件和SAS统计软件进行模型求解和模型分析,得出某高校教职工的薪金模型结论以便分析该高校人事策略的合理性,并为新聘用人员提供薪金的参考。从该模型可以看出影响薪金的最大因素是职称。
二、模型重述:某高校为研究教职工的薪金与他们的资历、学历、职称等因素之间的关系,根据附录表1所提供的数据请建立一个数学模型,以便分析该高校人事策略的合理性,并为新聘用人员提供薪金的参考。于是调查了68名教职工的档案资料,如表1,观察表1数据,专业技术、现行补贴、艰苦边缘津贴、住房补贴、取暖费、岗位工资、绩效工资等因素可以不在分析范围(因为数据相差不大,可以省略,且这几个因素只与学历、职称有关,所以可以不用考虑这几个因素,而考虑学历、职称等因素对薪金的影响)。由表1数据分析可以建立表2(见附录),其中资历一列指担任教师工作的年数,学历一列中0表示大学本科毕业生,1表示硕士研究生,2表示博士研究生;职称一列中0表示助教,1表示讲师,2表示副教授,3表示教授。
三:模型假设 :
在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个,这样的模型被称为多元线性回归模型。
1、利用Matlab:按照常识,薪金(这里的薪金指表1的薪级工资,以下不再做说明)自然随着资历(年)的增长而增加;职称越高,薪金也越高;学历越高,薪金越高。薪金记作y,那么资历(年)为(为表2009-1中的参加工作时间);为了表示3种学历,定义:
= , =;
这样,大学用=1, =0表示;硕士研究生用=0, =1表示;博士研究生用=0,=0表示。
为了表示4种职称,定义:
= , = , =;
这样,助教用=1,=0,=0表示;讲师用=0,=1,=0表示;副教授用=0,=0,=1表示;教授用=0,=0,=0表示。
为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每增加一年,薪金的增长是常数;职称,学历,资历诸因素之间没有交互作用,建立线性回归模型。
2、利用SAS统计软件:利用表1数据分析建立表2数据,设y表示薪金总计,x1表示资历,X2表示学历,X3表示职称。利用表2数据分析薪金与学历、资历、职称的关系。
四、建立模型:
1、Matlab软件:薪金y与资历,职称、、,学历、之间的多元线性回归模型为
.
其中,,,,,,是待估计的回归系数,是随机误差。
2、SAS统计软件:利用SAS统计软件,用insight模块做统计回归分析多元线性回归模型。
五、模型求解
1、利用Matlab,可以得到回归系数极其置信空间(置信水平默认为0.05),检验统计量 ,F,p的结果,如下表:(具体matlab程序见附录3,所有数据均取小数点后两位)。
参数
参数估计值
置信区间
312.68
[230.60 394.77]
21.29
[18.75 23.84]
-10.07
[-56.39 36.26]
-14.15
[-60.64 32.34]
-192.54
[-260.15 -124.94]
-190.47
[-245.24 -135.70]
-117.40
[-163.43 -71.37]
=0.950 F=193.10 p=0
2、SAS统计软件:利用SAS统计软件的insight拟合多元线性回归,再insight模块中打开数据SASUSER.jianmo.(事先把表2的数据导入到SAS的SASUSER中,命名为jianmo)。选择菜单Analyze—Fit(Y X)(拟合),打开Fit(Y X)对话框;在Fit(Y X)对话框中,选择变量y,单击y按钮,将y设为响应变量;选择x1、x2、x3,单击x按钮,将x1、x2、x3设为自变量。单击OK键,得出分析结果,见附录4.
六、结果分析
1、Matlab:从上表中,=0.950,即因变量(薪级工资)的95.0%可有模型确定,F的值远远大于F检验的临界值,p远小于α,因而,整个模型从整体上看是可用的。
模型中各个回归系数的含义可初步解释如下:的系数为21.29,说明资历每增长一年,薪级工资增长21.29,的系数为-10.07,说明大学学历比博士学历的薪级工资少10.07,的系数为-14.15,说明硕士学历的比博士学历的薪级工资少14.15,的系数为-192.54,说明助教比教授薪级工资少192.54,系数为-190.47,说明讲师比教授的薪级工资少190.47,的系数为-117.40,说明副教授比教授的薪级工资少117.40。
但是应该注意到和的置信区间包含零点,所以这个系数的解释并不是完全可靠的。并且需要指出,以上解释是就平均值来说的,并且,一个因素的变化引起的因变量的变化量,都是在其他因素都不变的条件下成立的。
和的置信区间包含零点,所以这个系数的解释是不可靠,这种情况下,可以用残差分析方法进行进一步分析。
在matlab中通过rcoplot语句做残差图得到下图:
观察残差图,经过放大,可以看出除了第11,13,25,54,56个数据以外,其余数据的残差距离零点均较近,说明回归模型还是能够较好的符合原始数据,另外5个异常的很有可能是由于一些我们未知原因造成的,为了不影响整个模型,那么我们应该除去上述5个异常数据。
2、SAS统计软件:由附录4的结果可以看到,模型回归方程为:y=2030.42+18.9496x1+9.5424x2+680.239x3.
R-Square为0.9287,说明这个模型可用性高;P值<0.0001,拒绝原假设并作出至少由一个回归系数部位0的结论,说明所建模型的线性关系是显著的。附录4中的表中的自变量x2的回归系数假设检验的P值较大,说明这个自变量对y的影响不显著,即学历对薪金的影响最小,职称x3对薪金的影响最大。
由回归模型方程y=2030.42+18.9496x1+9.5424x2+680.239x3可以得出新聘用人员提供薪金的参考的薪金可以定为2030.42元。
七、模型评论:本模型利用了Matlab软件和SAS统计软件针对某高校为研究教职工的薪金与他们的资历、学历、职称等因素之间的关系,分析该高校人事策略的合理性,并为新聘用人员提供薪金的参考。从这个实例我们可以看到,建立回归模型可以先根据已知的数据,从常识和经验分析,辅以作图,决定取哪几个回归变量。用软件(如Matlab统计工具箱和SAS统计软件)求解后,做统计分析:,F,P值的大小是对模型整体的评价,每个回归系数置信区间是否包含零点,可以用来检验对应的回归变量对因变量的影响是否显著(若包含零点则不显著)。但该模型不能具体得出各影响因素之间对薪金的具体影响程度,没有对异常点进行剔除后重先建立更好的模型。
参考文献:[1] 陈理荣,数学建模导论(M),北京:北京邮电大学出版社,1999.
[2]楚扬杰,快速聚类分析在产品市场区分中的应用(J),武汉理工大学学报,2004,23(2),20-23.
[3]数学建模案例分析 白其峥主编 北京:海洋出版社,2000
[4]数学建模竞赛赛题简析与论文点评:西安交大近年参赛论文选编 赫孝良等[选编] 西安:西安交通大学出版社,2002
[5]数学模型与数学建模
作者: 刘来福 曾文艺 出版社: 出版日期:1997年8月第1版 页数: 385
[6]数学建模案例精选 朱道元等编著 北京:科学出版社,2003
附录:
(表1):
参加工作时间
学历等级
聘任起始时间
专业技术职务级别
工资合计
岗位工资
1976-11-10
博士研究生
2004-3-1
教授
5111.5
1420
1994-7-5
大学本科毕业生
2000-1-1
讲师级
2860.4
680
1987-7-1
大学本科毕业生
1997-1-1
讲师级
2972.4
680
1987-7-14
大学本科毕业生
1995-1-1
讲师级
3032.4
680
1987-7-10
大学本科毕业生
1996-1-1
讲师级
3002.4
680
1990-9-1
大学本科毕业生
2009-1-1
讲师级
2888.4
680
2002-7-4
大学本科毕业生
2009-1-1
讲师级
2622.4
680
1995-7-28
大学本科毕业生
2002-1-1
讲师级
2806.4
680
1997-7-1
博士研究生
2000-1-1
讲师级
2684.4
680
1996-8-1
博士研究生
2008-7-1
讲师级
2706.4
680
1997-8-1
硕士研究生
2003-6-1
讲师级
2622.4
680
1999-9-1
硕士研究生
助教
2433
590
2005-7-1
硕士研究生
2005-7-1
助教
2455
590
2001-7-4
大学本科毕业生
2008-1-1
讲师级
2702.4
680
1994-7-1
硕士研究生
2001-1-1
讲师级
2832.4
680
2000-9-11
大学本科毕业生
2008-7-1
讲师级
2702.4
680
1998-7-4
大学本科毕业生
2005-3-1
讲师级
2706.4
680
1999-7-26
大学本科毕业生
2007-1-1
讲师级
2706.4
680
1983-7-1
硕士研究生
2001-1-1
副教授
3798.8
930
1999-10-1
大学本科毕业生
2000-8-1
助教
2477
590
2002-7-4
大学本科毕业生
2003-7-1
助教
2393
590
2003-7-1
大学本科毕业生
2004-7-1
助教
2375
590
1991-8-1
硕士研究生
2009-1-1
副教授
3578.8
930
1987-7-9
大学本科毕业生
1995-1-1
讲师级
3032.4
680
1997-7-1
硕士研究生
2000-1-1
讲师级
2860.4
680
1986-7-16
大学本科毕业生
1998-1-1
讲师级
3032.4
680
1972-12-1
大学本科毕业生
2007-1-1
教授
5071.5
1420
1992-8-1
大学本科毕业生
1998-1-1
讲师级
2916.4
680
1994-7-1
大学本科毕业生
2008-1-1
副教授
3494.8
930
1990-7-4
大学本科毕业生
2007-1-1
副教授
3646.8
930
1986-7-2
大学本科毕业生
2000-1-1
副教授
3798.8
930
1980-10-4
大学本科毕业生
2006-1-1
副教授
3798.8
930
1996-7-5
大学本科毕业生
2007-1-1
讲师级
2706.4
680
1986-7-1
大学本科毕业生
2000-1-1
副教授
3798.8
930
1982-7-15
大学本科毕业生
2006-1-1
教授
4951.5
1420
1988-7-14
大学本科毕业生
2007-1-1
副教授
3676.8
930
1994-11-1
硕士研究生
2000-1-1
讲师级
2780.4
680
2005-7-1
大学本科毕业生
2006-7-1
助教
2357
590
1998-8-1
大学本科毕业生
2007-1-1
讲师级
2706.4
680
2004-10-1
大学本科毕业生
助教
2375
590
2004-7-1
硕士研究生
2007-7-1
讲师级
2684.4
680
2001-7-4
大学本科毕业生
2001-8-1
助教
2433
590
1984-6-28
大学本科毕业生
2005-3-1
教授
4916.5
1420
1992-7-1
大学本科毕业生
1998-1-1
讲师级
2916.4
680
1986-7-1
大学本科毕业生
1987-7-1
助教
2743
590
1986-7-1
博士研究生
2006-1-1
教授
4881.5
1420
2006-7-1
大学本科毕业生
2007-7-1
助教
2357
590
1975-6-21
硕士研究生
1997-1-1
副教授
3932.8
930
1986-7-5
硕士研究生
2008-1-1
教授
4814.5
1420
1995-7-4
硕士研究生
1996-7-4
助教
2577
590
1982-8-20
硕士研究生
1998-1-1
副教授
3897.8
930
1996-7-31
大学本科毕业生
1997-7-1
助教
2551
590
1986-7-1
博士研究生
2004-3-1
副教授
3766.8
930
2008-7-1
硕士研究生
2008-7-6
助教
2393
590
2001-7-1
硕士研究生
2004-9-1
助教
2375
590
1989-8-1
硕士研究生
副教授
3562.8
930
1992-7-1
硕士研究生
副教授
3646.8
930
2003-8-1
大学本科毕业生
助教
2357
590
2003-7-1
大学本科毕业生
2004-7-1
助教
2375
590
1983-12-28
硕士研究生
2001-1-1
副教授
3736.8
930
1983-7-1
博士研究生
2000-1-1
副教授
3830.8
930
1990-7-1
硕士研究生
2009-1-1
教授
4782.5
1420
1984-3-1
硕士研究生
2000-1-1
副教授
3830.8
930
1997-7-7
博士研究生
2006-1-1
副教授
3562.8
930
1989-7-9
硕士研究生
1998-1-1
副教授
3676.8
930
1990-7-14
硕士研究生
2009-1-1
副教授
3618.8
930
1986-7-1
硕士研究生
2008-1-1
教授
4670.5
1420
1991-8-1
硕士研究生
2009-1-1
副教授
3618.8
930
薪级工资
现行补贴
艰苦边远津贴
住房补贴
取暖费
绩效工资
1064
400
200
5
227.5
1795
471
380
140
5
154.4
1030
583
380
140
5
154.4
1030
643
380
140
5
154.4
1030
613
380
140
5
154.4
1030
499
380
140
5
154.4
1030
233
380
140
5
154.4
1030
417
380
140
5
154.4
1030
295
380
140
5
154.4
1030
317
380
140
5
154.4
1030
233
380
140
5
154.4
1030
273
375
120
5
130
940
295
375
120
5
130
940
273
390
170
5
154.4
1030
443
380
140
5
154.4
1030
273
390
170
5
154.4
1030
317
380
140
5
154.4
1030
317
380
140
5
154.4
1030
735
390
170
5
178.8
1390
317
375
120
5
130
940
233
375
120
5
130
940
215
375
120
5
130
940
555
380
140
5
178.8
1390
643
380
140
5
154.4
1030
471
380
140
5
154.4
1030
643
380
140
5
154.4
1030
1024
400
200
5
227.5
1795
527
380
140
5
154.4
1030
471
380
140
5
178.8
1390
583
390
170
5
178.8
1390
735
390
170
5
178.8
1390
735
390
170
5
178.8
1390
317
380
140
5
154.4
1030
735
390
170
5
178.8
1390
904
400
200
5
227.5
1795
613
390
170
5
178.8
1390
391
380
140
5
154.4
1030
197
375
120
5
130
940
317
380
140
5
154.4
1030
215
375
120
5
130
940
295
380
140
5
154.4
1030
273
375
120
5
130
940
869
400
200
5
227.5
1795
527
380
140
5
154.4
1030
583
375
120
5
130
940
834
400
200
5
227.5
1795
197
375
120
5
130
940
869
390
170
5
178.8
1390
767
400
200
5
227.5
1795
417
375
120
5
130
940
834
390
170
5
178.8
1390
391
375
120
5
130
940
703
390
170
5
178.8
1390
233
375
120
5
130
940
215
375
120
5
130
940
499
390
170
5
178.8
1390
583
390
170
5
178.8
1390
197
375
120
5
130
940
215
375
120
5
130
940
673
390
170
5
178.8
1390
767
390
170
5
178.8
1390
735
400
200
5
227.5
1795
767
390
170
5
178.8
1390
499
390
170
5
178.8
1390
613
390
170
5
178.8
1390
555
390
170
5
178.8
1390
703
380
140
5
227.5
1795
555
390
170
5
178.8
1390
(表2):
薪金y
资历x1
学历x2
职称x3
5111.5
33
2
3
2860.4
15
0
1
2972.4
22
0
1
3032.4
22
0
1
3002.4
22
0
1
2888.4
19
0
1
2622.4
7
0
1
2806.4
14
0
1
2684.4
12
2
1
2706.4
13
2
1
2622.4
12
1
1
2455
4
1
0
2702.4
8
0
1
2832.4
15
1
1
2702.4
9
0
1
2706.4
11
0
1
2706.4
10
0
1
3798.8
26
1
2
2477
10
0
0
2393
7
0
0
2375
6
0
0
3578.8
18
1
2
3032.4
22
0
1
2860.4
12
1
1
3032.4
23
0
1
5071.5
37
0
3
2916.4
17
0
1
3494.8
15
0
2
3646.8
19
0
2
3798.8
23
0
2
3798.8
29
0
2
2706.4
13
0
1
3798.8
23
0
2
4951.5
27
0
3
3676.8
21
0
2
2780.4
15
1
1
2357
4
0
0
2706.4
11
0
1
2684.4
5
1
1
2433
8
0
0
4916.5
25
0
3
2916.4
17
0
1
2743
23
0
0
4881.5
23
2
3
2357
3
0
0
3932.8
34
1
2
4814.5
23
1
3
2577
14
1
0
3897.8
27
1
2
2551
13
0
0
3766.8
23
2
2
2393
1
1
0
2375
8
1
0
2375
6
0
0
3736.8
26
1
2
3830.8
26
2
2
4782.5
19
1
3
3830.8
25
1
2
3562.8
12
2
2
3676.8
20
1
2
3618.8
19
1
2
4670.5
23
1
3
3618.8
18
1
2
(附录3):
matlab……
clc
clear
close all
data1=load('D:\model\y.txt');
data2=load('D:\model\x1.txt');
data3=load('D:\model\x2.txt');
data4=load('D:\model\x3.txt');
data5=load('D:\model\x4.txt');
data6=load('D:\model\x5.txt');
data7=load('D:\model\x6.txt');
y=data1(:,1);
x1=data2(:,1);
x2=data3(:,1);
x3=data4(:,1);
x4=data5(:,1);
x5=data6(:,1);
x6=data7(:,1);%上述皆是导入数据部分
X=[ones(size(2009-x1)) (2009-x1) x2 x3 x4 x5 x6];%表达式
[b,bint,r,rint,stats]=regress(y,X,.05);
format long%转换为长整形,让数据显得更精确
b,bint,stats%b的结果问为参数估计值,bint的结果为置信区间,stats显示,F,p结果
rcoplot(r,rint)%对数据进行残差分析
得到的结果如下:
b =
1.0e+002 *
3.12681620091298
0.21291435664151
-0.10067664807777
-0.14150485259614
-1.92544559205533
-1.90470537248219
-1.17404710150715
bint =
1.0e+002 *
2.30597185237093 3.94766054945504
0.18745299897570 0.23837571430733
-0.56394873977389 0.36259544361835
-0.60638202409801 0.32337231890573
-2.60147828675779 -1.24941289735287
-2.45237437034618 -1.35703637461820
-1.63434875774517 -0.71374544526912
stats =
1.0e+003 *
Columns 1 through 3
0.00094998280606 0.19309676869609
Column 4
2.82851846361791
(附录4):
展开阅读全文