1、建立某高校教职工的薪金数学模型 姓名: 学号:院系:专业: 统计学年级:2007级建立某高校教职工的薪金数学模型一、摘要:本论文针对某高校为研究教职工的薪金与他们的资历、学历、职称等因素之间的关系的问题,利用多元线性回归模型建立数学模型,利用Matlab软件和SAS统计软件进行模型求解和模型分析,得出某高校教职工的薪金模型结论以便分析该高校人事策略的合理性,并为新聘用人员提供薪金的参考。从该模型可以看出影响薪金的最大因素是职称。二、模型重述:某高校为研究教职工的薪金与他们的资历、学历、职称等因素之间的关系,根据附录表1所提供的数据请建立一个数学模型,以便分析该高校人事策略的合理性,并为新聘用人
2、员提供薪金的参考。于是调查了68名教职工的档案资料,如表1,观察表1数据,专业技术、现行补贴、艰苦边缘津贴、住房补贴、取暖费、岗位工资、绩效工资等因素可以不在分析范围(因为数据相差不大,可以省略,且这几个因素只与学历、职称有关,所以可以不用考虑这几个因素,而考虑学历、职称等因素对薪金的影响)。由表1数据分析可以建立表2(见附录),其中资历一列指担任教师工作的年数,学历一列中0表示大学本科毕业生,1表示硕士研究生,2表示博士研究生;职称一列中0表示助教,1表示讲师,2表示副教授,3表示教授。三:模型假设 : 在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收
3、入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个,这样的模型被称为多元线性回归模型。1、利用Matlab:按照常识,薪金(这里的薪金指表1的薪级工资,以下不再做说明)自然随着资历(年)的增长而增加;职称越高,薪金也越高;学历越高,薪金越高。薪金记作y,那么资历(年)为(为表2009-1中的参加工作时间);为了表示3种学历,定义: = , =;这样,大学用=1, =0表示;硕士研究生用=0, =1表示;博士研究生用=0,=0表示。 为了表示4种职称,定义:= , = , =;这样,助教用=1,=0,=0表示;讲师用=0,=1,=
4、0表示;副教授用=0,=0,=1表示;教授用=0,=0,=0表示。为了简单起见,我们假定资历(年)对薪金的作用是线性的,即资历每增加一年,薪金的增长是常数;职称,学历,资历诸因素之间没有交互作用,建立线性回归模型。2、利用SAS统计软件:利用表1数据分析建立表2数据,设y表示薪金总计,x1表示资历,X2表示学历,X3表示职称。利用表2数据分析薪金与学历、资历、职称的关系。四、建立模型:1、Matlab软件:薪金y与资历,职称、,学历、之间的多元线性回归模型为.其中,是待估计的回归系数,是随机误差。2、SAS统计软件:利用SAS统计软件,用insight模块做统计回归分析多元线性回归模型。五、模
5、型求解1、利用Matlab,可以得到回归系数极其置信空间(置信水平默认为0.05),检验统计量 ,F,p的结果,如下表:(具体matlab程序见附录3,所有数据均取小数点后两位)。参数参数估计值置信区间312.68230.60 394.7721.2918.75 23.84-10.07-56.39 36.26-14.15-60.64 32.34-192.54-260.15 -124.94-190.47-245.24 -135.70-117.40-163.43 -71.37=0.950 F=193.10 p=02、SAS统计软件:利用SAS统计软件的insight拟合多元线性回归,再insight
6、模块中打开数据SASUSER.jianmo.(事先把表2的数据导入到SAS的SASUSER中,命名为jianmo)。选择菜单AnalyzeFit(Y X)(拟合),打开Fit(Y X)对话框;在Fit(Y X)对话框中,选择变量y,单击y按钮,将y设为响应变量;选择x1、x2、x3,单击x按钮,将x1、x2、x3设为自变量。单击OK键,得出分析结果,见附录4.六、结果分析 1、Matlab:从上表中,=0.950,即因变量(薪级工资)的95.0%可有模型确定,F的值远远大于F检验的临界值,p远小于,因而,整个模型从整体上看是可用的。 模型中各个回归系数的含义可初步解释如下:的系数为21.29,
7、说明资历每增长一年,薪级工资增长21.29,的系数为-10.07,说明大学学历比博士学历的薪级工资少10.07,的系数为-14.15,说明硕士学历的比博士学历的薪级工资少14.15,的系数为-192.54,说明助教比教授薪级工资少192.54,系数为-190.47,说明讲师比教授的薪级工资少190.47,的系数为-117.40,说明副教授比教授的薪级工资少117.40。 但是应该注意到和的置信区间包含零点,所以这个系数的解释并不是完全可靠的。并且需要指出,以上解释是就平均值来说的,并且,一个因素的变化引起的因变量的变化量,都是在其他因素都不变的条件下成立的。和的置信区间包含零点,所以这个系数的
8、解释是不可靠,这种情况下,可以用残差分析方法进行进一步分析。在matlab中通过rcoplot语句做残差图得到下图:观察残差图,经过放大,可以看出除了第11,13,25,54,56个数据以外,其余数据的残差距离零点均较近,说明回归模型还是能够较好的符合原始数据,另外5个异常的很有可能是由于一些我们未知原因造成的,为了不影响整个模型,那么我们应该除去上述5个异常数据。2、SAS统计软件:由附录4的结果可以看到,模型回归方程为:y=2030.42+18.9496x1+9.5424x2+680.239x3.R-Square为0.9287,说明这个模型可用性高;P值0.0001,拒绝原假设并作出至少由
9、一个回归系数部位0的结论,说明所建模型的线性关系是显著的。附录4中的表中的自变量x2的回归系数假设检验的P值较大,说明这个自变量对y的影响不显著,即学历对薪金的影响最小,职称x3对薪金的影响最大。由回归模型方程y=2030.42+18.9496x1+9.5424x2+680.239x3可以得出新聘用人员提供薪金的参考的薪金可以定为2030.42元。七、模型评论:本模型利用了Matlab软件和SAS统计软件针对某高校为研究教职工的薪金与他们的资历、学历、职称等因素之间的关系,分析该高校人事策略的合理性,并为新聘用人员提供薪金的参考。从这个实例我们可以看到,建立回归模型可以先根据已知的数据,从常识
10、和经验分析,辅以作图,决定取哪几个回归变量。用软件(如Matlab统计工具箱和SAS统计软件)求解后,做统计分析:,F,P值的大小是对模型整体的评价,每个回归系数置信区间是否包含零点,可以用来检验对应的回归变量对因变量的影响是否显著(若包含零点则不显著)。但该模型不能具体得出各影响因素之间对薪金的具体影响程度,没有对异常点进行剔除后重先建立更好的模型。参考文献:1 陈理荣,数学建模导论(M),北京:北京邮电大学出版社,1999.2楚扬杰,快速聚类分析在产品市场区分中的应用(J),武汉理工大学学报,2004,23(2),2023. 3数学建模案例分析 白其峥主编 北京:海洋出版社,2000 4数
11、学建模竞赛赛题简析与论文点评:西安交大近年参赛论文选编 赫孝良等选编 西安:西安交通大学出版社,20025数学模型与数学建模 作者: 刘来福 曾文艺 出版社: 出版日期:1997年8月第1版 页数: 385 6数学建模案例精选 朱道元等编著 北京:科学出版社,2003附录:(表1):参加工作时间学历等级聘任起始时间专业技术职务级别工资合计岗位工资1976-11-10博士研究生2004-3-1教授5111.514201994-7-5大学本科毕业生2000-1-1讲师级2860.46801987-7-1大学本科毕业生1997-1-1讲师级2972.46801987-7-14大学本科毕业生1995-
12、1-1讲师级3032.46801987-7-10大学本科毕业生1996-1-1讲师级3002.46801990-9-1大学本科毕业生2009-1-1讲师级2888.46802002-7-4大学本科毕业生2009-1-1讲师级2622.46801995-7-28大学本科毕业生2002-1-1讲师级2806.46801997-7-1博士研究生2000-1-1讲师级2684.46801996-8-1博士研究生2008-7-1讲师级2706.46801997-8-1硕士研究生2003-6-1讲师级2622.46801999-9-1硕士研究生助教24335902005-7-1硕士研究生2005-7-1助
13、教24555902001-7-4大学本科毕业生2008-1-1讲师级2702.46801994-7-1硕士研究生2001-1-1讲师级2832.46802000-9-11大学本科毕业生2008-7-1讲师级2702.46801998-7-4大学本科毕业生2005-3-1讲师级2706.46801999-7-26大学本科毕业生2007-1-1讲师级2706.46801983-7-1硕士研究生2001-1-1副教授3798.89301999-10-1大学本科毕业生2000-8-1助教24775902002-7-4大学本科毕业生2003-7-1助教23935902003-7-1大学本科毕业生2004
14、-7-1助教23755901991-8-1硕士研究生2009-1-1副教授3578.89301987-7-9大学本科毕业生1995-1-1讲师级3032.46801997-7-1硕士研究生2000-1-1讲师级2860.46801986-7-16大学本科毕业生1998-1-1讲师级3032.46801972-12-1大学本科毕业生2007-1-1教授5071.514201992-8-1大学本科毕业生1998-1-1讲师级2916.46801994-7-1大学本科毕业生2008-1-1副教授3494.89301990-7-4大学本科毕业生2007-1-1副教授3646.89301986-7-2大
15、学本科毕业生2000-1-1副教授3798.89301980-10-4大学本科毕业生2006-1-1副教授3798.89301996-7-5大学本科毕业生2007-1-1讲师级2706.46801986-7-1大学本科毕业生2000-1-1副教授3798.89301982-7-15大学本科毕业生2006-1-1教授4951.514201988-7-14大学本科毕业生2007-1-1副教授3676.89301994-11-1硕士研究生2000-1-1讲师级2780.46802005-7-1大学本科毕业生2006-7-1助教23575901998-8-1大学本科毕业生2007-1-1讲师级2706
16、.46802004-10-1大学本科毕业生助教23755902004-7-1硕士研究生2007-7-1讲师级2684.46802001-7-4大学本科毕业生2001-8-1助教24335901984-6-28大学本科毕业生2005-3-1教授4916.514201992-7-1大学本科毕业生1998-1-1讲师级2916.46801986-7-1大学本科毕业生1987-7-1助教27435901986-7-1博士研究生2006-1-1教授4881.514202006-7-1大学本科毕业生2007-7-1助教23575901975-6-21硕士研究生1997-1-1副教授3932.8930198
17、6-7-5硕士研究生2008-1-1教授4814.514201995-7-4硕士研究生1996-7-4助教25775901982-8-20硕士研究生1998-1-1副教授3897.89301996-7-31大学本科毕业生1997-7-1助教25515901986-7-1博士研究生2004-3-1副教授3766.89302008-7-1硕士研究生2008-7-6助教23935902001-7-1硕士研究生2004-9-1助教23755901989-8-1硕士研究生副教授3562.89301992-7-1硕士研究生副教授3646.89302003-8-1大学本科毕业生助教23575902003-7
18、-1大学本科毕业生2004-7-1助教23755901983-12-28硕士研究生2001-1-1副教授3736.89301983-7-1博士研究生2000-1-1副教授3830.89301990-7-1硕士研究生2009-1-1教授4782.514201984-3-1硕士研究生2000-1-1副教授3830.89301997-7-7博士研究生2006-1-1副教授3562.89301989-7-9硕士研究生1998-1-1副教授3676.89301990-7-14硕士研究生2009-1-1副教授3618.89301986-7-1硕士研究生2008-1-1教授4670.514201991-8-
19、1硕士研究生2009-1-1副教授3618.8930薪级工资现行补贴艰苦边远津贴住房补贴取暖费绩效工资10644002005227.517954713801405154.410305833801405154.410306433801405154.410306133801405154.410304993801405154.410302333801405154.410304173801405154.410302953801405154.410303173801405154.410302333801405154.41030273375120513094029537512051309402733901
20、705154.410304433801405154.410302733901705154.410303173801405154.410303173801405154.410307353901705178.813903173751205130940233375120513094021537512051309405553801405178.813906433801405154.410304713801405154.410306433801405154.4103010244002005227.517955273801405154.410304713801405178.8139058339017051
21、78.813907353901705178.813907353901705178.813903173801405154.410307353901705178.813909044002005227.517956133901705178.813903913801405154.4103019737512051309403173801405154.4103021537512051309402953801405154.4103027337512051309408694002005227.517955273801405154.4103058337512051309408344002005227.51795
22、19737512051309408693901705178.813907674002005227.5179541737512051309408343901705178.8139039137512051309407033901705178.81390233375120513094021537512051309404993901705178.813905833901705178.81390197375120513094021537512051309406733901705178.813907673901705178.813907354002005227.517957673901705178.813
23、904993901705178.813906133901705178.813905553901705178.813907033801405227.517955553901705178.81390(表2):薪金y资历x1学历x2职称x35111.533232860.415012972.422013032.422013002.422012888.419012622.47012806.414012684.412212706.413212622.4121124554102702.48012832.415112702.49012706.411012706.410013798.82612247710002
24、39370023756003578.818123032.422012860.412113032.423015071.537032916.417013494.815023646.819023798.823023798.829022706.413013798.823024951.527033676.821022780.4151123574002706.411012684.451124338004916.525032916.41701274323004881.5232323573003932.834124814.52313257714103897.82712255113003766.82322239
25、3110237581023756003736.826123830.826224782.519133830.825123562.812223676.820123618.819124670.523133618.81812(附录3):matlabclcclearclose alldata1=load(D:modely.txt);data2=load(D:modelx1.txt);data3=load(D:modelx2.txt);data4=load(D:modelx3.txt);data5=load(D:modelx4.txt);data6=load(D:modelx5.txt);data7=lo
26、ad(D:modelx6.txt);y=data1(:,1);x1=data2(:,1);x2=data3(:,1);x3=data4(:,1);x4=data5(:,1);x5=data6(:,1);x6=data7(:,1);%上述皆是导入数据部分X=ones(size(2009-x1) (2009-x1) x2 x3 x4 x5 x6;%表达式b,bint,r,rint,stats=regress(y,X,.05);format long%转换为长整形,让数据显得更精确b,bint,stats%b的结果问为参数估计值,bint的结果为置信区间,stats显示,F,p结果rcoplot(r
27、,rint)%对数据进行残差分析得到的结果如下: b = 1.0e+002 * 3.12681620091298 0.21291435664151 -0.10067664807777 -0.14150485259614 -1.92544559205533 -1.90470537248219 -1.17404710150715bint = 1.0e+002 * 2.30597185237093 3.94766054945504 0.18745299897570 0.23837571430733 -0.56394873977389 0.36259544361835 -0.60638202409801 0.32337231890573 -2.60147828675779 -1.24941289735287 -2.45237437034618 -1.35703637461820 -1.63434875774517 -0.71374544526912stats = 1.0e+003 * Columns 1 through 3 0.00094998280606 0.19309676869609 Column 4 2.82851846361791(附录4):