资源描述
*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,西南科技大学生命科学与工程学院周海廷制作,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第讲多元线性回归,PROC REG;,MODEL y=x1 x2;,RUN;,以上是程序的参数估计结果,不难看出截距项可以去掉。,2025/10/30 周四,2,558510可知,自变量之间有较强的共线性;从该行方差分量的数值可看出自变量之间的共线性主要表现在X2、X3两变量上。,这是共线性诊断的第部分,即对截距项校正之后的回归诊断结果因本例的截距项无显著性意义,故用第部分诊断结果就可以了。,DATA d4p16a;,Stepwise Procedure for Dependent Variable Y,3000 significance level for entry into the model.,线性回归方程的估计标准误为:,共线性诊断选择项,对截距未进行校正,微量元素中铁(X3)的含量对血红蛋白(Y)的影响有非常显著性意义。,微量元素中铁(X3)的含量对血红蛋白(Y)的影响有非常显著性意义。,No other variable met the 0.,共线性诊断选择项,对截距进行校正,DATA abc2;,SET D4P15;,PROC REG;,MODEL y=x1 x2/NOINT P R;,RUN;,将截距项去掉,计算各点上因变量的预测值,进行残差分析,2025/10/30 周四,3,2025/10/30 周四,4,这是程序的方差分析和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元线性回归方程为,:,线性回归方程的估计标准误为:,2025/10/30 周四,5,2025/10/30 周四,6,这是对程序中的二元回归模型作残差分析的结果,从第、两列发现第个观测点所对应的学生化残差的绝对值大于,(,因,STUDENT=-2.170),,故认为该点可能是异常点,需认真检查核对原始数据。,2025/10/30 周四,7,DATA abc3;,SET D4P15;,IF _N_=8 THEN DELETE;,PROC REG;,MODEL y=x1 x2/NOINT P R;,RUN;,2025/10/30 周四,8,2025/10/30 周四,9,这是程序的方差分析和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元线性回归方程为,线性回归方程的估计标准误为:,2025/10/30 周四,10,2025/10/30 周四,11,比较第个观测点去掉前后预测平和,Press,的值从降为;对整个方程检验的,F,值从上升为;,线性回归方程的估计标准误由下降为,,表明该点对因变量预测值的影响是比较大的,值得注意。,2025/10/30 周四,12,例,2.2,有人在某地抽样调查了,29,例儿童的血红蛋白与种微量元素的含量,资料如下,试问可否用种微量元素,(,单位都是,mol/L),钙,(X1),、镁,(X2),、铁,(X3),、铜,(X4),来较好地预测血红蛋白,(Y,,,g/L),的含量?,SAS,程序:,DATA d4p16a;,INPUT y x1-x4;,CARDS;,.,;,2025/10/30 周四,13,PROC reg;,MODEL y=x1-x4/COLLIN COLLINOINT;,RUN;,先用程序作试探性分析,并用了共线性诊断的技术。,共线性诊断选择项,对截距未进行校正,共线性诊断选择项,对截距进行校正,2025/10/30 周四,14,输出结果及其解释,2025/10/30 周四,15,程序的参数估计结果截距项、,X,2,、,X,4,都无显著性意义,但不应过早将,X,2,、,X,4,从模型中去掉。最好等截距项从模型中去掉之后,重新拟合,视最后的结果再作决定。,2025/10/30 周四,16,这是共线性诊断的第部分,即未对截距项校正的回归诊断结果从最后一行的条件数25.558510可知,自变量之间有较强的共线性;从该行方差分量的数值可看出自变量之间的共线性主要表现在X2、X3两变量上。,2025/10/30 周四,17,这是共线性诊断的第部分,即对截距项校正之后的回归诊断结果因本例的截距项无显著性意义,故用第部分诊断结果就可以了。,2025/10/30 周四,18,MODEL y=x1-x4/NOINT SELECTION=STEPWISE SLE=0.,对整个方程检验的F值从上升为;,线性回归方程的估计标准误为:,MODEL y=x1 x2;,Step 1 X3 Entered,Stepwise Procedure for Dependent Variable Y,No other variable met the 0.,计算各点上因变量的预测值,微量元素中铁(X3)的含量对血红蛋白(Y)的影响有非常显著性意义。,这是程序的方差分析和参数估计结果,方程与各参数的检验结果都有显著性意义,所求得的二元线性回归方程为,比较第个观测点去掉前后预测平和Press的值从降为;,两个标准化回归系数分别为、,,最好等截距项从模型中去掉之后,重新拟合,视最后的结果再作决定。,IF _N_=8 THEN DELETE;,1000 level.,这是共线性诊断的第部分,即对截距项校正之后的回归诊断结果因本例的截距项无显著性意义,故用第部分诊断结果就可以了。,最好等截距项从模型中去掉之后,重新拟合,视最后的结果再作决定。,data d4p16b;,set d4p16a;,PROC REG;,MODEL y=x1-x4/NOINT SELECTION=STEPWISE SLE=0.30 SLS=0.10 STB;,RUN;,用逐步回归法筛选自变量,变量进入方程的显著性水平,剔除变量的显著性水平,求出标准化回归参数,2025/10/30 周四,19,Stepwise Procedure for Dependent Variable Y,Step 1 X3 Entered,Step 2 X1 Entered,Step 3 X4 Entered,All variables in the model are significant at the 0.1000 level.,No other variable met the 0.3000 significance level for entry into the model.,2025/10/30 周四,20,这是程序中逐步回归分析的扼要结果,详细结果省略了。筛选的结果表明,X,3,是有非常显著性影响的变量;而,X,1,仅在水平上有显著性意义,若规定,则回归方程中只有,X,3,一个自变量。,2025/10/30 周四,21,2025/10/30 周四,22,这是逐步回归分析的最后结果,回归方程为,两个标准化回归系数分别为、,,结合前面共线性诊断的结果可知,,X1,与,X3,之间无密切的相关关系,故可认为,X3,对,Y,的影响大于,X1,。,2025/10/30 周四,23,专业结论,微量元素中铁,(X3),的含量对血红蛋白,(Y),的影响有非常显著性意义。,铁的吸收量提高后,有助于血红蛋白含量的提高,(,因,B,3,),;,而钙的吸收量提高后,反而会使血红蛋白含量有减少的趋势,(,因,B,1,=-0.174),。,2025/10/30 周四,24,感谢观看,
展开阅读全文