1、一般线性回归分析案例1、案例为了研究钙、铁、铜等人体必需元素对婴幼儿身体健康的影响,随机抽取了30个观测数据,基于多员线性回归分析的理论方法,对儿童体内几种必需元素与血红蛋白浓度的关系进行分析研究。这里,被解释变量为血红蛋白浓度(y),解释变量为钙(ca)、铁(fe)、铜(cu)。表一 血红蛋白与钙、铁、铜必需元素含量(血红蛋白单位为g;钙、铁、铜元素单位为ug)casey(g)cafecu17.0076.90295.300.84027.2573.99313.001.15437.7566.50350.400.70048.0055.99284.001.40058.2565.49313.001.0
2、3468.2550.40293.001.04478.5053.76293.101.32288.7560.99260.001.19798.7550.00331.210.900109.2552.34388.601.023119.5052.30326.400.823129.7549.15343.000.9261310.0063.43384.480.8691410.2570.16410.001.1901510.5055.33446.001.1921610.7572.46440.011.2101711.0069.76420.061.3611811.2560.34383.310.9151911.5061.
3、45449.011.3802011.7555.10406.021.3002112.0061.42395.681.1422212.2587.35454.261.7712312.5055.08450.061.0122412.7545.02410.630.8992513.0073.52470.121.6522613.2563.43446.581.2302713.5055.21451.021.0182813.7554.16453.001.2202914.0065.00471.121.2183014.2565.00458.001.0002、回归分析表2 变量说明表输入移去的变量a模型输入的变量移去的变量
4、方法1cu, fe, cab.输入a. 因变量: yb. 已输入所有请求的变量。表2说明了应变量和自变量及自变量进入方程的情况表3 模型总体参数表(1)模型汇总b模型RR 方调整 R 方标准 估计的误差1.902a.813.792.993a. 预测变量: (常量), cu, fe, ca。b. 因变量: y由表3可知,相关系数R为0.902,说明自变量与因变量有比较好的相关性。R方为0.813,接近于1,说明总体回归效果较好。+表4 回归方差分析表(1)Anovaa模型平方和df均方FSig.1回归111.587337.19637.743.000b残差25.62326.986总计137.210
5、29a. 因变量: yb. 预测变量: (常量), cu, fe, ca。表4是用方差分析对整个回归方程做了显著性检验,其中F=37.743,对应的概率P值近似为0。若显著性水平为0.05,则因概率小于,拒绝回归方程显著性检验的原假设,即回归系数不同时为0,解释变量全体与被解释变量存在显著的线性关系,选择线性模型具有合理性。 表5 回归系数及显著性检验表(1)系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准 误差试用版零阶偏部分容差VIF1(常量)1.3681.479.925.364ca-.050.021-.223-2.370.026-.006-.421-.201.8081.2
6、38fe.029.003.8889.846.000.879.888.834.8831.132cu.930.888.1031.047.305.305.201.089.7441.344a. 因变量: y表5用方差分析对每个因变量做了偏回归分析,是关于回归系数及显著性检验的计算结果如下:在表中,常数项的t的显著性概率0.364大于0.05,表示常数项与0没有显著性差异,它不应出现在方程中。钙含量的t的显著性概率0.026小于0.05,表示钙含量的系数与0有显著性差异,钙含量应作为解释变量存在于方程中。铁含量的t的显著性概率0.000小于0.05,表示钙含量的系数与0有显著性差异,钙含量应作为解释变量
7、存在于方程中。铜含量的t的显著性概率0.305大于0.05,表示铜含量的系数与0有显著性差异,铜含量应作为解释变量存在于方程中。由此可见,钙含量和铁含量可以作为解释变量在方程中来解释血红蛋白含量的变化,而铜含量则应该被剔除。将铜含量从解释变量中剔除再次做回归分析,的到如下分析结果:表6 模型总体参数表(2)模型汇总b模型RR 方调整 R 方标准 估计的误差1.897a.805.791.995a. 预测变量: (常量), fe, ca。b. 因变量: y(g)自变量减少了一个“铜”含量后,R方由0.813变为0.805,由此可见,去掉铜元素含量后,线性回归方程中的自变量对因变量的影响变化不大;表
8、7 回归方差分析表(2)Anovaa模型平方和df均方FSig.1回归110.506255.25355.865.000b残差26.70427.989总计137.21029a. 因变量: y(g)b. 预测变量: (常量), ca, fe。由表7看出,F值由原来的37.743上升为55.865,F值越大越好,表明整体回归效果更好。表8 回归系数及显著性检验表(2)系数a模型非标准化系数标准系数tSig.相关性共线性统计量B标准 误差试用版零阶偏部分容差VIF1(常量)1.5281.4741.037.309fe.030.003.91510.570.000.879.897.897.9621.039c
9、a-.041.020-.184-2.124.043-.006-.378-.180.9621.039a. 因变量: y(g)表7 多重共线性检验的特征值及条件指数共线性诊断a模型维数特征值条件索引方差比例(常量)feca112.9691.000.00.00.002.02112.016.01.72.473.01017.185.99.28.53a. 因变量: y(g)表6中,最大特征值为2.969,其余依次快速减小。第三列各个条件指数均不大,可认为多重共线性较弱。图1:图1是残差正态性的图形结果,可以看到参数围绕基准线仍存在一定规律性。图2 回归方程标准化预测值与标准化残差散点图图2表明,不存在明显的异方差现象。最终的回归方程为:Z=-0.184X+0.915Y其中,Z表示儿童梅100毫升血中的血红蛋白的含量,单位为g;X表示儿童每100毫升血中钙元素的含量,单位为ug;Y表示儿童每100毫升血中铁元素的含量,单位为ug。方程表明,铁元素含量与血红蛋白含量存在正相关,而钙元素含量与血红蛋白含量存在负相关性,由此,当人体内血红蛋白浓度偏低时,就需要补充铁元素,减少钙元素的摄入量,铜元素则没有显著性影响。【本文档内容可以自由复制内容或自由编辑修改内容期待你的好评和关注,我们将会做得更好】精选范本,供参考!