1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,LOGO,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,高级数理统计,马建华 博士,18876660,深圳大学管理学院,2,第六章 线性统计模型,6.1,线性模型的概念和分类,6.2,回归分析,3,6.1,线性模型的概念和分类,线性模型的概念,做匀速直线运动的物体的距离公式:,线性模型的概念,线性模型的概念,概念,线性模型的概念,线性模型是一个随机变量的均值具有未知参数的,线性结
2、构的统计模型,概念,线性模型的概念,线性模型的概念,在实际统计问题中,两类来源的误差同时出现的情形较为常见。对统计理论而言,并不追究误差的来源。,误差项来源,线性模型的概念,线性模型的概念,样本模型,线性模型的分类,数量因子:,如果模型中涉及到的自变量的取值是长度、时间、体积、重量这一类,可以连续变化的量,,称这类自变量所代表的因子为数量因子。,属性因子:,像土地、品种和肥料这类因子,,不是连续变化的量,称为属性因子。,标号变量:,属性因子在统计中使用时需要数量化,且量值常常取,0,或,1,表示出现与否,称为标号变量。,线性模型的分类,如果自变量因子都是数量因子,就称这个模型是,回归分析模型,
3、如果自变量因子均为属性因子,则称此模型为,方差分析模型,;倘若自变量因子中既有属性因子,也有数量因子,就称此模型为,协方差分析模型,。,14,6.2,回归分析,回归的概念,回归分析的目的是寻求一个随机变量,Y,对一组随机变量的统计依赖关系。,回归的概念,为了区别后边的经验回归,称这里定义的回归为,理论回归或总体回归。在不致混淆时不予区分。,回归的概念,在回归问题中,视,Y,和,X,的地位是不对称的,回归的概念,回归的概念,回归函数,回归的概念,一元回归的概念,一元回归的概念,一元线性回归的概念,一元线性回归的概念,一元线性回归的概念,最小均方误差线性预测,可见,在正态情形下,限于在线性函数类
4、中选取最佳预测,不会有任何损失。,最小均方误差线性预测,最小均方误差线性预测,最小均方误差线性预测,一元情形,通过对,(6.16,)式求偏导而推出。,回归系数的估计与经验回归,在总体线性回归方程中,回归系数是由总体的二阶矩给定的,在二阶矩未知时,要用取自总体的样本来估计。,最小二乘法,回归系数的估计与经验回归,最小二乘法,回归系数的估计与经验回归,最小二乘法,一阶条件,回归系数的估计与经验回归,最小二乘法,一元线性回归系数的估计与经验回归,一元线性回归系数的估计与经验回归,书上关于此式的符号有误,一元线性回归系数的估计与经验回归,例:已知某省,1978,1998,年的国民生产总值,(GNP),
5、与居民消费支出总额资料如表,5.21,所示,试建立居民消费支出,Y,对国民生产总值,X,的线性回归模型。,一元线性回归系数的估计与经验回归,年份,GNP,居民消费,年份,GNP,居民消费,年份,GNP,居民消费,1978,87.99,42,1985,218.99,102,1992,551.12,263,1979,106.43,46.2,1986,235.11,109.4,1993,671.63,333.2,1980,108.76,54.1,1987,257.23,124.7,1994,805.77,378.6,1981,121.71,61.4,1988,316.69,157,1995,1034.48,486.5,1982,139.22,68,1989,376.26,176.9,1996,1226.02,581.4,1983,155.06,75.9,1990,429.27,191.5,1997,1381.13,610.5,1984,197.42,87.3,1991,468.27,218.1,1998,1486.08,579.3,一元线性回归系数的估计与经验回归,