资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,线性回归的显著性检验和回归预测,一、回归系数的显著性检验,回归系数显著性检验的目的是通过检验回,归系数,的值与,0,是否有显著性差异,来判断,Y,与,X,之间是否有显著的线性关系,.,若,=0,则总体,回归方程中不含,X,项,(,即,Y,不随,X,变动而变动,),因,此,变量,Y,与,X,之间并不存在线性关系,;,若,0,说,明变量,Y,与,X,之间存在显著的线性关系,.,提出原假设与备择假设:,3,构造检验统计量,根据已知条件实际计算统计量,t,的值;,比较,与中的计算结果,得到结论,.,给定显著性水平,这是,t,分布的双侧检验,查表计算出临界值,得出拒绝域,;,回归系数的检验,(,例题分析,),对例题的回归系数进行显著性检验,(,0.05),提出假设,计算检验的统计量,5,二,.,回归方程的显著性检验,(,方差分析,(F,检验,),检验两变量是否线性相关的另一种方法是方差分,析,它是建立在对总离差平方和如下分解的基础上:,提出原假设与备择假设:,构造检验统计量,7,给定显著性水平,查表计算出临界值,得出拒绝域,根据已知条件实际计算统计量,F,的值;,比较,与中的计算结果,得到结论,.,8,方差分析,把总离差平方和及其自由度进行分解,利用,F,统计量检验两变量间线性相关显著性的方法称为方差分析,.,方差分析的结果归纳如下:,离差来源,平方和,自由度,F,值,回 归,剩 余,1,n-2,总计,n-1,线性关系的检验,(,例题分析,),提出假设,计算检验统计量,F,10,确定显著性水平,=0.05,,并根据分子自由度,1,和分母自由度,14,找出临界值,F,=4.60,作出决策:若,F,F,拒绝,H,0,,认为能源消耗量与工业总产值两变量间的线性相关关系是显著的,.,离差来源,平方和,自由度,F,值,回 归,剩 余,1,14,总计,15,三、利用回归方程进行估计和预测,点估计,对于自变量,x,的一个给定值,x,0,根据回归方程得到因变量,y,的一个估计值,2.,点估计值有,y,的,平均值,的点估计,y,的,个别值,的点估计,在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同,y,的平均值的点估计,利用估计的回归方程,对于自变量,x,的一 个给定值,x,0,求出因变量,y,的平均值的一个估计值,E,(,y,0,),就是平均值的点估计,在能源消耗量与工业总产值的例子中,假如我们要估计能源消耗量为,78,十万吨的平均工业总产值,那么将,78,十万吨代入估计的回归方程,就得到了工业总产值的点估计:,y,的个别值的点估计,利用估计的回归方程,对于自变量,x,的一个给定值,x,0,求出因变量,y,的一个个别值的估计值,就是个别值的点估计,.,例如,如果我们只是想知道能源消耗量为,80,万吨的工业总产值是多少,则属于个别值的点估计。根据估计的回归方程得,区间估计,区间估计,点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计,对于自变量,x,的一个给定值,x,0,,根据回归方程得到因变量,y,的一个估计区间,区间估计有两种类型,置信区间估计,(,confidence interval estimate,),预测区间估计,(prediction,interval estimate,),置信区间估计,利用估计的回归方程,对于自变量,x,的一个给定值,x,0,,求出因变量,y,的平均值的估计区间,这一估计区间称为,置信区间,(,confidence interval,),E,(,y,0,),在,1-,置信水平下的置信区间为,式中:,s,e,为回归估计标准差,置信区间估计,(,例题分析,),【,例,】,求出工业总产值的点估计为,100,亿元时,工业总产值,95%,置信水平下的置信区间,.,解:,根据前面的计算结果,已知,n,=16,,,s,e,=2.457,,,t,(16-2)=2.1448,置信区间为,当,工业总产值的点估计为,100,亿元时,工业总产值,的平均值在,97.9167,亿元到,102.0833,亿元之间,.,预测区间估计,利用估计的回归方程,对于自变量,x,的一个给定值,x,0,,求出因变量,y,的一个个别值的估计区间,这一区间称为,预测区间,(prediction,interval,),y,0,在,1-,置信水平下的预测区间为,注意!,置信区间,、,预测区间,、,回归方程,y,x,预测上限,置信上限,预测下限,置信下限,影响区间宽度的因素,置信水平,(1-,),区间宽度随置信水平的增大而增大,数据的离散程度,S,e,区间宽度随离程度的增大而增大,3.,样本容量,区间宽度随样本容量的增大而减小,4.,用于预测的,x,0,与,x,的差异程度,区间宽度随,x,0,与,x,的差异程度的增大而增大,预测区间估计,(,例题分析,),【,例,】,求出能源消耗量为,73,十万吨时,工业总产值,95%,置信水平下的置信区间,解:,根据前面的计算结果,已知,n,=16,,,s,e,=,2.457,,,t,(14)=2.1448,置信区间为,能源消耗量为,73,十万吨时,,其工业总产值的预测区间在,45.9345,亿元与,57.2677,亿元之间,.,预测区间估计,(,大样本,),y,0,在,1-,置信水平下的预测区间为,23,置信上限,置信下限,24,作业:,P223,1,、,4,、,6,、,7,
展开阅读全文