1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,进食量与体重增加量的散点图:散点图的带状分布有线性趋势,图,9.1,大白鼠进食量与体重增加量的散点图,进食量(,g),1000,900,800,700,600,增加量(,g),190,180,170,160,150,140,130,120,110,直线回归分析在于找出两个变量有依存关系的直线方程,以确定一条能代表这些数据关系的、,最接近各实测点,的直线,使各,实测点的与该线的纵向距离的平方和为最小,。为了区别于一般的函数方程,我们称之为直线回归方程,650,750,850,950,1050,1150,110
2、140,170,200,直线回归方程的一般表达式为:,a,是回归直线在,Y,轴上的截距,即,X=0,时的值;,b,为回归系数,,,即直线的斜率,。,b0,,表示直线从左下方走向右上方,即,Y,随,X,的增大而增大;,b,t,0.001(10),,,P,0.001,;,统计结论,:,按,=0.05,水准,拒绝,H,0,,,接受,H,1,,,认为在某代乳粉营养价值试验中,大白鼠进食量与体重增加量之间存在直线回归关系,即所拟合的样本直线回归方程有意义。,查表确定,p,值,查,t,界值表,得,p0.001,附表4,t,界值表,概率,,p,自由度 单侧 0.10 0.05 0.025 0.01 0.0
3、05 0.001 0.0005,双侧,0.20 0.10 0.050 0.02 0.01 0.002,0.001,1 3.078 6.314 12.706 31.821 63.657 318.3 636,2 1.886 2.920 4.303 6.965 9.925 22.3 31,10 1.372 1.812 2.228 2.764 3.169 4.144,4.587,11 1.363 1.796 2.201 2.718 3.106 4.025 4.437,1.描述两变量间的依存关系,通过回归系数的假设检验,若认为两变量间存在着直线回归关系,则可用直线回归方程来描述两变量间的依存关系,可用于
4、描述,大白鼠进食量与体重增加量的定量关系,9.2.3 回归方程的应用,2.利用回归方程进行预测,所谓预测就是把预报因子(自变量,X),代入回归方程对预报量(应变量,Y),进行估计,其波动范围可按求,Y,值容许区间的方法计算。,如预测大白鼠进食950克时的体重增加量,将,X=950,代入,得,3.利用回归方程进行统计控制,统计控制是利用回归方程进行逆估计,如果要求应变量,Y,在一定范围内波动,可以通过控制自变量,X,的取值来实现.,如【例9.5】血糖水平,Y,与胰岛素,X,的关系,为:只要把胰岛素水平控制在32.71,mU/L,以上,就有95可能使血糖不超过正常值范围的上限6.72,mmol/L
5、9.4.1直线相关与回归的区别与联系,一、直线相关与回归的区别与联系,1,区别:,(1)在资料要求上,相关分析中,,X,Y,地位平等;回归分析中,二者地位不同,在回归分析中:如果,X,可以精确测量和严格控制,回归只要求应变量,Y,作为随机变量且服从,正态,分布,此种回归属于型回归;如果,X,和,Y,需要相互推断,则要求,X、Y,为随机变量且都要服从,双,变量,正态,分布,此资料类型属于型回归。可以计算两个回归方程:由,X,推,Y,的回归方程;由,Y,推,X,的回归方程。,9.4 直线相关与回归应用时的注意问题,(2)相关分析与回归分析的用途不同,相关分析:用于说明两变量间的相互关系,描述两
6、变量,X、Y,相互之间呈线型关系的密切程度和方向;,回归分析:用于说明两变量间的依存关系,可以用一个变量的数值推算另一个变量的数值。,2,联系:,(1)正负符号:在同一资料中,计算,r,与,b,值的符号应该相同。,,,(2)假设检验:在同一资料中,,r,与,b,值的假设检验的统计量,t,值相等,即,t,r,=t,b,。,如大白鼠进食量与体重增加量例中,(3)r,与,b,换算关系如下:,(4)用回归解释相关:相关系数,r,的平方称为决定系数,也称为相关指数。公式为:,其值在0-1之间。决定系数表示,Y,的变异中可由,X,解释的部分占总变异的比例。因此,r,2,越接近于1,说明应用相关分析的意义越
7、大,即贡献越大;,例如:大白鼠进食量与体重增加量例子中,,R,2,=0.8529,2,=0.7274,即体重增加量变异中有72.74可归因为进食量的差异。,9.4.2设计与应用直线相关与回归的注意事项,1作相关与回归分析要有实际意义。,不要把毫无关联的两个事物或现象用作相关、回归分析,如:分析儿童身高和小树高度关系就毫无意义,2对相关分析的作用要正确理解。,相关分析只是以相关系数来描述两个变量间直线关系的密切程度和方向,并不能阐明两事物或现象间存在联系的本质;,即使存在相关关系,也并不能证明是因果关系。,如:双胞胎兄弟的身高的关系。,要证明两事物间的内在联系,必须凭借专业知识从理论上加以阐明。
8、当事物间的内在联系尚未被认识时,可根据相关分析的数量关系给理论研究提供线索。,3相关和回归都是分析两变量间关系的统计方法。,相关表示相互关系,回归表示从属关系。与相关分析一样,回归分析前也,必须先作散点图,,以判断两变量间的关系是否为线性趋势,有无离群点等。,4积差和法相关与等级相关。,积差和法相关计算相关系数,r,适用于,正态,资料;,资料明显呈偏态分布或者原始资料只能用等级划分或难以判定资料属何种分布的,按等级相关处理。,5回归系数的统计学意义,不能仅根据回归系数假设检验之,P,值判断回归效果的优劣,因,P,值除与相关系数的大小有关外,还与样本含量有关。,要想说明回归的贡献大小,需用决定系数,r,2,作定量的度量。,6,回归方程的使用范围为自变量,X,原观察数据的范围;而不能随意外推,因为我们并不知道在这些观察值的范围之外,两变量间是否也存在同样的直线关系。,如儿童体重(千克)与年龄(岁)的关系为:,将,X=80,代入,计算结果167千克,是荒谬和,毫无意义的,谢谢大家,再见,