收藏 分销(赏)

直线相关与回归.pptx

上传人:1587****927 文档编号:1678377 上传时间:2024-05-07 格式:PPTX 页数:37 大小:629KB
下载 相关 举报
直线相关与回归.pptx_第1页
第1页 / 共37页
直线相关与回归.pptx_第2页
第2页 / 共37页
直线相关与回归.pptx_第3页
第3页 / 共37页
直线相关与回归.pptx_第4页
第4页 / 共37页
直线相关与回归.pptx_第5页
第5页 / 共37页
点击查看更多>>
资源描述

1、直线相关与回归不确定性关系不确定性关系v医学上医学上,许多现象之间有相互联系许多现象之间有相互联系,然而并不像函然而并不像函数那样就是确定性关系。例如数那样就是确定性关系。例如:身高与体重、体温身高与体重、体温与脉搏、年龄与血压等。在这些有关系得现象中与脉搏、年龄与血压等。在这些有关系得现象中,她们之间联系得程度和性质也各不相同。有些变她们之间联系得程度和性质也各不相同。有些变量间关系密切量间关系密切,有些不密切以有些不密切以;有些就是因果关系有些就是因果关系;但就是但就是,有得现象之间因果不清有得现象之间因果不清,只就是伴随关系。只就是伴随关系。直线相关与回归就就是用于研究和解释两个直线相关

2、与回归就就是用于研究和解释两个变量之间关系得统计方法。变量之间关系得统计方法。相相关与关与回回归归2 2直直 线线 回回 归归Linear regression相相关与关与回回归归3 3“regression”一词得来源一词得来源F Galton得研究相相关与关与回回归归4 4散点图散点图(scatter diagram)v为了描述两变量之间得关系为了描述两变量之间得关系,首先在直角坐标系上首先在直角坐标系上描述这些点描述这些点,这一组点集称为散点图。这一组点集称为散点图。相相关与关与回回归归5 5v为为了研究父了研究父亲亲与成年儿子身高与成年儿子身高之之间间得关系得关系,卡卡尔尔、皮尔逊测、

3、皮尔逊测量了量了1078对父子得身高。把对父子得身高。把1078对数字表示在坐标上对数字表示在坐标上,如图。用水平轴如图。用水平轴X上得数代表上得数代表父亲身高父亲身高,垂直轴垂直轴Y上得数代表上得数代表儿子得身高儿子得身高,1078个点所形成个点所形成得图形就是一个散点图。她得得图形就是一个散点图。她得形状象一块橄榄状得云形状象一块橄榄状得云,中间中间得点密集得点密集,边沿得点稀少边沿得点稀少,其主其主要部分就是一个椭圆。要部分就是一个椭圆。相相关与关与回回归归6 6图图 1078对父子身高间得关系对父子身高间得关系 相相关与关与回回归归7 7 直线回归就就是用来描述一个变量如直线回归就就是

4、用来描述一个变量如何何依赖于依赖于另一个变量得统计方法。另一个变量得统计方法。dependent variable(应变量应变量)indepentent variable(自变量自变量)相相关与关与回回归归8 8回归方程回归方程 v直线回归得任务就就是要找出因变量随自变量变直线回归得任务就就是要找出因变量随自变量变化得直线方程化得直线方程,我们把这个直线方程叫做直线回归我们把这个直线方程叫做直线回归方程方程。式中得 就是由自变量X推算应变量Y得估计值。a a就是回归直线在就是回归直线在Y Y 轴上得截距轴上得截距,称为常数项称为常数项(constant),(constant),即即X=0X=0

5、时得时得Y Y值值;b b为样本得回归系数为样本得回归系数(reg(reg、Coeff Coeff、),),即回归即回归直线得斜率直线得斜率,表示当表示当X X变动一个单位时变动一个单位时,Y,Y平均变动平均变动b b个单位。个单位。相相关与关与回回归归9 9最小二乘法最小二乘法(least square method):直线一定经过直线一定经过“均数均数”点点使各散点到直线得纵向距离得平方和最小。使各散点到直线得纵向距离得平方和最小。相相关与关与回回归归1010回归直线得描绘回归直线得描绘 v 根据求得得回归方程根据求得得回归方程,可以在自变量可以在自变量X得实测范得实测范围内任取两个值围内

6、任取两个值,代入方程中代入方程中,求得相应得两个求得相应得两个Y值值,以这两对数据找出对应得两个坐标点以这两对数据找出对应得两个坐标点,将两点将两点连接为一条直线连接为一条直线,就就是该方程得回归直线。就就是该方程得回归直线。v回归直线一定经过回归直线一定经过(0,a),。这两点可以用。这两点可以用来核对图线绘制就是否正确。来核对图线绘制就是否正确。相相关与关与回回归归1111v直线回归方程就是从样本资料计算而得得直线回归方程就是从样本资料计算而得得,同样也存在着同样也存在着抽样误差问题。所以抽样误差问题。所以,需要对样本得回归系数需要对样本得回归系数b进进行假行假设检设检验验,以判断以判断b

7、就是否从回就是否从回归归系数系数为为零得零得总总体中抽得。体中抽得。为了判为了判断抽样误差得影响断抽样误差得影响,需对回归系数进行假设检验。需对回归系数进行假设检验。v总体得回归系数用总体得回归系数用表示。表示。回归方程得检验回归方程得检验相相关与关与回回归归1212大家有疑问的,可以询问和交流大家有疑问的,可以询问和交流可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点可以互相讨论下,但要小声点回归系数得假设检验回归系数得假设检验vH0:=0 H1:0v=0、05v选择合适得假设检验方法选择合适得假设检验方法,计算检验统计量计算检验统计量 (1)方差分析方差分析

8、F=MS回回归归/MS剩余剩余 (2)t检验检验v计计算算P值值v做出推做出推论论:统计统计学学结论结论和和专业结论专业结论相相关与关与回回归归1414X X(1 1)回归系数得方差分析回归系数得方差分析相相关与关与回回归归1515 Y得离均差平方和得分解得离均差平方和得分解相相关与关与回回归归1616几个几个平方和得意义平方和得意义相相关与关与回回归归1717相相关与关与回回归归1818构建检验统计量构建检验统计量F依据依据F分布判断分布判断P值值相相关与关与回回归归1919(2)采用采用t检验方法检验方法其中其中S Sy y、x x为各观察值为各观察值Y Y到回归直线得距离得标准差到回归直

9、线得距离得标准差,表表示去除示去除X X影响后影响后Y Y得变异程度得变异程度,称为剩余标准差。称为剩余标准差。相相关与关与回回归归2020关于关于SY、X(standard deviation of Y for fixed X)相相关与关与回回归归2121直线回归得应用直线回归得应用 描述两变量之间得依存关系描述两变量之间得依存关系:通过回归系数得假设检验通过回归系数得假设检验,若认为若认为两变量之间存在直线回归关系两变量之间存在直线回归关系,则可用直线回归方程来描述。则可用直线回归方程来描述。利用回归方程进行预测利用回归方程进行预测:把自变量代入回归方程把自变量代入回归方程,对应变量进对应

10、变量进行估计行估计,可求出应变量得波动范围。可求出应变量得波动范围。利用回归方程进行统计控制。利用回归方程进行统计控制。与与ANOVA结合结合,协方差分析。协方差分析。相相关与关与回回归归2222过定点得直线回归过定点得直线回归v作标准曲线非常有用作标准曲线非常有用!(过原点过原点)回归方程:相相关与关与回回归归2323直直 线线 相相 关关 linear correlation simple correlationPearsons correlation相相关与关与回回归归2424相关得类型相关得类型相相关与关与回回归归2525 相关系数(correlation coefficient),又

11、称simple correlation coefficient,coefficient of product moment correlation,或 Pearsons correlation coefficient、说明相关得密切程度和方向得指标。说明相关得密切程度和方向得指标。相关系数概念相关系数概念 相相关与关与回回归归2626相关系数得计算相关系数得计算 说明两个变量说明两个变量X与与Y之间关联得密切程度之间关联得密切程度(绝对绝对值大小值大小)与关联得方向与关联得方向(正负号正负号)。相相关与关与回回归归2727相关系数相关系数(r)得意义得意义n相关系数相关系数r得值在得值在-1和

12、和1之间之间,但可以就是此范围内得但可以就是此范围内得任何值。任何值。n正相关时正相关时,r值在值在0和和1之间之间,散点云图就是斜向上得散点云图就是斜向上得,这时一个变量增加这时一个变量增加,另一个变量也增加另一个变量也增加;n负相关时负相关时,r值在值在-1和和0之间之间,散点云图就是斜向下得散点云图就是斜向下得,此时一个变量增加此时一个变量增加,另一个变量将减少。另一个变量将减少。nr得绝对值越接近得绝对值越接近1,两变量得关联程度越强两变量得关联程度越强,r得绝对得绝对值越接近值越接近0,两变量得关联程度越弱。两变量得关联程度越弱。相相关与关与回回归归2828例题相相关与关与回回归归2

13、929相关系数得假设检验 v上例中得相关系数上例中得相关系数r等于等于0、8529,就是由样本计算所得就是由样本计算所得,抽抽样误差难以避免。样误差难以避免。v因为因为,即使总体相关系数即使总体相关系数()为零时为零时,由于抽样误差由于抽样误差,从总体从总体抽出得抽出得12例例,其其r可能不等于零。所以可能不等于零。所以,要判断该样本得要判断该样本得r就就是否有意义是否有意义,需与总体相关系数需与总体相关系数=0进行比较进行比较,看两者得差别看两者得差别有无统计学意义。有无统计学意义。v这就要对这就要对r进行假设检验进行假设检验,判断判断r不等于零就是由于抽样误差不等于零就是由于抽样误差所致所

14、致,还就是两个变量之间确实存在相关关系。还就是两个变量之间确实存在相关关系。相相关与关与回回归归3030相关系数得假设检验相关系数得假设检验-t检验检验=n-2 相相关与关与回回归归3131查表法原理:所以:相应地相应地,有有:相相关与关与回回归归3232直线相关得应用直线相关得应用v相关就是研究两个变量间得相互关系相关就是研究两个变量间得相互关系,而且这种相互关系就是用相关而且这种相互关系就是用相关系数反映得。在相关关系有统计学意义得前提下系数反映得。在相关关系有统计学意义得前提下,如果如果r r得绝对值越得绝对值越大大,说明两个变量之间得关联程度越强说明两个变量之间得关联程度越强;反之反之

15、,r r绝对值越小绝对值越小,则说明两则说明两个变量之间得关系越弱。个变量之间得关系越弱。v一般说来一般说来,当样本量较大时当样本量较大时,若若r r有统计学意义时有统计学意义时,r r得绝对值大于得绝对值大于0 0、7 7,则表示两个变量高度相关则表示两个变量高度相关;r r得绝对值大于得绝对值大于0 0、4 4,小于等于小于等于0 0、7 7时时,则表示两个变量之间中度相关则表示两个变量之间中度相关;r r得绝对值大于得绝对值大于0 0、2 2,小于等于小于等于0 0、4 4时时,则两个变量低度相关。则两个变量低度相关。相相关与关与回回归归3333Statistics in medicin

16、ev|r|=0-0、25 little or no relationshipv 0、25-0、5 a fair degree of relationshipv 0、5-0、75 a moderate to good relationshipv 0、75 a very good to excellent relationship 相相关与关与回回归归3434应用直线相关与回归得注意事项应用直线相关与回归得注意事项 1、要有实际意义 进行相关回归分析要有实际意义进行相关回归分析要有实际意义,不可把毫无关不可把毫无关系得两个事物或现象用来作相关回归分析。系得两个事物或现象用来作相关回归分析。2、相关

17、关系得正确理解 相关关系不一定就是因果关系相关关系不一定就是因果关系,也可能就是伴随也可能就是伴随关系关系,并不能证明事物间有内在联系。并不能证明事物间有内在联系。相相关与关与回回归归35353 3、利用散点图利用散点图 对于性质不明确得两组数据对于性质不明确得两组数据,可先做散点图可先做散点图,在在图上粗步观察她们有无线性关系及关系得得大体方图上粗步观察她们有无线性关系及关系得得大体方向向,以及有无离群点以及有无离群点(outlier)(outlier),然后再进行相关然后再进行相关/回回归分析。归分析。4 4、变量实测范围变量实测范围 相关分析和回归方程仅适用于样本得原始数据相关分析和回归

18、方程仅适用于样本得原始数据范围之内范围之内,出了这个范围出了这个范围,我们不能得出两变量得相我们不能得出两变量得相关关系和原来得回归关系。关关系和原来得回归关系。5 5、相关、回归若无统计学意义相关、回归若无统计学意义,不等于无任何关系。不等于无任何关系。相相关与关与回回归归3636相关与回归得区别相关与回归得区别 v1、应应用用:研究两研究两变变量得相互关系量得相互关系,用相关分析用相关分析,即在两个即在两个变变量中量中,任何一个得任何一个得变变化化都会引起另一个得都会引起另一个得变变化化,就是一种双向就是一种双向变变化得关系。回化得关系。回归归就是反映两个就是反映两个变变量得依量得依存关系

19、存关系,一个一个变变量得改量得改变变会引起另一个会引起另一个变变量得量得变变化化,就是一种就是一种单单向得关系。向得关系。v2、资资料要求料要求:回回归归分析要求分析要求Y呈正呈正态态分布分布;相关分析要求相关分析要求资资料呈双料呈双变变量正量正态态分布分布(下下页页)。v3、研究性、研究性质质:相关就是相关就是对对两个两个变变量之量之间间得关系得关系进进行描述行描述,看两个看两个变变量就是否有量就是否有关关,关系就是否密切关系就是否密切,关系得性关系得性质质就是什么就是什么,就是正相关就是正相关还还就是就是负负相关。回相关。回归归就是就是对对两个两个变变量做定量描述量做定量描述,研究两个研究

20、两个变变量得数量关系量得数量关系,已知一个已知一个变变量量值值可以可以预测预测出另出另一个一个变变量量值值,可以得到定量可以得到定量结结果。果。v4、相关系数相关系数r与回归系数与回归系数b:r与与b得得绝对值绝对值反映得意反映得意义义不同。不同。r得绝对值越大得绝对值越大,散点图中得点越趋向于一条直线散点图中得点越趋向于一条直线,表明两变量得关系越密切表明两变量得关系越密切,相关程度越高。相关程度越高。b得得绝对值越大绝对值越大,回归直线越陡回归直线越陡,说明当说明当X变化一个单位时变化一个单位时,Y得平均变化就越大。反之得平均变化就越大。反之也就是一样。也就是一样。相相关与关与回回归归3737

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服