收藏 分销(赏)

六章节直线相关与回归市公开课特等奖市赛课微课一等奖PPT课件.pptx

上传人:可**** 文档编号:13902881 上传时间:2026-05-04 格式:PPTX 页数:40 大小:294.71KB 下载积分:8 金币
下载 相关 举报
六章节直线相关与回归市公开课特等奖市赛课微课一等奖PPT课件.pptx_第1页
第1页 / 共40页
六章节直线相关与回归市公开课特等奖市赛课微课一等奖PPT课件.pptx_第2页
第2页 / 共40页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第六章 直线相关与回归,医学统计学及其软件包,上海第二医科大学,生物统计教研室,第1页,分析两个变量间关系惯用回归及相关分析统计方法。,如两个变量间关系是线性,可用直线相关与回归分析;如两个变量间关系是非线性需用非线性(曲线)回归。,回归分析适合用于分析变量间因果关系;用一个自变量值来预计另一个应变量值。,相关分析用于分析两变量间相互联络亲密程度及相关方向。,第一节 概述,第2页,第二节 相关系数,相关分析目标在于经过相关系数r来描述和度量两变量线性联络程度和方向。,r0 正相关,图例1,r0 负相关,图例2,r=0 零相关,图例3,零相关即两变量间无关。,样本相关系数不等于零,并不表示总体相关系数不等于零,还要作显著性检验。,next,第3页,r=0.7495,回,第4页,r=-0.83597,回,第5页,第6页,相关系数计算:,X和Y离均差积和,X,离均差平方和,第7页,相关系数显著性检验,样本相关系数标准误,查t界值表,得P值,第8页,例6.1 极谱法和碘量法测定水中溶解氧含量,两法测得值是否有相关性?,两法测得值有相关(P0.01),第9页,第三节 直线回归方程,目标:找出描述,x,与,y,依存关系直线方程。,Y为应变量(dependent variable),X为自变量(independent variable),A为截距(intercept),b为回归系数(regression coefficient),回归系数b表示x每改变一个单位,y平均改变b个单位。,第10页,Y,=10,x,+5,=4.22+0.20,x,体重,心脏横径,第11页,设有n对x,y观察值,先在直角坐标系中作散点图,假如散点分布呈直线趋势,则可设法求出直线方程。,通惯用最小二乘法,依据:各点与该直线纵向距离平方和为最小,先由(6.3)式求得b,再由(6.4)式求得a,就得出直线回归程。,第12页,x,y,最小,第13页,回归系数显著性检验,从样本资料中算得回归系数b,也有抽样误差,所以需作显著性检验,检验其是否是回归系数为零总体中抽得。,H,0,:=0 H,1,:0。,当拒绝H,0,时,可认为x与y间直线回归方程有统计学意义。,显著性检验可有两种方法:t 检验法和方差分析法。,第14页,t 检验法:,样本回归系数标准误,剩下标准差,预计误差平方和,第15页,方差分析法:,Y总变异,X和Y线性关系引发变异,误差引发变异,回归平方和,误差平方和,第16页,总自由度:n-1 (总例数减1),回归自由度:1 (自变量个数),误差自由度:n-2 (总自由度减去回归自由度),df,1,=1,df,2,=n-2 查方差分析用F界值表,得P值,第17页,例6.2,研究正常男性年纪与运动后最大心率关系,求直线回归方程。,第18页,直线回归相关分析注意事项:,1.相关分析只是以相关系数来描述两个变量间线性相关程度和方向,并不说明事物间存在联络本质,也不是两事物间存在联络证据。要说明两事物间本质联络,必须凭专业知识从理论上加以论证。所以,把两个毫无关系事物放在一起作相关分析是毫无意义。一样,作回归分析也要有实际意义。,第19页,第20页,直线回归相关分析注意事项:,在进行直线回归前应绘制散点图,有直线趋势时,才适宜作直线回归分析。散点图还能提醒资料有没有异常点。,3.直线回归方程适用范围普通以自变量取值范围为限。,第21页,直线回归相关分析注意事项:,4.对同一组资料作回归和相关分析,其相关系数和回归系数显著性检验结果完全相同。因为相关系数显著性检验结果可直接查表,比较方便;而回归系数显著性检验计算复杂,故在实际应用中惯用相关系数显著性检验结果代替回归系数显著性检验。,第22页,直线回归相关分析注意事项:,5.在资料要求上:,相关分析要求两个变量服从双变量正态分布。,回归分析要求因变量服从正态分布,自变量能够是准确测量和严格控制变量。如两个变量服从双变量正态分布,则能够作两个回归方程,用X推算Y,或用Y推算X。,第23页,第五节 过定点直线回归,医学研究中在拟合直线时,除了要求与观察点尽可能靠近外,还经常要求必须经过某定点(m,n)。比如在光电比色、荧光分析、火焰光度测定以及同位素测定等试验方法绘制标准直线时就常有这么要求。,此定点也能够是(m,0),(0,n)或(0,0)等,尤以(0,0)为最常见。,计算公式和实例见第116页。,第24页,第六节 直线相关与回归SAS程序,SASCORR过程可用于求变量之间线性相关系数及偏相关系数。;,SASREG过程可用于各种线性回归分析,包含多元回归(见第七章),逐步回归和最优子集回归(见第八章)等。,第25页,第七章 多元回归及相关,第一节 多元线性回归基本概念,事物间相互联络往往是多方面,在很多情况下对应变量y 发生影响自变量往往不止一个。多元线性回归目标就是用一个多元线性回归方程表示多个自变量和1个应变量间关系。,:截距,:标准偏回归系数,标准偏回归系数表示其它自变量固定情况下,x,i,改变一个单位,y平均改变b,i,个单位。,第26页,多元线性回归应用条件:,1.独立性:各观察对象间相互独立。,2.线性:自变量与应变量间关系为线性。,正态性:自变量取不一样值时,应变量分布为,正态。,方差齐性:自变量取不一样值时,应变量总体,方差相等。,当不符合条件时,可对自变量进行变换。,如:,第27页,第二节 多元回归计算,1.计算截距和各偏回归系数。,2.多元回归方程显著性检验:,(1)整个方程显著性检验:用方差分析。,(2)对各偏回归系数显著性检验:,F检验:去掉,x,j后回归平方和降低是否显著。,t检验:回归系数除以它标准误。,第28页,第三节 标准偏回归系数,要比较各个自变量对于应变量作用大小,不能用偏回归系数,因为各偏回归系数单位不一样。必须把偏回归系数标准化,化成没有单位标准偏回归系数,公式为:,消除不一样单位影响后,标准偏回归系数绝对值越大,该自变量对于应变量作用越大,但该差异是否有统计意义,也必须经过检验。,第29页,第四节 偏相关系数,相关系数r应称为简单相关系数,因为它只考虑了x,1,和,x,2,之间相互影响,而未注意到其它变量对x,1,和x,2,可能有影响。,实际上,客观事物间关系是错综复杂,变量之间相互影响也往往是各种多样。比如,当存在x,1,x,2,x,3,三个变量时,假如我们不考虑x,3,,而只对x,1,x,2,计算其相关系数r,则这r大小往往不反应客观真实情况;如r很大,可能意味着x,1,x,2,之间关系很亲密,但也可能实际上x,1,x,2,之间并无什么关系,而x,3,却对x,1,x,2,能同时发挥很大影响,我们所看到较大r值不过是x,3,对x,1,作用和x,3,对x,2,作用客观表现而已。反之,x,1,x,2,之间算得一个小r值,也不一定就意味着x,1,x,2,之间关系确实微弱,也有可能x,1,x,2,之间虽相关联,但此关联性却被x,3,对它们作用所抵消,以致被掩盖了。,第30页,所以在较单纯情况下,假如x,1,x,2,与周围其它变量没什么关系话,则用简单相关系数来表示x,1,x,2,之间相关性是可行;假如存在着对x,1,x,2,关系亲密其它变量,则r就不能确切地表示x,1,x,2,之间真实关系,这就需要用到偏相关系数。,所谓偏相关系数指是当把x,1,x,2,以外其它变量对它们影响都扣除掉(或平衡掉)以后,x,1,x,2,之间相关系数。,表示把x,3,作用扣除掉以后x,1,和x,2,偏相关系数,表示把x,3,和x,4,作用扣除掉以后x,1,和x,2,偏相关系数,偏相关系数可从简单相关系数计算得到,也要作显著性检验。,第31页,第五节 多元相关系数及决定系数,在多元回归中可算得一个多元相关系数,用R表示,它是y与 之间简单相关系数,也可了解为y与自变量组合之间相关系数。,R,2,称为多元回归方程决定系数,即y变异中可由方程中自变量组合所决定部分。,R,2,值介于01之间,R,2,越靠近1,说明回归方程效果越好。R,2,越靠近0,说明回归方程效果越差,即y变异中只有极少一部分能由方程中自变量组合所决定,即使该方程有显著意义,也不能认为该方程效果能够令人满意,启示我们还应深入寻找其它对y可能有显著作用变量或变量组合。R,2,也可用于检验多元回归方程显著性。,第32页,第六节 多元回归在医学中应用,1.,一。依据较易测得自变量推算不易测得应变量,如:用身高,体重推算体表面积。,二。确定各自变量x,i,取不一样值时,y正常值范围,如:建立一个由身高,体重推算心象面积多元回归方程,利用此方程就可分别求出身高,体重取不一样值组合时,心象面积正常值范围。,三。预测预报,如:建立心肌梗塞预报方程或脑卒中预报方程。,四。回顾推断,如:推断死亡时间。,第33页,第七节 多元回归及相关SAS程序,求偏相关系数用CORR过程。,求,多元回归及相关,用REG过程。,第34页,第八章 逐步回归及最优子集回归,第一节 逐步回归分析,一逐步回归分析基本概念,逐步回归分析目标是建立,“最优”回归方程。,“最优”回归方程是指包含全部对y有显著作用自变量,而不包含对y作用不显著自变量方程。,第35页,二.逐步回归分析计算方法,在供选自变量X,i,中,按其对y作用大小,由大到小地把自变量逐一引入方程,每引入一个自变量就对它作显著性检验,显著时才引入,而当新自变量进入方程后,对方程中原有自变量也要作检验,并把作用最小且退化为不显著自变量逐一剔出方程。所以,逐步回归每一步(引入一个变量或剔除一个变量都称为一步)前后都要作显著性检验,以确保每次引入新变量前方程中只包含作用显著自变量。这么一步步进行下去,直至方程中所含自变量都显著而又没有新作用显著自变量可引入方程为止。,第36页,逐步回归分析方法示意:,y,x,1,、,x,2,、,x,3,、,x,m,x,j,X,j,是否显著,结束,引入方程,方程内自变量中选择对,y作用最小,x,i,剔除,方程外:,作用最大自变量:,第37页,第三节 最优子集回归,回归方程优劣评价:(,P为选入方程自变量数),1.剩下标准差最小:,2.变异系数最小:,3.复相关系数最大:,4.校正R,2,最大:,5.,cp,统计量最小,第38页,第三节 最优子集回归,把一切可能自变量组合方程都求出来,然后选出一个符合最优标准回归方程。这个方法称为最优子集回归。,y x,1,y x,2,y x,3,y x,1、,x,2,y x,1、,x,3,y x,2、,x,3,y x,1、,x,2、,x,3,最优回归准则:,(1)R,2,最大:只能用于相同个数自变量方程间比较。,(2)校正R,2,最大:能用于不一样个数自变量方程间比较。,(3)最小,cp统计量:能用于不一样个数自变量方程间比较。,第39页,第三节 逐步回归和最优子集回归,应用实例及SAS程序,用REG过程,,逐步回归:MODEL,语句后面选择项,SELECTION=STEPWISE,最优子集回归:MODEL,语句后面选择项,SELECTION=RSQUARE,SELECTION=ADJRSQ,SELECTION=CP,第40页,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 考试专区 > 中考

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服