收藏 分销(赏)

医学统计学(一元相关与回归).ppt

上传人:精*** 文档编号:7962296 上传时间:2025-01-28 格式:PPT 页数:57 大小:1.12MB
下载 相关 举报
医学统计学(一元相关与回归).ppt_第1页
第1页 / 共57页
医学统计学(一元相关与回归).ppt_第2页
第2页 / 共57页
医学统计学(一元相关与回归).ppt_第3页
第3页 / 共57页
医学统计学(一元相关与回归).ppt_第4页
第4页 / 共57页
医学统计学(一元相关与回归).ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,相关与回归,第九章,用于研究和解释变量之间,相互,关系的,掌握:,积差相关,等级相关,线性回归的概念,线性回归方程的计算,回归系数的假设检验,相关与回归的区别与联系,了解:,曲线拟合,教学目的和要求,重点讲解,积差相关,等级相关,线性回归的概念,回归系数的假设检验,相关与回归的区别与联系,介绍,曲线拟合,教学内容提要,一、,积差相关,1,、散点图,2,、,积差,相关系数,定量描述,X,与,Y,两变量间直线相关,方向,和相关,密切程度,的统计指标。,积差相关系数(参数检验法),r,等级相关系数(非参数检验法)

2、,Pearson,相关系数,简称相关系数,适用于,x,、,y,都服从正态分布(称为双变量正态分布)的资料。,积差相关系数的计算,r,没有单位,取值范围,:-1,r,1,L,xy,=XY-(,X)(,Y)/n,L,xx,=X,2,-(,X),2,/n,L,yy,=Y,2,-(,Y),2,/n,协方差,r,的特点,没有单位,-1,r,1,r,=-1,完全负相关,,-1,r,0,负相关,r,=1,完全正相关,,0,r,1,正相关,r,=0,零相关,散点图,【,例,9-1】,一个产科医师发现孕妇尿中,雌三醇含量,与产儿的,体重,有关。于是设想,通过测量待产妇尿中雌三醇含量,可以预测产儿体重,以便对低出

3、生体重进行预防。因此收集了31例待产妇24小时的尿,测量其中的雌三醇含量,同时记录产儿的体重。问尿中雌三醇含量与产儿体重之间是否存在相关关系?是正相关还是负相关?,3,、积差相关分析,编号,(1),尿雌三醇,mg/24h(2,),产儿体重,kg(3),编号,(1),尿雌三醇,mg/24h(2),产儿体重,kg(3),1,7,2.5,17,17,3.2,2,9,2.5,18,25,3.2,3,9,2.5,19,27,3.4,4,12,2.7,20,15,3.4,5,14,2.7,21,15,3.4,6,16,2.7,22,15,3.5,7,16,2.4,23,16,3.5,8,14,3.0,24

4、,19,3.4,9,16,3.0,25,18,3.5,10,16,3.1,26,17,3.6,11,17,3.0,27,18,3.7,12,19,3.1,28,20,3.8,13,21,3.0,29,22,4.0,14,24,2.8,30,25,3.9,15,15,3.2,31,24,4.3,16,16,3.2,待产妇尿雌三醇含量与产儿体重关系,12,1),绘制散点图,2),积差相关系数的计算,X=534,;,Y=99.2,;,X,2,=9876 Y,2,=324.8,;,XY=1750,;,3),相关系数的假设检验,上例中,r=0.61,,说明了,31,例样本中雌三醇含量与出生体重之间存在相

5、关关系。但是,这,31,例只是,总体,中的,一个样本,,由此得到的相关系数会存在抽样误差。,=0,时,由于抽样误差,可能导致,r,0,。,对,r,进行假设检验,,判断,r,0,是由于抽样误差所致,,还是两个变量之间,确实存在相关关系,。,3),相关系数的假设检验,总体相关系数,=0,表示总体中两变量,x,和,y,无直线相关关系,a.,用,t,作检验统计量,b.,直接用,r,作检验统计量,r,的标准误为,s,r,根据,t,分布性质来检验样本相关系数,r,是否来自,0,的总体,:,t,r,(,r,-,),/,s,r,(,r,-0,),/,s,r,r,/=,r,用,r,和自由度,v,n,-2,,查,

6、附表,18,,相关系数界值表,H,0,:,=0,H,1,:,0,=,n,-2=31-2=29,查附表,7,,,t,0.0005/2,28,=3.9351,,,t,0.0002/2,28,=4.2754,,,0.0002,P,0.0005,,拒绝,H,0,,接受,H,1,,认为待产妇,尿中雌三醇含量与产儿体重,之间,有正相关关系,。,第二节 直线回归,一、回归方程,二、回归系数,三、回归系数的假设检验,四、直线回归的应用,一个人的快乐,不是因为他拥有的多,而是因为他计较的少,休息,二、等级相关,(秩相关),不服从正态分布的资料;,总体分布类型不知的资料;,用等级或相对数表示的资料;,数据一端或两

7、端有不确定值的资料,用等级相关(或称秩相关)分析(属非参数统计法)。,秩相关系数,Spearman,相关系数,(,r,s,),Kendall,相关系数,(,r,k,),用,等级相关系数,表示两个变量间直线关系,密切程度,和,方向,。,先分别将两个变量按原始数值由小到大编秩(遇相同观察值时取平均秩),计算每对观察值的秩之差,d,。,n,为对子数;,d,为配对秩次之差;,T,x,(,或,T,y,),(,t,j,3,t,j,)/12,;,t,j,为,x,(,或,y,),中第,j,个相同秩次的个数。,查,附表,19,确定,P,的大小。,1,),Spearman,相关系数(,r,s,),【,例,9-2】

8、,12,名,27,岁急性白血病患儿的血小板数与出血症状资料见下表,分析两者之间有无直线关系:,H,0,:,0,,,H,1,:,0,r,sc,0.4222,查统计用,附表,19,,,r,0.05/2(12),0.587,,,P,0.05,不能以,0.05,水准拒绝,H,0,,不能认为,2,7,岁急性白血病患儿的血小板数与出血症状之间有直线相关关系。,2,),Kendall,相关系数,在,X,的秩从小到大排列后,计算配对的,Y,每个秩下面更大者的个数,合计值记为,S,,计算,r,K,并在相同秩次较多时校正:,其中,,n,为对子数,,U,x,或,U,y,(,t,j,2,t,j,)/2,,,t,j,为

9、第,j,个相同秩次的个数。,查,附表,20,确定,P,的大小。,三、相关系数应用注意事项,有实际意义,在两个变量的变化范围内进行相关,不是因果关系,但可做为进一步考证有无因果关系的基础,四、直线相关的应用,一般说来,当,n100,,并对,r,进行假设检验,有统计学意义时:,r,0.7,,则表示两个变量,高度,相关;,0.4,r,0.7,时,则表示两个变量之间,中度,相关;,0.2,r,0.4,时,则两个变量,低度相关,。,待产妇尿中雌三醇含量和产儿体重之间成正相关。那么,如果我们知道了一位待产妇的尿雌三醇含量,能推断出产儿的体重吗?,或产儿的体重可能在什么范围内呢?,身高与体重之间也成正相关关

10、系。那么,身高每增加1厘米,体重增加多少克呢?,上面的相关关系分析不能提供给我们需要的答案。这些要用,直线回归,的方法来解决。,某保险公司承保汽车,5,万量,平均每量保费收入为,1000,元,则该保险公司汽车承保总收入为,5000,万元。,承保总收入:,Y,承保汽车量数:,X,Y=1000X,X,与,Y,两个变量间完全表现为一种确定性关系,即,函数关系,。,第二节 一元回归,银行的,1,年期存款利息年息为,2.25%,,存入的本金用,X,表示,到期的本息用,Y,表示,则,Y=X+2.25%X,这里,Y,与,X,仍表现为一种线性函数关系。,另外一种情况:,两事物之间有着密切的联系,但密切的程度并

11、没有达到由一个可以完全确定另一个的程度。例如:,生长发育阶段动物体重增量与食量,广告费支出与商品销售额,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为,一元回归方程,,这种关系为,一元回归,。,第二节 一元回归,一、直线回归分析,绘制散点图,求直线回归方程,绘制回归直线,回归系数的假设检验,用直线方程描述两个变量间的,数量依存关系,。,一般形式:,a:,截距,b,:回归系数(回归直线斜率),1.,直线回归方程的求法,b,0,x,y,;,b,0,x,y,b,:意义为,x,每变化一个单位,,y,变化的平均值,x,:

12、自变量,要求容易测定、容易控制,:,y,的估计值,,y,称因变量,要求在不同的,x,的 时候其分布为正态分布,y,a,、,b,的计算(用最小二乘法原理估计,b,),n,:对子数(数据对),剩余误差,,,残差,:各实测值,y,至回归直线纵向距离。,剩余平方和或残差平方和最小,。,SS,e,(,y,-),2,SS,总,=,SS,R,+,SS,e,决定系数,(,determining coefficient,,R,2,),:,回归平方和在总平方和中所占的比例。,R,2,=,SS,回,/,SS,总,R,2,=(,n,-1),s,y,2,r,2,/,(,n,-1),s,y,2,=,r,2,R,2,是,评

13、价回归强度,的一个重要指标。,0,R,2,1,,,1,,回归效果越好,强度。,临床研究中,,R,2,0.7,认为回归效果不错。,2.,回归方程拟合效果评价(决定系数),编号,(1),尿雌三醇,mg/24h(2),产儿体重,kg(3),编号,(1),尿雌三醇,mg/24h(2,),产儿体重,kg(3),1,7,2.5,17,17,3.2,2,9,2.5,18,25,3.2,3,9,2.5,19,27,3.4,4,12,2.7,20,15,3.4,5,14,2.7,21,15,3.4,6,16,2.7,22,15,3.5,7,16,2.4,23,16,3.5,8,14,3.0,24,19,3.4,

14、9,16,3.0,25,18,3.5,10,16,3.1,26,17,3.6,11,17,3.0,27,18,3.7,12,19,3.1,28,20,3.8,13,21,3.0,29,22,4.0,14,24,2.8,30,25,3.9,15,15,3.2,31,24,4.3,16,16,3.2,尿雌三醇,x(mg/24h),(1),X,2,(2),产儿体重,Y(kg),(3),Y,2,(4),XY,(5),7,49,2.5,6.25,17.5,9,81,2.5,6.25,22.5,9,81,2.5,6.25,22.5,12,144,2.7,7.29,32.4,14,196,2.7,7.29,

15、37.8,16,256,2.7,7.29,43.2,22,484,4.0,16.02,88.0,25,625,3.9,15.21,97.5,24,576,4.3,18.49,103.2,534,9876,99.2,324.18,1750.0,(1),绘制散点图,(2),求直线回归方程,(3),绘制回归直线,在自变量的变化范围内选两点做直线,(,0,,,a,)(,X,,,Y,),这两点可以用来核对图线绘制是否正确。,例题中得到的直线回归方程一定经过,(,0,,,2.15,)(,17.23,,,3.2,),两点。,直线回归方程从样本资料计算而得,有抽样误差。,需要,对样本的回归系数,b,进行假设检

16、验,以判断,b,是否从回归系数为零的总体中抽得,。,总体的回归系数一般用,表示。,是否能说明雌三醇与产儿体重之间一定存在回归关系?,t,-,检验,H,0,:,=0,(直线回归方程不成立),H,1,:,0,(直线回归方程成立),进行,=0,的假设检验(即,与,间无直线回归关系),t,检验或,检验,相关系数的检验,代替,(4),回归系数的假设检验,=,n,-2,H,0,:,=0,H,1,:,0 =0.05,=31-2=29,查表,t,0.0005/2,28,=3.9351,,,P,0.0005,拒绝,H,0,,接受,H,1,,认为待产妇,尿中雌三醇含量与产儿体重,之间存在直线回归关系。,二、直线回

17、归方程的应用,估计,:,描述两变量间的依存关系,通过回归系数的假设检验,若认为两变量之间存在直线回归关系,则可用直线回归来描述。,利用回归方程进行预测,把自变量代入回归方程,对应变量进行估计。例如,已知某待产妇的尿雌三醇浓度,估计产儿的体重范围。,利用回归方程进行统计控制,胰岛素与血糖,制定正常值范围,血细胞,血红蛋白等,三、曲线拟合,对呈曲线关系的资料,可用散点图分析曲线的类型,建立曲线回归方程。,常用曲线的类型:,对数:,a,b,ln,X,指数:,ln,a,bX,幂函数:,ln,a,b,ln,X,Logistic,:,四、相关与回归分析注意事项,1.,实际意义,进行相关回归分析要有实际意义

18、,不可把毫无关系的两个事物或现象用来作相关回归分析。,2.,相关关系,相关关系不一定是因果关系,也可能是伴随关系,并不能证明事物间有内在联系。例如,同一父母生的兄弟,往往哥高弟也高,这主要与遗传因素及生活条件相关,而不能说哥高是弟高的原因。但,如果事物之间存在因果关系,则两者必然是相关的,。,3.,利用散点图,对于性质不明确的两组数据,可先做散点图,在图上看它们有无关系、关系的密切程度、是正相关还是负相关,然后再进行相关回归分析。,4.,变量范围,相关分析和回归方程仅适用于样本的原始数据范围之内,出了这个范围,我们不能得出两变量的相关关系和原来的回归关系。,资料要求,直线回归要求应变量,Y,是

19、服从正态分布,的随机变量,,X,是可以精确测量和严格控制的变量,一般称为,I,型回归,;,直线相关要求,X,和,Y,服从双变量正态分布,,二者间若进行回归分析,则称为,II,型回归,。,参与相关分析的两个变量,无主次之分,,参与回归分析的两个变量则有,自变量和应变量,之分。,五、相关与回归的区别,应用,说明两变量间的,关联关系用相关分析,;,说明两者数量上的,依存关系则用回归分析,。,意义,b,表示,X,每改变一个单位,,Y,平均改变,b,个单位,;,r,说明具有线性关联的两个变量间关系的,密切程度和相关方向,。,r,的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度

20、越高。,b,的绝对值越大,回归直线越陡,说明当,X,变化一个单位时,,Y,的平均变化就越大。,五、相关与回归的区别,计算方法,取值范围,单位,r,无量纲;,b,有量纲。,五、相关与回归的区别,六、相关与回归的联系,关系:,能进行回归分析的变量之间存在相关关系。所以,对于两组新数据(两个变量)可先做散点图,求出它们的相关系数,对于确有相关关系的变量再进行回归分析,求出回归方程。,六、相关与回归的联系,相关系数,r,与回归系数,b,:,),r,与,b,的,符号一致,。,r,为正时,,b,也为正,表示两变量是正相关,是同向变化。,r,为负时,,b,也为负,表示两变量是负相关,是反向变化。,),r,与,b,的,假设检验结果一致,,可用,r,的显著检验代替,b,的显著性检验。,)已知,x,、,y,的标准差,s,x,、,s,y,时,积差相关系数,r,与回归系数,b,可以,相互推算,。,r,=,b s,x,/s,y,,,b,=,r s,y,/s,x,回归强度和相关强度可以互相解释,:,决定系数,r,2,【,习题,】,查,医宗金鉴,中治积聚处方,得下表资料,用建立回归方程方法得到,=1.967+0.735,x,具有统计学意义,,R,2,=0.9996,。拟合度达,99.96%,。可见,用回归方程描述名医治病用药的配伍规律准确有效。,

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服