收藏 分销(赏)

检验医学数据常用的相关性分析(理论依据).ppt

上传人:a199****6536 文档编号:2566103 上传时间:2024-06-01 格式:PPT 页数:43 大小:751.50KB
下载 相关 举报
检验医学数据常用的相关性分析(理论依据).ppt_第1页
第1页 / 共43页
检验医学数据常用的相关性分析(理论依据).ppt_第2页
第2页 / 共43页
点击查看更多>>
资源描述
第十二章第十二章 线性相关线性相关 (linear correlation)线性相关线性相关(linear correlation),即直线相关,是分析两变量间有无直线相关关系直线相关关系的一种统计分析方法。第一节第一节 直线相关直线相关编号编号血铅(血铅(X)尿铅(尿铅(Y)10.110.1420.250.2530.230.2840.240.2550.260.2860.090.1070.250.2780.060.0990.230.24100.330.30110.150.16120.040.05130.200.20140.340.32150.220.24表12-1 15例自愿者的血铅和24小时的尿铅测量值(moL/L)例例例例12-1 12-1 测得某地测得某地测得某地测得某地1515名名名名正常成年人的血铅正常成年人的血铅正常成年人的血铅正常成年人的血铅 X X(moL/LmoL/L)和)和)和)和2424小小小小时的尿铅时的尿铅时的尿铅时的尿铅 Y Y(moL/LmoL/L)如表)如表)如表)如表12-112-1,试分析血铅与,试分析血铅与,试分析血铅与,试分析血铅与2424小时的尿铅之间是小时的尿铅之间是小时的尿铅之间是小时的尿铅之间是否直线相关。否直线相关。否直线相关。否直线相关。一、直线相关的意义一、直线相关的意义一、直线相关的意义一、直线相关的意义(Y)(X )12-1(Y)(X )可见,尿铅值较大者,其血铅值也较大,且呈可见,尿铅值较大者,其血铅值也较大,且呈直线趋势。直线趋势。将两个变量间这种伴随增大或伴随减小将两个变量间这种伴随增大或伴随减小的直线变化趋势称线性相关。由此图提示的直线变化趋势称线性相关。由此图提示该资料适该资料适宜作线性相关分析。宜作线性相关分析。12-1二、直线相关系数的含义 相关系数相关系数(linear correlation coefficientlinear correlation coefficient)是描是描述两个随机变量之间线性相关关系的述两个随机变量之间线性相关关系的方向方向方向方向和和密切程密切程密切程密切程度度度度的统计指标。的统计指标。线性相关系数又称积差线性相关系数又称积差相关系数,相关系数,简称简称pearsonpearson相关系数相关系数或相关系数。或相关系数。Karl Pearson(1857-1936)England 相关系数 r 的计算公式:总体相关系数用符号总体相关系数用符号 表示,表示,表示,表示,样本相关系数用样本相关系数用符号符号r r 表示表示表示表示;取值范围:;取值范围:-1 r 1 或或 -1 1 。相关系数相关系数 r r 的取值及两变量间相关关系的直观图示:的取值及两变量间相关关系的直观图示:正相关(0 r 1)YX 负相关(-1 r 0)完全正相关(r=1)完全负相关(r=-1)XYYYXX相关系数相关系数 r r 的取值及两变量间相关关系的直观图示:的取值及两变量间相关关系的直观图示:零相关(r=0)YXYYYXXX三、线性相关系数的计算和检验三、线性相关系数的计算和检验 (1 1)线性相关系数的计算)线性相关系数的计算)线性相关系数的计算)线性相关系数的计算例例例例 计算表计算表12-112-1中尿铅和血铅的相关系数。中尿铅和血铅的相关系数。例例例例 计算表计算表12-112-1中尿铅和血铅的相关系数。中尿铅和血铅的相关系数。解:解:解:解:1 1绘制散点图,观察两变量之间是否有线性趋势。绘制散点图,观察两变量之间是否有线性趋势。(Y)(X )例例例例 计算表计算表12-112-1中尿铅和血铅的相关系数。中尿铅和血铅的相关系数。解:解:解:解:1 1绘制散点图,观察两变量之间是否有线性趋势。绘制散点图,观察两变量之间是否有线性趋势。例例例例 计算表计算表12-112-1中尿铅和血铅的相关系数。中尿铅和血铅的相关系数。解:解:解:解:1 1绘制散点图,观察两变量之间是否有直线趋势。绘制散点图,观察两变量之间是否有直线趋势。2 2计算相关系数。计算相关系数。列表计算基本数据。列表计算基本数据。编编号号尿尿铅铅(X)血血铅铅(Y)X2 Y2 XY10.110.140.01210.01960.015420.250.2530.230.2840.240.2550.260.2860.090.1070.250.2780.060.0990.230.24100.330.30110.150.16120.040.05130.200.20140.340.32150.220.24合合计计 3.00 3.17 0.7168 0.7681 0.7388表表12-1 15例自愿者的血铅和例自愿者的血铅和24小时的尿铅测量值(小时的尿铅测量值(moL/L)(2 2 2 2)相关系数的假设检验)相关系数的假设检验)相关系数的假设检验)相关系数的假设检验 假设检验的目的是推断总体相关系数假设检验的目的是推断总体相关系数 是否等于是否等于0 0?方法方法:t t 检验法检验法 查表法查表法 检验统计量 t 的计算公式:t 检验法例例 根据上例的样本相关系数,对总体相关系数根据上例的样本相关系数,对总体相关系数 作作假设检验。假设检验。例例 根据上例的样本相关系数,对总体相关系数根据上例的样本相关系数,对总体相关系数 作作假设检验。假设检验。解:解:建立假设,确定检验水准。HH0 0:=0=0 (两变量间不存在线性相关关系);(两变量间不存在线性相关关系);HH1 1:0 0 (两变量间有线性相关关系);(两变量间有线性相关关系);=0.050.05 计算检验统计量。本例,n=15,r=0.9787,计算检验统计量。计算检验统计量。本例,本例,n n =15,=15,r r =0.9787=0.9787,查界值表,确定查界值表,确定P P 值,下结论。值,下结论。按按 v v=13=13 查查 t t 界值表,界值表,则则 P P 0.0010.001,按,按=0.05=0.05水准拒绝水准拒绝H H0 0,接受,接受H H1 1,可认为血铅,可认为血铅和尿铅之间存在正相关关系。和尿铅之间存在正相关关系。查表法查表法 =0.05 r=0.9110 查 r 界值表,v=14,r r0.01/2,14,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正 相关关系。查表法查表法 HH0 0:=0=0 (两变量间不存在线性相关关系);(两变量间不存在线性相关关系);HH1 1:0 0 (两变量间有线性相关关系);(两变量间有线性相关关系);=0.050.05 r=0.9787 查 r 界值表,v=14,r r0.01/2,14,所以 P 0.01,按 水准拒绝H0,接受H1,可认为体重指数和收缩压之间存在正 相关关系。查表法查表法 HH0 0:=0=0 (两变量间不存在线性相关关系);(两变量间不存在线性相关关系);HH1 1:0 0 (两变量间有线性相关关系);(两变量间有线性相关关系);=0.050.05 r=0.9787 查查 r r 界值表界值表,v v=13=13,r0.001/2,13=0.760 ,r r0.001/2,13,所以所以 P P 0.001 0.001,按,按 水准拒绝水准拒绝HH0 0,接受,接受HH1 1,结论同上。,结论同上。计算总体相关系数的可信区间时,由于计算总体相关系数的可信区间时,由于r r 呈非呈非正态分布,所以需要先对正态分布,所以需要先对r r 作作 Z Z 转换转换:四、相关系数的可信区间四、相关系数的可信区间 计算总体相关系数的可信区间:计算总体相关系数的可信区间:计算总体相关系数的可信区间:计算总体相关系数的可信区间:对对对对 r r 作作作作 Z Z 变换:变换:变换:变换:按正态近似原理计算按正态近似原理计算按正态近似原理计算按正态近似原理计算 Z Z 的(的(的(的(1-1-)可信区间:)可信区间:)可信区间:)可信区间:对对对对Z Z 的上下限作反变换,还原得到的上下限作反变换,还原得到的上下限作反变换,还原得到的上下限作反变换,还原得到 r r 的(的(的(的(1-1-)可信区间:可信区间:可信区间:可信区间:例例例例 前例得前例得前例得前例得r r=0.9787=0.9787,求总体相关系数,求总体相关系数,求总体相关系数,求总体相关系数 的的的的 95%95%可信区间。可信区间。可信区间。可信区间。解:解:解:解:1 1先将先将先将先将r r 值转换为值转换为值转换为值转换为Z Z值:值:值:值:2 2查查查查 Z Z 界值表得界值表得界值表得界值表得 Z Z0.05/20.05/2=1.96=1.96,代入公式计算,代入公式计算,代入公式计算,代入公式计算Z Z的的的的95%95%可信区间:可信区间:可信区间:可信区间:3 3还原得还原得还原得还原得 的的的的95%95%可信区间:可信区间:可信区间:可信区间:(0.9350.935,0.9930.993)即血铅与即血铅与即血铅与即血铅与2424小时尿铅的总体线性相关系数的小时尿铅的总体线性相关系数的小时尿铅的总体线性相关系数的小时尿铅的总体线性相关系数的95%95%可信区间为(可信区间为(可信区间为(可信区间为(0.9350.935,0.9930.993)。)。)。)。(1 1)绘制散点图;)绘制散点图;)绘制散点图;)绘制散点图;若点的分布有直线趋势,则若点的分布有直线趋势,则若点的分布有直线趋势,则若点的分布有直线趋势,则 (2 2)计算样本相关系数)计算样本相关系数)计算样本相关系数)计算样本相关系数 r r 值;值;值;值;(3 3)检验总体相关系数)检验总体相关系数)检验总体相关系数)检验总体相关系数 =0=0;若若若若 0 0,则,则,则,则 (4 4)利用分析结果。)利用分析结果。)利用分析结果。)利用分析结果。(如:描述(如:描述 X X,Y Y 之间的线性关系之间的线性关系以及对总体相关系数进行估计等。)以及对总体相关系数进行估计等。)线性相关分析的一般步骤:?1.1.1.1.线性相关分析要求两变量线性相关分析要求两变量 X X,Y Y 服从服从双变量正态分布双变量正态分布双变量正态分布双变量正态分布。五、线性相关分析的注意事项五、线性相关分析的注意事项 X Yf(x,y)0错误错误错误错误1 1 曲线关系误作直线相关曲线关系误作直线相关曲线关系误作直线相关曲线关系误作直线相关 YX错误错误错误错误2 2 离群值误导出假相关离群值误导出假相关离群值误导出假相关离群值误导出假相关 2.2.作直线相关分析前应先绘制散点图。作直线相关分析前应先绘制散点图。作直线相关分析前应先绘制散点图。作直线相关分析前应先绘制散点图。当观察点的分当观察点的分布有直线趋势时,才适宜作直线相关分析。布有直线趋势时,才适宜作直线相关分析。XY3.3.作相关分析时,要注意两变量之间是否存在实际意作相关分析时,要注意两变量之间是否存在实际意作相关分析时,要注意两变量之间是否存在实际意作相关分析时,要注意两变量之间是否存在实际意义。义。义。义。不能将毫无实际意义的两种现象作相关。不能将毫无实际意义的两种现象作相关。4.4.相关系数的意义仅限于原始资料中变量的实测范围相关系数的意义仅限于原始资料中变量的实测范围相关系数的意义仅限于原始资料中变量的实测范围相关系数的意义仅限于原始资料中变量的实测范围。超出这个范围就不一定仍具有线性关系或仍保持同超出这个范围就不一定仍具有线性关系或仍保持同样的线性关系了。样的线性关系了。5.5.不能直接根据样本相关系数不能直接根据样本相关系数r r 绝对值的大小来说明绝对值的大小来说明两变量间有无相关关系及相关的紧密程度,而两变量间有无相关关系及相关的紧密程度,而需要需要需要需要对总体相关系数作假设检验。对总体相关系数作假设检验。对总体相关系数作假设检验。对总体相关系数作假设检验。(一)区别(一)区别 1.1.资料要求不同资料要求不同 线性回归分析线性回归分析 线性相关分析线性相关分析 六、线性回归分析与线性相关分析的区别和联系六、线性回归分析与线性相关分析的区别和联系六、线性回归分析与线性相关分析的区别和联系六、线性回归分析与线性相关分析的区别和联系X 是可以精确测量和严格控制的是可以精确测量和严格控制的变量变量Y 是服从正态分布的随机变量是服从正态分布的随机变量X,Y 服从双变量正态分布服从双变量正态分布 2.2.应用的情况不同应用的情况不同 线性回归分析线性回归分析 线性相关分析线性相关分析说明两变量间的说明两变量间的依存关系依存关系,可以用一,可以用一个变量的数值推算另一个变量的数值。个变量的数值推算另一个变量的数值。说明两变量间的说明两变量间的相互关系相互关系,包括描述,包括描述两变量两变量 X,Y 相互之间呈线性关系的相互之间呈线性关系的方向和密切程度。方向和密切程度。(二)联系(二)联系 1.1.方向一致:方向一致:方向一致:方向一致:在同一资料中,计算所得在同一资料中,计算所得 r r与与 b b 值的正、值的正、负号相同。负号相同。2.2.假设检验等价:假设检验等价:假设检验等价:假设检验等价:在同一资料中,对回归系数的假在同一资料中,对回归系数的假设检验和对相关系数的假设检验等价且二者所得检设检验和对相关系数的假设检验等价且二者所得检验统计量验统计量 t t 值相等,即值相等,即 t t r r=t t b b。3.3.对于对于不同组不同组资料来说,相关系数资料来说,相关系数 r r 与与 回归系数回归系数 b b 二者的二者的数值大小之间无直接联系,且二者含义不同。数值大小之间无直接联系,且二者含义不同。第二节第二节 Spearman秩相关秩相关 由于直线相关的统计推断要求两个变量服从由于直线相关的统计推断要求两个变量服从由于直线相关的统计推断要求两个变量服从由于直线相关的统计推断要求两个变量服从双变量正态分布,但在实际应用中有时满足不了双变量正态分布,但在实际应用中有时满足不了双变量正态分布,但在实际应用中有时满足不了双变量正态分布,但在实际应用中有时满足不了这样的条件。这时,需采用非参数的秩相关,常这样的条件。这时,需采用非参数的秩相关,常这样的条件。这时,需采用非参数的秩相关,常这样的条件。这时,需采用非参数的秩相关,常用用用用SpearmanSpearman秩相关。秩相关。秩相关。秩相关。n n例例12-3 12-3 某医生收集某医生收集1212例急性脑梗塞(例急性脑梗塞(AMIAMI)病人,)病人,记录了患者在抢救期间的记录了患者在抢救期间的总胆固醇总胆固醇,用爱丁堡,用爱丁堡-斯斯堪的纳维亚神经病学卒中堪的纳维亚神经病学卒中SNSSSNSS量表评分标准评定量表评分标准评定患者的患者的神经功能缺损程度神经功能缺损程度,试分析总胆固醇与神,试分析总胆固醇与神经功能评分是否相关。经功能评分是否相关。表表表表 12-3 1212-3 12例例例例AMIAMI患者的量表评分与总胆固醇测量值与编秩患者的量表评分与总胆固醇测量值与编秩患者的量表评分与总胆固醇测量值与编秩患者的量表评分与总胆固醇测量值与编秩 初步分析:初步分析:初步分析:初步分析:由于量表评分由于量表评分由于量表评分由于量表评分X X呈偏态分布,不宜作呈偏态分布,不宜作呈偏态分布,不宜作呈偏态分布,不宜作PearsonPearson直线相关分析,可用直线相关分析,可用直线相关分析,可用直线相关分析,可用SpearmanSpearman秩相关秩相关秩相关秩相关分析量表评分分析量表评分分析量表评分分析量表评分X X与总胆固醇与总胆固醇与总胆固醇与总胆固醇Y Y的相关性。的相关性。的相关性。的相关性。建立假设,确定检验水准。建立假设,确定检验水准。建立假设,确定检验水准。建立假设,确定检验水准。H H0 0:s s0 0,即量表评分与总胆固醇不相关,即量表评分与总胆固醇不相关 H H1 1:s s 0 0,即量表评分与总胆固醇相关,即量表评分与总胆固醇相关 0.050.05 对对对对X X、Y Y 编秩,计算平均秩,并计算编秩,计算平均秩,并计算编秩,计算平均秩,并计算编秩,计算平均秩,并计算SpearmanSpearman秩相秩相秩相秩相关系数。关系数。关系数。关系数。查界值表查界值表查界值表查界值表(n50n50),判断判断判断判断 s s0 0?按按 n n=12=12 查查 r rs s 界值表,界值表,则,则 P P 0.00150)50),则用,则用 t t 检验检验判断判断判断判断 s s0 0?若若H0:s0为真时,统计量为真时,统计量 t tr rs s 近似服从自由度近似服从自由度 为为n2的的 t 分布。分布。本本 章章 内内 容容n n线性相关的概念线性相关的概念n n样本相关系数的计算样本相关系数的计算n n对相关系数的假设检验对相关系数的假设检验n n相关系数的可信区间相关系数的可信区间n n线性相关分析的注意事项线性相关分析的注意事项n n线性相关分析与线性回归分析的区别和联系线性相关分析与线性回归分析的区别和联系作业:作业:作业:作业:一、是非题一、是非题一、是非题一、是非题二、最佳选择题二、最佳选择题二、最佳选择题二、最佳选择题三、计算题三、计算题三、计算题三、计算题 2.2.
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 行业资料 > 医学/心理学

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服