1、两变量关联性分析两变量关联性分析莫景富莫景富卫生统计学教研室卫生统计学教研室 本章内容本章内容一、一、pearsonpearson线性相关线性相关二、二、SpearmanSpearman秩相关秩相关三、分类变量的关联性分析三、分类变量的关联性分析一、相关分析一、相关分析研究两个事物或现象间的关联性强度。研究两个事物或现象间的关联性强度。1.pearson1.pearson线形相关线形相关 -两个连续性正态分布资料之间的相关两个连续性正态分布资料之间的相关2.Spearman2.Spearman秩相关秩相关 -两个非正态分布资料(或一个变量不服从正两个非正态分布资料(或一个变量不服从正态分布、或
2、总体分布未知、等级资料)之间的相态分布、或总体分布未知、等级资料)之间的相关关3.3.分类变量的关联性分析分类变量的关联性分析 -两个分类变量之间的相关性分析两个分类变量之间的相关性分析菜单位置:菜单位置:analyzecorrelateBivariate(双变量)(双变量)第一节第一节 pearson线性相关线性相关例例10-1(p194)在某地一项膳食调查中,调查对象在某地一项膳食调查中,调查对象为为14名名4060岁的中年健康妇女,测岁的中年健康妇女,测得每人的基础代谢(得每人的基础代谢(kj/d)与体重)与体重(kg)的数据。据此数据如何判断这)的数据。据此数据如何判断这两变量间有无关
3、联?两变量间有无关联?步骤:步骤:1、变量设置、变量设置2、输入数据、输入数据3、作散点图(、作散点图(Scatter/Dot)步骤graphslegacy dialogsScatter/DotScatter/Dot对话框:对话框:点击点击simple(单式散点图)(单式散点图)-define定义散点图(横坐标轴、纵坐标轴)定义散点图(横坐标轴、纵坐标轴)可双击散点图进行编辑可双击散点图进行编辑4 4、正态性检验、正态性检验正态性检验结果正态性检验结果5 5、相关分析、相关分析 分析分析相关相关双变量双变量变量相关分析对话框变量相关分析对话框OptionsOptions对话框对话框描述均数、标
4、准差、样本含量描述均数、标准差、样本含量简略结果简略结果第二节第二节 秩相关秩相关适用资料:适用资料:不服从正态分布的资料不服从正态分布的资料 总体分布类型未知的资料总体分布类型未知的资料 原始数据用等级表示的资料原始数据用等级表示的资料例例10-510-5 (p200p200)某研究者观察了某研究者观察了1010例例6 6个个月月7 7岁的贫血患儿的血红蛋白含量与贫血岁的贫血患儿的血红蛋白含量与贫血体征,试作秩相关分析。体征,试作秩相关分析。分析分析1 1、x x变量(血红蛋白)连续性计量资料变量(血红蛋白)连续性计量资料2 2、y y变量(贫血体征)为等级资料变量(贫血体征)为等级资料3
5、3、选用、选用spearmanspearman秩相关分析秩相关分析步骤:步骤:1 1、变量设置、输入数据、变量设置、输入数据2 2、spearmanspearman分析分析 秩相关系数为秩相关系数为-0.741-0.741,近似,近似P P值为值为0.0140.014,小,小于于0.050.05,拒绝,拒绝H H0 0,认为血红蛋白与贫血体征之间,认为血红蛋白与贫血体征之间有相关关系。有相关关系。第三节第三节 分类变量的关联性分析分类变量的关联性分析 根据两个定性变量交叉分类计数所得的频根据两个定性变量交叉分类计数所得的频数资料(列联表)作关联(数资料(列联表)作关联(associationa
6、ssociation)分析,)分析,即关于两种属性独立性的即关于两种属性独立性的x x2 2检验。检验。一、交叉分类一、交叉分类2222表的关联分析表的关联分析例例10-7 10-7(p201p201)为了观察大学生专业与艾滋病知为了观察大学生专业与艾滋病知晓程度之间是否有关,某研究者调查晓程度之间是否有关,某研究者调查了某大学一年级不同专业的了某大学一年级不同专业的500500学生。学生。试分析大学生专业与艾滋病知晓程度试分析大学生专业与艾滋病知晓程度之间的关联性。之间的关联性。1 1、变量设置,数据输入、变量设置,数据输入2 2、加权,、加权,weight casesweight case
7、s3、analyze-descriptive statistics-crosstabs记录处理情况记录处理情况列联表列联表假设检验结果:假设检验结果:Pearson Pearson 卡方值为卡方值为42.57942.579,近似概率为,近似概率为0.0010.001,拒,拒绝绝H H0 0,两变量存在关联性。,两变量存在关联性。中文版结果中文版结果Nominal by Nominal Contingency CoefficientNominal by Nominal Contingency Coefficient 名义变量名义变量 列联系数列联系数Interval by interval Pe
8、arsons RInterval by interval Pearsons R 数值变量数值变量 Pearson Pearson相关系数相关系数Ordinal by ordinal SpearmanOrdinal by ordinal Spearman 有序变量有序变量 Spearman Spearman相关系数相关系数 名义变量名义变量phiphi系数为系数为-0.292-0.292,近似,近似p p值为值为0.0010.001,列联系数(列联系数(contingency coefficientcontingency coefficient)为为0.2800.280,近似,近似p p值为值为
9、0.0010.001,拒绝拒绝H H0 0,接受接受H H1 1,可以认为大学生专业与,可以认为大学生专业与艾滋病知晓程度之间存在关联性。艾滋病知晓程度之间存在关联性。二、配对资料关联性分析二、配对资料关联性分析例例10-810-8(p203p203)有有132132份食品标本,把每份标本一分为二,分份食品标本,把每份标本一分为二,分别用两种检测方法做沙门菌检验。试问两别用两种检测方法做沙门菌检验。试问两种检测方法的结果是否存在关联?种检测方法的结果是否存在关联?1 1、变量设置、变量设置输入数据输入数据2 2、加权、加权3 3、分析、分析analyze-descriptive statist
10、ics-analyze-descriptive statistics-crosstabscrosstabs记录处理情况记录处理情况列联表列联表PhiPhi系数为系数为0.1920.192,列联系数为列联系数为0.1890.189,近似,近似P P值为值为0.0270.027三、三、RCRC表的关联性分析表的关联性分析例例10-910-9(p 204 p 204)欲欲探探讨讨职职业业类类型型与与胃胃病病类类型型是是否否有有关关联联。某某医医生生将将收收治治的的310310名名胃胃病病患患者者按按主主要要职职业业类类型型与与胃胃病病类类型型两两种种属属性性交交叉叉分分类类,结结果果见见表表10-6
11、.10-6.问问职职业业类类型型与与胃胃病病类类型型间间有有无关联?无关联?1.1.设置变量、输入数据设置变量、输入数据2 2、加权、加权3 3、分析、分析选择统计量选择统计量记录处理情况记录处理情况延伸内容延伸内容四、两有序分类变量的关联性分析四、两有序分类变量的关联性分析例例10-11(p206)某研究者欲了解某研究者欲了解20岁以上成年人研究晶状体浑浊岁以上成年人研究晶状体浑浊程度与年龄的相关关系,收集资料见表程度与年龄的相关关系,收集资料见表10-9。请分析成年人研究晶状体浑浊程度与年龄的关请分析成年人研究晶状体浑浊程度与年龄的关联性联性先加权先加权方法一方法一 在在crosstabscrosstabs中分析中分析方法二方法二 在在correlatecorrelate中分析中分析五、五、KappaKappa指数指数例例10-1210-12(p208p208)对某大学对某大学537537名女生先后进行两次名女生先后进行两次内容相同的营养调查(相隔内容相同的营养调查(相隔2 2个月),个月),其中食用鸡蛋的情况见表其中食用鸡蛋的情况见表10-11.10-11.试对试对该调查的质量进行评价。该调查的质量进行评价。1 1、加权、加权2 2、在、在crosstabscrosstabs中分析中分析