收藏 分销(赏)

卡方检验及SPSS分析.ppt

上传人:快乐****生活 文档编号:9287527 上传时间:2025-03-19 格式:PPT 页数:109 大小:4.64MB
下载 相关 举报
卡方检验及SPSS分析.ppt_第1页
第1页 / 共109页
卡方检验及SPSS分析.ppt_第2页
第2页 / 共109页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,.,*,卡方检验,Chi-Square Test,预防医学教研室,张杰,1,.,课程内容,第一节:四格表(,fourfold data,)资料的,x,2,检验*,第二节:配对(,paired data,)资料的,x,2,检验*,第三节:,RC,表资料的,x,2,检验*,第四节:分层卡方检验,第五节:多个样本率间的多重比较,课程小结,2,.,SPSS,统计分析,交叉表,(,Crosstabs,)过程,(一)四格表(,fourfold data,)资料的,x,2,检验,(二)配对(,paired data,)资料的,x,2,检验,(三),R,C,表资料的,x,2,检验,(四)两分类变量有无关联分析及列联系数,C,卡方,(,Chi-Square,)过程,(五)拟合问题,-,比较样本与已知总体的分布,3,.,第一节,四格表资料的 检验,x,2,test of fourfold data,4,.,目的:,推断两个总体率(构成比)是否有差,别,要求:,两样本的两分类个体数排列成四格表,资料,5,.,一、,2,检验的基本思想,2,是一种用途较广的,计数资料,的假设检验方法,属于,非参数检验,的范畴。,根本思想:,在于比较理论频数和实际频数的吻合程度或拟合优度问题。,x,2,检验:以,x,2,分布为方法的理论基础,6,.,2,检验的基本公式,A,为实际频数(,actual frequency,),,T,为理论频数(,theoretical frequency,),n,R,是行和,,n,C,是列和,,n,是四格数之和,2,表示观察值与期望值之间的偏离程度。,1900,年由英国统计学家,Karl Pearson,首次提出,故被称为,Pearson,2,。,7,.,8,.,*例,1,:四格表资料的,x,2,检验,x,2,检验基本步骤,建立检验假设,H0,:,两,总体龋患率,相等,H1,:,两,总体,龋患率,不等,计算,理论,频数,计算,x,2,统计量,确定,P,值,作出推论,9,.,四格表 检验的条件:,1),2),3),校正公式:,10,.,SPSS,操作过程,建立数据文件:例,1.sav,数据格式:包括,4,行,3,列的频数格式,,3,个变量即行变量(,group,)、列变量(,effect,)和频数变量(,freq,)。,说明频数变量:,数据 加权个案,Data Weight Cases,x,2,检验:从菜单选择,分析 描述统计,交叉表,Analyze,Descriptive Statistics Crosstabs,结合例,1,数据演示操作过程。,11,.,首先建立数据文件,如下。,12,.,注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。,13,.,*指定加权变量,(,weight cases,),在,实际的统计中,经常需要计算数据的加权平均数,。,例如,希望了解不用牙膏使用者的平均患龋量。,如果,仅以,各种牙膏的患龋量的平均数作为平均患龋量是,不合理,的,还,应考虑到,各牙膏使用者的患龋量对平均患龋量的,影响,。,因此,,,以各牙膏使用者的患龋量作为,权重计算,各牙膏患龋率的,加权平均数,才是我们需要求的数据,。,在,SPSS,处理中就需要,将各牙膏的患龋量作为,加权变量。,14,.,不设置权重,设置权重,频数变量,“Weight Cases”,对话框,15,.,16,.,交叉表(,Crosstabs,)过程,Crosstabs,过程用于对分类资料和有序分类资料进行,统计描述,和,统计推断,。,统计描述过程可以产生,2,维至,n,维列联表,并计算相应的百分数指标。,统计推断包括了常用的,x,2,检验、,Kappa,值,分层,X,2,(,X,2,M-H,),以及四格表资料的确切概率(,Fishers Exact Test,)值。,17,.,行变量,列变量,计算统计量,单元格,卡方统计量,Kappa,系数,风险度,配对四格表,McNemar,检验,实际频数,理论频数,18,.,Crosstabs,过程详解,界面说明,-,行,Rows,框,用于选择行,列表中的行变量。,-,列,Columns,框,用于选择行,列表中的列变量。,-,层,Layer,框,指定分层变量,即控制变量。如果要指定不同的分层变量做分析,则将其选入,Layer,框,并用,Previous,和,Next,钮设为不同层。,-Display clustered bar charts,复选框,:显示复式条图,-Suppress table,复选框,:不在输出结果中给出行,列表。,19,.,Crosstabs,过程详解,界面说明,精确(,Exact,)子对话框:针对,22,以上的行,列表设计计算确切概率的方法。,统计量(,Statistics,)子对话框:用于定义所需计算的统计量,-Chi-square,复选框:计算,pearson,卡方值,对四格表资料自动给出校正卡方检验和确切概率法结果。,-Correlations,复选框:计算行列变量的,pearson,相关系数和,Spearman,等级相关系数。,20,.,Crosstabs,过程详解,界面说明,-Kappa,复选框:计算,Kappa,值,即内部一致性系数,介于,00.7071,之间;,-Risk,复选框:计算比数比,OR,值、,RR,值;,-McNemanr,复选框:进行配对卡方检验的,McNemanr,检验(一种非参数检验),-Cochrans and Mantel-Haenszel statistics,复选框:计算,X,2,M-H,统计量、,X,2,CMH,,可在下方输出,H,0,假设的,OR,值,默认为,1,。,21,.,Crosstabs,过程详解,界面说明,单元格(,Cells,)子对话框:用于定义列联表单元格中需要计算的指标。,-Counts,复选框:是否输出实际观察数(,Observed,)和理论频数(,Expected,),-Percentages,复选框:是否输出行百分数(,Row,)、列百分数(,Column,)以及合计百分数(,Total,),-Residuals,复选框:选择残差的显示方式,格式(,Format,)子对话框:用于选择行变量是升序还是降序排列。,22,.,表示含氟牙膏与一般牙膏患龋率的比较,,除了观察值以外,还有期望值。,实际频数,理论频数,SPSS,结果输出,23,.,结论:,2,2.8,2,,,P,0.093,,,按,=0.05,水准,不拒绝,H0,,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。,卡方值,自由度,P,值,双侧确切概率值,单侧确切概率值,Pearson,卡方,连续校正卡方,似然比卡方,Fisher,确切卡方,线性相关检验,样本数,注意检查样本例数,n,和理论频数,T,是否满足条件:,N40,且理论频数,T5,。,24,.,*例,2.,x,2,检验,-,校正公式,将,116,例癫痫患者随机分为两组,一组,70,例接受常规加高压氧治疗(高压氧组),另一组,46,例接受常规治疗(常规组),结果如下。,问两种疗法的有效率有无差别?,25,.,26,.,27,.,T5,28,.,,按,检验水准不拒绝 ,尚不能认为组有效率不等。,本资料若不校正时,结论与之相反。,29,.,*例,3.,x,2,检验,-Fisher,确切概率法,30,.,(一)适用条件,T1,或,n40 P,(二)基本思想(超几何分布),在四格表周边合计不变的条件下,直接计算表内四个数据的各,种组合之概率。找出 的所有表格并将概率求,和,若这些表的合计,P,,则推翻,H,0,假设。,*例,3.,x,2,检验,-Fisher,确切概率法,31,.,(三)检验步骤,假设,H,0,、,H,1,2.,计算最小理论频数 及 值,边缘合计不变条件下,变动表中数据,3.,找出边缘合计中的最小值,对应的格子中的数据从,0,到 ,排出所有,可能的四格表。,5.,选出 值的所有表,分别求,P,值后相加。,32,.,33,.,SPSS,操作过程,建立数据文件:例,3.sav,数据格式:包括,4,行,3,列的频数格式,,3,个变量即行变量(,group,)、列变量(,effect,)和频数变量(,freq,)。,说明频数变量:,数据 加权个案,Data Weight Cases,x,2,检验:从菜单选择,分析 描述统计,交叉表,Analyze,Descriptive Statistics Crosstabs,结合数据(例,3.sav,)演示操作过程。,34,.,实际频数,理论频数,35,.,Fisher,确切概率,36,.,第二节,配对资,料的 检验,x,2,test of,paired fourfold data,37,.,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有,成组设计,和,配对设计,,即,四格表资料,和,配对四格表资料,。,38,.,例,4,某抗癌新药的毒理研究,将,78,只大鼠按性别、窝别、体重、年龄等因素配成,39,对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,试验结果见下表。分析该新药两种不同剂量的毒性有无差异。,配对(,paired data,)资料的,x,2,检验,39,.,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有,四种可能,:,两种剂量方法皆为阳性数,(,a,),;,两种剂量方法皆为阴性数,(,d,),;,甲剂量注射法为阳性,乙剂量注射法法为阴性数,(,b,),;,乙剂量注射法为阳性,甲剂量注射法为阴性数,(,c,),。,40,.,其中,,a,d,为两法结果一致的两种情况,,b,c,为两法结果不一致的两种情况。,检验统计量为,41,.,注意:,本法一般用于,样本含量不太大,的资料。因为它仅考虑了两法结果不一致的两种情况,(,b,c,),,而未考虑样本含量,n,和两法结果一致的两种情况,(,a,d,),。所以,当,n,很大且,a,与,d,的数值很大(即两法的一致率较高),,b,与,c,的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,42,.,检验步骤:,43,.,SPSS,操作过程,建立数据文件:例,4.sav,数据格式:包括,4,行,3,列的频数格式,三个变量分别为行变量、列变量和频数变量。,说明频数变量:,数据 加权个案,Data Weight Cases,x,2,检验:从菜单选择,分析 描述统计,交叉表,Analyze,Descriptive Statistics Crosstabs,统计量,Statistics,:,McNemar,Kappa,44,.,选中进行配对卡方检验,45,.,46,.,Pc,),47,.,例,4,的问题改为:试评价两种剂量对老鼠致死率的一致性。,(,评价两种方法对同一样本的一致性),配对四格表,McNemar,检验,Kappa,系数,48,.,在,Pearson,卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。,在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同,。,Kappa,一致性检验,目的:检验两种方法对同一个样本(研究对象)的检验结果是否一致,一致性检验,49,.,一般认为,,当,Kappa,0.75,时,表明两者一致性较好;,0.75,Kappa,0.4,时,表明一致性一般;,Kappa,0.4,时,表明两者一致性较差。,一致性检验,50,.,P,值,Kappa,系数,=0.1980.05,说明两种方法的吻合度没有统计学意义,且吻合度较差。,Pc,),两种结论一致,51,.,*例,5,用,A,、,B,两种方法检查已确诊的乳腺癌患者,140,名,,A,法检出,91,名,(65%),,,B,法检出,77,名,(55%),,,A,、,B,两法一致的检出,56,名,(40%),,问哪种方法阳性检出率更高?,练习题(课后自行练习),52,.,注意!,计数资料的配对设计常用于,两种检验方法、培养方法、诊断方法,的比较,特点:,对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的技术结果,53,.,第三节,行,列表资料的 检验,test of RC table,54,.,比较某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率。,以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否一致,。,推断,2,个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。,。,55,.,行,列表资料,多个样本率比较时,有,R,行,2,列,称,R,2,表;,两样本的构成比比较时,有,2,行,C,列,称,2,C,表;,多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称,R,C,表。,56,.,检验统计量,57,.,3.1,多个样本率的比较,例,6,用,A,、,B,、,C,三种不同方法分别处理新生儿脐带,发生感染的情况见下表,,试比较,3,种不同方法的脐带感染率有无差异。,三种脐带处理方法的脐带感染情况,58,.,59,.,SPSS,操作过程(行,列表卡方检验),建立数据文件:例,6.sav,数据格式:包括,6,行,3,列的频数格式,,3,个变量分别为行变量、列变量和频数变量。,说明频数变量:,数据 加权个案,Data Weight Cases,x,2,检验:从菜单选择,分析 描述统计,交叉表,Analyze,Descriptive Statistics Crosstabs,结合例,6,数据(例,6.sav,)演示操作及界面。,60,.,结论:按,=0.05,检验水准拒绝,H,0,,接受,H,1,,可以认为三种处理脐带感染率有差别。,61,.,3.2,两组构成比的比较,例,7,为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者,144,例随机分为两组,每组,72,例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见下表,问两组患者尿路疼痛原因的分布有无差异?,两组患者尿路疼痛原因的分布,62,.,63,.,结论:按,=0.05,检验水准不拒绝,H,0,,尚不可认为两组患者尿路疼痛原因的分布有差异。,64,.,3.4,多组构成比的比较,例,8,在某项疼痛测量研究中,给,160,例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(,VAS,),数字评估量表(,NRS,),词语描述量表(,VDS,),面部表情疼痛量表(,FPS,),患者首选的量表以及患者的文化程度见下表,问患者首选疼痛量表与文化程度是否有关,?,不同文化程度患者首选疼痛量表的类型,65,.,66,.,结论:按,=0.05,检验水准不拒绝,H,0,,尚不能认为术后疼痛患者首选测痛量表类型与文化程度有关。,67,.,3.5,双向无序分类资料的关联性检验,表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序,表资料。,注意,:,双向无序分类资料为两个或多个样本,做差别检验(例,7,),;若为单样本,做关联性检验(,例,9,),。,68,.,例,9,测得某地,5801,人的,ABO,血型和,MN,血型结果如下表,问两种血型系统之间是否有关联?,(单样本,做关联性检验),69,.,上表资料,可用行,列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算,Pearson,列联系数,C,进一步分析关系的密切程度:,列联系数,C,取值范围在,0,0.7071,之间。,0,表示完全独立;,0.7071,表示完全相关。,70,.,检验步骤,71,.,由于列联系数,C,=0.1883,,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,72,.,SPSS,操作过程,建立数据文件:例,9.sav,数据格式:包括,12,行,3,列的频数格式,三个变量分别为行变量、列变量和频数变量。,说明频数变量:,数据 加权个案,Data Weight Cases,x,2,检验:从菜单选择,分析 描述统计,交叉表,Analyze,Descriptive Statistics Crosstabs,统计量,Statistics,:,Chi-square,名义 相依系数,Contingency coefficient,73,.,SPSS,输出结果,74,.,结论:按,=0.05,检验水准拒绝,H,0,,接受,H,1,,可认为两种血型系统间有关联,但由于列联系数,C=0.1883,,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,75,.,1,行列表中的各格,T,1,,并且,1,T,5,的格子数不宜超过,1/5,格子总数,,否则可能产生偏性。处理方法有三种:,增大样本含量以达到增大理论频数的目的(首选)。,根据,专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。,例如,:,不同年龄组可以合并,但不同血型就不能合并。,改用双向无序,RC,表的,Fisher,确切概率,法。,R,C,表 检验的注意事项,76,.,77,.,78,.,练习题,例,10.,某实验室为研究乙肝免疫球蛋白预防小白鼠胎儿宫内感染,HBV,的效果,将,33,例,HBsAg,阳性小白鼠(孕鼠)随机分为预防注射组和非预防组,结果见下表。问两组新生小白鼠的,HBV,总体感染率有无差别?,组别,阳性,阴性,合计,感染率(,%,),预防注射组,4,18,22,18.18,非预防组,5,6,11,45.45,合计,9,24,33,27.27,79,.,第四节,分层资料的卡方检验,Tests of Conditional Independence,80,.,例,11.Doll,和,Hill,以,709,例肺癌患者做病例,,709,个非肿瘤患者做对照,按性别分层,研究吸烟与肺癌的关系,调查结果如下,试做肺癌的病例对照分析。,81,.,Weight cases,82,.,83,.,84,.,85,.,86,.,87,.,关于,OR,值与,RR,值,相对危险度,RR,:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为,1,,表明试验因素与反应阳性无关联;小于,1,时,表明试验因素导致反应阳性的发生率降低;大于,1,时,表明试验因素导致反应阳性的发生率增加。,优势比,OR,:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之,比。暴露者的疾病危险度为非暴露者的多少倍。,OR1,说明疾病的危险度因暴露而增加,暴露与疾病为“正”关联;,OR1,说明疾病的危险度因暴露而减少,“负”关联,。,当关注的事件发生概率比较小时(,0.1,),优势比可作为相对危险度的近似。,88,.,89,.,90,.,91,.,第五节,多个样本率间的多重比较,Multiple comparison of sample rates,92,.,一、基本思想,(卡方分割法),因分析目的不同,,k,个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:,93,.,94,.,95,.,96,.,例,12,某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?,97,.,检验步骤,本例为,3,个实验组间的两两比较,98,.,三种疗法有效率的两两比较,99,.,100,.,例,11,(,2,),以例,11,资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?,本例为各实验组与同一对照组的比较,101,.,102,.,SPSS,进行两两比较,103,.,结果同前,但因为会损失很多信息,一般不提倡采用此方法,104,.,本章小结,1,、研究目的:率,or,构成比的假设检验(大样本率或 小样本率),2,、资料类型:计数资料,3,、基本思想:根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。,4,、应用条件,检验两个样本率之间差别的显著性;,检验多个样本率或构成比之间差别的显著性;,检验两个双向无序分类变量是否存在关联;,配对计数资料的比较。,105,.,Any Questions,?,Thank You,!,106,.,(五)比较样本与已知总体的分布,Chi-square test,过程,目的:,用于检验某分类变量的各部分所占百分比与已知的期望百分比是否相同,从而推断该样本与已知总体的分布是否相同。,SPSS,操作:,分析,非参数检验,卡方(,chi-square,),107,.,实例分析,SPSS,自带文件,Eployee data.sav,考察员工职务类别(,jobcat,)变量所在总体的构成比是否和已知总体的构成比相同?,108,.,练习题:,用药,治疗情况,有效,无效,合计,甲,24,17,41,乙,20,35,55,合计,44,52,96,1,)如果希望分析甲乙两药对疾病治疗情况有无差别,应当选择什么分析方法,为什么?,2,)可以用到,SPSS,的什么过程实现?请给出具体的,P,值和分析结论。,109,.,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服