资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第十一章,2,检验,主要内容,独立样本列联表资料的,2,检验,配对设计资料的,2,检验,线性趋势,2,检验,四格表的,Fisher,确切概率法,2,分布是一种连续型分布,可用于检验资料的,实际频数,和按检验假设计算的,理论频数,是否相符等问题。,2,分布,2分布的形状完全依赖于自由度的大小,随着v的增加,曲线趋于对称,当v趋于时,,2分布逼近正态分布。,2分布右侧尾部面积为时的临界值记为,2,.,2,检验,用途,推断两个或两个以上总体率,(,或构成比,),之间有无差别;,推断两分类变量间有无相关关系;,多个率的趋势检验。,卡方检验的基本思想,基本思想:,实际频数和理论频数吻合的程度。,2,检验的,计算公式,A,为实际频数,(actual frequency),T,为理论频数,(theoretical frequency),例11.1,某研究者欲比较甲、乙两药治疗小儿上消化道出血的效果,将90名患儿随机分为两组,一组采用甲药治疗,另一组采用乙药治疗,一个疗程后观察结果,见表11.1。问两药治疗小儿上消化道出血的有效率是否有差别?,卡方检验的基本思想,表11.1甲、乙两药治疗小儿上消化道出血的效果,检验的基本思想,假设:两种药物的有效率相同,则可以算得理论上的两种药物的有效率均为,67/90,74.44,,无效率为,23/90,25.55,,,计算理论频数,按两组合计的有效率74.44,无效率25.55,,则,理论,上:,甲药组有效人数为,甲药组无效人数为,乙药组有效人数为,乙药组无效人数为,为相应行的合计,为相应列的合计,n,为总例数。,计算,理论频数公式,药物,有效数,无效数,合计,有效率(%),甲药,27(,33.5,),18,(,11.5,),45,60.00,乙药,40(,33.5,),5,(,11.5,),45,88.89,合计,67,23,90,74.44,例11.1可以整理成下表:,如果假设成立,则实际频数和理论频数吻合,A与T不应该相差太大。理论与实际偏离的总和即为卡方值,理论上可以证明:,服从自由度为,的,x,2,分布。,基本思想与判断域,卡方值反映了实际频数与理论频数的吻合程度。,若H,0,成立,A与T之差一般不会很大,,卡方值也不会太大,因此出现大的卡方值的概率P是很小的。,若卡方很大,使P,则没有理由拒绝H,0,。,2,与,P,值的对应关系可查,2,界值表,(,附表,9),。,2,值愈大,,P,值愈小。,2,检验的基本步骤,1、建立检验假设,确定检验水准,2、计算检验统计量,2,3,、确定,p值,,作出统计推断,22列联表资料,的,2,检验(例11.1),表11.1 甲、乙两药治疗小儿上消化道出血的效果,药物,有效数,无效数,合计,有效率(%),甲药,27,18,45,60.00,乙药,40,5,45,88.89,合计,67,23,90,74.44,四格表资料,表11-1中,27、18、40、5是整个表的基本数据,其余数据都是从这四个基本数据相加而得的,这种资料是,两组两分类,资料,称为四格表(fourfold table),亦称22表(22 table),四格表基本格式,例11.1具体步骤,1.建立检验假设,确定检验水准,H,0,:,1,2,,即两种药物治疗小儿上消化道出,血的有效率相同,H,1,:,1,2,,即两种药物治疗小儿上消化道出,血的有效率不同,求理论频数,根据公式 求出任何一个格子的理论频数,其余三个格子的理论频数可通过减法求得。,2.计算,2,值和自由度,将,A,与,T,的值代入公式,得,药物,有效数,无效数,合计,有效率(%),甲药,27(,33.5,),18,(,11.5,),45,60.00,乙药,40(,33.5,),5,(,11.5,),45,88.89,合计,67,23,90,74.44,3.确定,P,值,作出统计推断,查附表9,得 ,按 水准,拒绝H,0,,接受H,1,,差异有统计学意义,可以认为两种药物治疗小儿上消化道出血的有效率不同。,四格表,2,检验专用公式:,(公式11.5),简化计算,省去了求理论频数的过程。,将例11.1数据代入专用公式,可见,与前面的基本公式计算结果相同。,n,40 且所有,T,5,不需校正。若,p,,改用确切概率法。,n,40 但有 1,T,5,,用校正的,2,检验。,n,40 或,T,1,改用确切概率法。,四格表,2,检验的校正,2,分布是一连续型分布,而行列表资料属离散型分布,为改善,2,统计量分布的连续性,对其进行校正称为连续性校正。,如检验所得,P,值近于检验水准,时,最好改用四格表确切概率法。,四格表,2,检验的校正,(公式11.6),(公式11.7),例11.,2,某研究欲比较甲、乙两药对治疗下呼吸道感染的疗效,将,66,例患者随机分为两组,进行随机双盲对照试验,结果见表,11.3,。问两药治疗下呼吸道感染的有效率有无差别,?,表,2,两种药物治疗下呼吸道感染的效果,药物,有效,无效,合计,有效率(),甲,24(27.08),8(,4.92,),32,75.00,乙,31(27.92),2(5.08),33,93.94,合计,55,10,65,84.62,由于1,T,5,,而,n,40,,故应用连续性校正的,2,值,2,=3.140,查界值表,得,P,0.05,,按照 水准,不拒绝,H,0,,差别无统计学意义,尚不能认为两种药物治疗下呼吸道感染的有效率不同。,该资料计算统计量时,,如果不校正,2,=4.477,则,P,0.05,拒绝,H,0,,接受,H,1,,差异有统计学意义,与校正的结果相反。,四格表,2,检验的条件,(1)n40,且T5,不要校正;,(2),n,40,且1T5,需校正;,(3),n,40,或T1,选用确切概率法。,RC列联表资料的,2,检验(多个样本率或构成比比较),对于行数或列数大于2的资料,如何分析?,RC,列联表:,R,行、,C,列,包括:,(,1,),22,表(四格表,例,11.2,);,(,2,),R,2,表(多个样本率的比较,例,11.3,);,(,3,),2,C,或,R,C,表(两个或多个构成比的比较,例,11.4,)。,基本原理和检验步骤与四格表,2,检验相似。,公式,:,例11.3,某研究者欲比较A、B、C 三种方案治疗轻、中度高血压的疗效,将年龄在5070岁的240例轻、中度高血压患者随机等分为3组,分别采用三种方案治疗。一个疗程后观察疗效,结果见表11.4。问三种方案治疗轻、中度高血压的有效率有无差别?,表11.4 三种方案治疗轻、中度高血压的效果,多个样本率的比较,1.建立检验假设,确定检验水准,H,0,:,即三种方案治疗轻、中度高血压的有效率相同,H,1,:三种方案治疗轻、中度高血压的有效率,不全相同,将表11.4的数据代入公式,得:,2.计算,2,值和自由度,3.确定,P,值,作出统计推断,查附表9,得 ,按0.05水准,拒绝H,0,,接受H,1,,差异有统计学意义,可以认为三种方案治疗轻、中度高血压的有效率,不全相同,。,两个或多个构成比的比较,例11.4为了解新型农村合作医疗对于农村贫困居民住院服务利用的影响,在经济条件相似的甲、乙两个国家级贫困县(其中甲县2006年已开展新型农村合作医疗,乙县2006年尚未开展)分别进行抽样调查,得到2006年应住院者未住院原因,见表11.5。问甲、乙两县应住院者未住院原因构成比是否不同?,表11.5甲、乙两县应住院者未住院原因构成比(%),1,建立假设,确定检验水准,H,0,:,甲、乙两县应住院者未住院原因的总体构成比相同;,H,1,:,甲、乙两县应住院者未住院原因的总体构成比不同。,0.05,。,2,计算检验统计量,2,值,(2,1)(4,1),3,3,确定,P,值,做出统计推断,查附表9,得 0.1,P,0.25,,按,0.05,水准,不拒绝,H,0,,差异无统计学意义,尚不能认为甲、乙两县应住院者未住院原因的总体构成比不同。,RC列联表检验时的注意事项,1.,计算,2,值时,必须用绝对数,而不能用相对数,因为,2,值的大小与频数大小有关。,RC列联表检验时的注意事项,2.,2,检验要求理论频数不宜太小,一般认为表中,不宜有1/5以上格子的理论频数小于5,或有一个理论频数小于1。,理论频数是否太小可以通过计算最小理论频数(即最小行、列合计所对应格子的理论频数)来判断。,理论频数太小有四种处理办法,增加样本例数以增大理论频数;,删去理论频数太小的行或列;,将太小理论频数所在行或列与性质相近的邻行邻列中的实际频数合并,使重新计算的理论频数增大;(专业角度判断),用确切概率法。,3.单向有序RC列联表的统计处理,当效应按强弱,(,或优劣,),分为若干个级别,比如分为,-,、,、,+,、,+,、,+,、,+,等几个等级,在比较各处理组的效应有无差别时,宜用秩和检验。,如作,2,检验只说明各处理组,效应的构成比,有无差异。,3.单向有序RC列联表的统计处理,RC列联表检验时的注意事项,4.,当多个样本率(或构成比)比较的检验,结论为拒绝检验假设,只能认为各总体率(或总体构成比)之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若想进一步了解哪两者的差异有统计学意义,需要进行多个样本率(或构成比)的两两比较。,不能简单地将多个样本率比较的列联表资料分割成多个四格表,再用四格表检验进行统计推断。这样分割的四格表彼此不独立,会增大犯型错误的概率,使结论不可靠。,两两比较的方法大致可分为3类:,调整检验水准后进行两两比较;,(,见例11.5,),2,分割,;,估计两率之差的置信区间。,例11.5 对例11.3中3种方案治疗轻、中度高血压的有效率作进一步两两比较。,2,分割法,先把阳性率(或构成比)相差不大的样本分割出来,计算其,2,值,当差异无显著性时,就把它合并为一个样本,再把它与另一个相近的样本比较,如此进行下去直到结束,。,四、配对四格表资料的,2,检验,配对四格表资料,是指同一组观察资料分别用两种方法分类或处理,将所得的结果归纳成,双向交叉,排列表的资料,。,配对设计,对子号,免疫荧光,乳胶凝集,1,阳性,阳性,2,阳性,阴性,3.,阴性,阳性,58,阴性,阴性,免疫荧光法,乳胶凝集,合计,+,-,+,11(a),12(b),23,-,2(c),33(d),35,合计,13,45,58,表1 配对设计,表1-1 两种方法的检测结果,完全随机设计,组别,方法,结果,1,免疫荧光,阳性,1,免疫荧光,阴性,2,乳胶凝集,阴性,2,乳胶凝集,阳性,方法,结果,合计,+,-,免疫荧光,(a),(b),n,1,乳胶凝集,(c),(d),n,2,合计,116,表2 完全随机设计,表2-1 两种方法的检测结果,两种设计的对比,免疫荧光法,乳胶凝集,合计,+,-,+,11(a),12(b),23,-,2(c),33(d),35,合计,13,45,58,方法,结果,合计,+,-,免疫荧光,(a),(b),n,1,乳胶凝集,(c),(d),n,2,合计,116,表1 配对设计,表2 完全随机设计,方法1,方法2,方法1,方法2,方法2,方法1,一.配对四格表资料的,2,检验,方法,当,b,+,c,40,时,需作连续性校正,(公式11.9),(公式11.10),配对四格表资料的,2,检验公式推导,例11.6,某研究者欲比较心电图和生化测定诊断低钾血症的价值,分别采用两种方法对79名临床确诊的低钾血症患者进行检查,结果见表11.9。问两种方法的检测结果是否不同?,表11.9 两种方法诊断低血钾的结果,1.建立检验假设,确定检验水准,H,0,:,即两种方法的检测结果相同,H,1,:,即两种方法的检测结果不同,2.计算,2,值和自由度,本例 ,故用式校正公式计算:,3.确定,P,值,作出统计推断,查附表9,得 ,按0.05水准,拒绝H,0,,接受H,1,,差异有统计学意义,可以认为两种方法的检测结果不同。,注意事项,比较两种诊断试验法诊断效能有无差异时,要求所投入试验的检品是用标准法检出的阳性检品。,线性趋势,2,检验,N,是总人数,,n,是各组人数,,T,是总阳性数,,t,是各组阳性数,,Z,是各组的评分。,例11.9 为了解学生吸烟状况,资料见下表,问吸烟率是否随年龄增加有增高趋势,表,11.13,某市不同年级中学生吸烟率,年级,调查人数(,n,),吸烟人数(,t,),吸烟率(%),分数(Z),tZ,nZ,nZ,2,初一,144,17,11.81,1,17,144,144,初二,148,19,12.84,2,38,296,592,初三,135,25,18.52,3,75,405,1215,高一,157,41,26.11,4,164,628,2512,高二,168,55,32.74,5,275,840,4200,高三,139,72,51.8,6,432,834,5004,合计,891,229,1001,3147,13667,小 结,2,检验的基本思想;,四格表,2,检验的基本公式及其应用条件;,多个样本率、构成比的比较,配对四格表的,2,检验,Exercise,生活实例应用,
展开阅读全文