1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,检验,Chi-square Test,1,主要内容:,第一节 四格表,检验,第二节 配对四格表,检验,第三节 行,列表,检验,2,分布,是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题。早在,1875,年,,F.Helmet,即得出来自正态总体的样本方差的分布服从卡方分布。,1900,年,,K.Pearson,也独立地从检验分布的拟合优度发现这一相同的卡方分布。,Karl Pearso
2、n(1857-1936),3,个相互独立的标准正态变量,u,i,(i=1,2,),的平方和称为 变量,即,它的分布即为卡方分布,其自由度为,。,4,卡方分布,5,2,检验读作卡方检验,是一种用途广泛的统计方法,主要用于:,检验,两个(或多个)总体率,或,构成比,之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是否相同。,2,检验的用途,6,检验实际频数(,A),和理论频数(,T),的差别是否由抽样误差所引起的,也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。,2,检验的基本思想,7,基本计算公式,式中,,A,为实际频数(,actual frequency),,,T,为理论
3、频数(,theoretical frequency),back,8,例,8.1,为了解某中药治疗原发性高血压的疗效,将,70,名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表,8-1,。,问:该药治疗原发性高血压是否有效?,9,10,1、建立检验假设并确定检验水准,H,0,:,1,=,2,,即试验组与对照组的总体有效率相等,H,1,:,1,2,,即试验组与对照组的总体有效率不等,=0.05,2、,计算检验统计量,11,用基本公式计算卡方值:,12,四格表卡方检验的专用公式:,13,3、查界值表,确定,P,值,做出推断结论,自由度=1,,2,0.05(1)
4、3.84,,2,2,0.05(1),所以 ,,P0.05,,在,=0.05,的检验水准下,拒绝,H,0,差异有统计学意义,也就是,试验组与对照组的总体有效率不等,.,14,推倒过程,15,卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确定,P,值时可能存在误差。四格表资料中,当,n40,,有理论频数1,T5,时,因为理论值太小,会导致,2,值变大,易出现假阳性结论。,四格表,2,值的连续性校正,16,连续性校正公式,17,四格表资料,2,公式的正确选择,1)当,n40,,所有,T,5,时,用专用公式或普通公式;,2)当,
5、n40,,但有理论频数1,T5,时,用校正公式;,3),n40,或有,T1,,或,P,时,用确切概率法。,连续性校正仅用于 的四格表资料,当 时,一般不作校正。,18,例8.,2,某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?,年级,近视,非近视,合计,近视率(%),四年级,2,26,28,7.14,五年级,5,9,14,35.71,合计,7,35,42,16.67,表,8-2,两个年级大学生的近视眼患病率比较,19,1、建立检验假设并确定检验水准,H,
6、0,:,1,=,2,,即四年级与五年级学生的近视眼患病率相同,H,1,:,1,2,,即四年级与五年级学生的近视眼患病率不同,=0.05,2、,计算检验统计量,20,3、查界值表,确定,P,值,做出推断结论,自由度=1,,2,0.05(1),=3.84,,2,0.05,,在,=0.05,的检验水准下,不拒绝,H,0,,,说明四年级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。,21,若不采用校正公式:,在,=0.05,水准下,,2,2,0.05(1),,,则,P0.05。,back,22,甲种属性,乙种属性,+,-,合计,+,a,b,a+c
7、c,d,c+d,合计,a+c,b+d,n=a+b+c+d,注意:,a、b、c、d,代表对子数!,表,8-16,配对四格表基本结构的,23,甲种属性,乙种属性,+,+,a,+,-,b,-,+,c,-,-,d,甲属性的阳性率:(,a+b)/n,乙属性的阳性率,:(,a+c)/n,若,H,0,成立,则有,(,a+b)/n-,(,a+c)/n=0,,即(,b-c)/n=0,可见,两个变量阳性率的比较只和,b、c,有关,而与,a、d,无关。,若,H,0,成立,两种属性不一致的两个格子理论频数都应该是(,b+c)/2,24,配对检验公式推导:,25,式中,,a,d,为两法观察结果一致的两种情况,,b
8、c,为两法观察结果不一致的两种情况,。,配对卡方检验公式使用条件:,26,例8.,4,现有198份痰标本,每份标本分别用,A、B,两种培养基培养结核菌,结果如下表,,A,培养基的阳性培养率为36.36%,,B,培养基的阳性培养率为34.34%,试问,A、B,两种培养基的阳性培养率是否相等?,B,培养基,A,培养基,+,-,合计,+,48,24,72,-,20,106,126,合计,68,130,198,表,8-5,两种培养基的培养结果,27,A,培养基,B,培养基,28,结果统计,痰标本,A,培养基,B,培养基,1,+,+,2,+,+,3,+,-,4,+,+,5,+,-,6,+,-,7,-,
9、8,+,+,9,-,-,10,-,-,11,+,+,12,+,+,13,+,-,14,-,-,痰标本,A,培养基,B,培养基,15,+,+,16,+,+,17,+,-,18,+,+,19,+,-,20,+,-,21,-,-,22,+,-,23,-,-,24,-,-,25,+,+,26,+,-,27,+,+,28,-,-,29,1、建立检验假设并确定检验水平,H,0,:,1,=,2,,即两种培养基的阳性培养率相等,H,1,:,1,2,,即两种培养基的阳性培养率不相等,=0.05,2、计算检验统计量,30,3、查界值表,确定,P,值,做出推断结论,查,2,界值表,,=1,,2,0.05(1),
10、3.84,,2,0.05,,在,=0.05,的检验水准下,不拒绝,H,0,尚不能认为两种培养基的培养率不同。,back,31,一、行列表,2,检验,行或列超过两组时称为行列表,或称,RC,表。,32,例8.,5,某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果如下表,试比较3种疗法的有效率是否一样。,组别,有效,无效,合计,有效率(%),西药组,51,49,100,51.00,中药组,35,45,80,43.75,中西医结合组,59,15,74,79.73,合计,145,109,254,57.09,表,8-3 3,种方案治疗肝炎的疗效,33,1,.,建立检验假设并确定检验水准,H,
11、0,:,三种治疗方案的有效率相同,H,1,:,三种治疗方案的有效率不全相同,=0.05,2,.,计算检验统计量,3,.,查,2,界值表,确定,P,值,做出推断结论,=2,,2,0.05(2),=5.99,,2,2,0.05(2),则,P,2,0.05(1),则,P0.05,,在,=0.05,的水准下,拒绝,H,0,,,认为三个不同地区的人群血型分布总体构成比有差别。,38,二、多个样本率间多重比较,行列表,2,检验的结果说明差异有统计学意义,需作两两比较时,先调整,值,再进行率的两两比较。,检验水准,=0.05,,做多次比较时,按概率理论,两两比较均正确的概率为(1-0.05)(1-0.05)
12、1-0.05)(1-0.05),将使类错误,扩大,因此,必须重新规定检验水准。,1.,多个实验组间的两两比较,=/N,N,为要进行两两比较的次数,,k,为参加检验的组数。,39,组别,有效,无效,合计,有效率(%),西药组,51,49,100,51.00,中药组,35,45,80,43.75,合计,86,94,180,47.78,1、建立检验假设并确定检验水准,H,0,:,西药与中药治疗肝炎的有效率相同;,H,1,:,西药与中药治疗肝炎的有效率的有效率不同;,=0.05/3=0.017,表,8-4,西药与中药治疗肝炎疗效的比较,40,3、查,2,界值表,确定,P,值,做出推断结论,=1,20
13、017(1)=5.70,2 0.017,,在,=0.017,的水准下,不拒绝,H0,,故可以认为西药与中药治疗肝炎的有效率差异没有统计学意义。,2、计算检验统计量,41,组别,有效,无效,合计,有效率(%),西药组,51,49,100,51.00,中西医结合组,59,15,74,79.73,合计,110,64,174,63.22,=1,,2,0.017(1),=5.70,,2,2,0.017(1),则,P,2,0.017(1),则,P,2,0.05(3),则,P,2,0.05(2),则,P0.017,,在,=0.017,的水准下,拒绝,H,0,,,接受,H,1,,故可以认为安慰剂与,A,药的
14、缓解率差异有统计学意义,,A,药的缓解率高于安慰剂组。,同理,可以进行,B,药与安慰剂组比较,,C,药与安慰剂组比较,=1,,2,0.017(1),=5.70,,2,2,0.05(2),则,P0.017,,在,=0.017,的水准下,拒绝,H,0,,,接受,H,1,,故可以认为安慰剂与,B,药的缓解率差异有统计学意义。,49,=1,20.017(1)=5.70,2 20.05(2),则,P0.017,,在,=0.017,的水准下,拒绝,H,0,,,接受,H,1,,故可以认为安慰剂与,C,药的缓解率差异有统计学意义。,50,三、行列表,2,检验时的注意事项,1、行列表中各理论频数不应小于,1,,
15、并且,1T,5,的格子数不宜超过总格子数的1/5,若发生上述情况,可采用下述方法:,(1)增大样本含量以增加理论频数。,(2)根据专业知识,考虑删去理论频数太小的行或列,将理论频数过小的格子所在的行或列与性质相近的邻行或列中的实际频数合并。,(,3,)改用双向无序,R,C,表资料的,Fisher,确切概率法。,2、行列表,2,检验有统计学意义,并不等于任意两组之间都有统计学意义,要继续做多个样本率的多重比较。,51,3、有序的,R,C,表资料不宜用,2,检验。,52,表,8-10,两种药治疗慢性气管炎的疗效,组别,无效,好转,显效,控制,合计,A,药组,800,1920,680,60,3460,B,药组,10,60,26,18,114,53,