1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,卡方检验是,2,检验(Chi-square test)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,是,分类计数资料,的假设检验方法,可用于两个或多个率间或构成比之间的比较,计数资料的关联度分析,拟合优度检验等等。,检验的应用,检验两个样本率之间差别的显著性;,检验多个样本率或构成比之间差别的显著性;,配对计数资料的比较;,检验两个双向无序分类变量是否存在关联。,某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?
2、二、基本原理,基本思想是检验实际频数和理论频数的差别是否由抽样误差所引起的,由样本率来推断总体率。,x,2,反映了实际频数于理论频数的吻合程度,,x,2,值大,说明实际频数和理论频数的差距大,如果假设检验成立,A与T不应该相差太大。理论上可以证明,服从,x,2,分布,计算出,x,2,值后,查表判断这么大的,x,2,是否为小概率事件,以判断建设检验是否成立。,3.84,7.81,12.59,P,0.05的临界值,2,分布,(,chi-square distribution,),自由度一定时,,P,值越小,,x,2,值越大。,当,P,值一定时,自由度越大,,x,2,越大。,v=1时,,P,=0.
3、05,,x,2,=3.84,P,=0.01,,x,2,=6.63,P,=0.05时,v=1,,x,2,=3.84,v=2,,x,2,=5.99,三、四格表,2,检验,一般格式,四格表统计量公式,当n40,T5时,例8.1,为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组。试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果如表8-1,问该药治疗原发性高血压是否有效?,表,8-1,两种疗法治疗原发性高血压的疗效,(1)建立检验假设,确定检验水平。,H,0,:,1,=,2,即试验组与对照组的总体有效率相等,H,1,:,1,2,即试验组与对照组的总体有效率不等,=0.05。,
4、假设检验步骤,T,11,=,44(41/70)=25.8,T,12,=,44(29/70)=18.2,T,21,=,26(41/70)=15.2,T,22,=,26(29/70)=10.8,(2)求检验统计量值,(3),确定,P,值,作出推断结论,此例中,查表,,2,=8.4,P,0.05,按=0.05水准,拒绝,H,0,,接受,H,1,,可以认为两组治疗原发性高血压的总体有效率不等,即可认为该中药治疗原发性高血压有效。,2,分布是一连续型分布,而四格表资料属离散型分布,由此计算得的,2,统计量的抽样分布亦呈离散性质。为改善,2,统计量分布的连续性,则需行连续性校正(correction fo
5、r continuity)。,2,连续性校正仅用于,=,1 的四格表资料,当,2,时,一般不作校正。,四格表,2,检验校正公式,当n40,1T5时,例8.2 某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见表8-2。问该大学四年级与五年级学生的近视眼患病率是否不同?,P,0.05,按=0.05水准,不拒绝,H,0,,还不能认为四年级与五年级学生近视眼患病率不等。,本资料若不校正时,,结论与之相反。,四格表确切概率法,该方法是由R.A.Fisher提出的,其理论依据是超几何分布,四格表资料,若有,理论数小于1或n4
6、0,,或作,2,检验后所得概率,P,接近检验水准,需要用确切概率法直接计算概率以作判断。实际上,当有统计软件条件下,大样本四格表的资料也可用确切概率检验,四格表确切概率法,确切概率计算方法的基本思想:,在四格表边缘合计固定不变的条件下,利用公式,直接计算表内四个格子数据的各种组合的概率,然后计算单侧或双侧累计概率,并与检验水准比较,作出是否拒绝H,0,的结论,例8.3 将17名腰椎间盘脱出症患者随机分到两组,分别用两种方法治疗,结果见表8-3,问两种疗法的疗效是否不同?,二、检验步骤(,本例,n=17 0.05.按=0.05水准,不拒绝,H,0,。尚不能认为两种培养基的阳性培养率不同。,五、行
7、列表,2,检验,多个样本率比较时,,有,R,行 2 列,称为,R,2表;,两个样本的构成比比较时,,有 2 行,C,列,称 2,C,表;,多个样本的构成比比较,,有,R,行,C,列,称为,R,C,表。,行列表,2,检验公式,:,自由度=(R-1)x(C-1),R行数,C列数,,n,R,是A,RC,所在行的合计,n,C,是A,RC,所在列的合计,多个样本率的比较,例8.5 某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果见表8-6,问3种疗法的有效率是否不同。,检验步骤:,H,0,:3种治疗方案的有效率相等,H,1,:3种治疗方案的有效率不全相等,=0.05,P,0.05,在=0.05
8、的检验水准下,,拒绝,H,0,,接受,H,1,,,可以认为三种疗法的有效率有差别。,样本构成比的比较,例8.6 某研究人员收集了亚洲、欧洲和北美洲人的A、B、AB、O血型资料,结果见表8-7,问不同地区人群ABO血型分类构成比是否不同。,检验步骤,H,0,:不同地区人群血型分布总体构成比相同,H,1,:不同地区人群血型分布总体构成比不全相同,=0.05,P,0.05,在=0.05检验水准下,拒绝,H,0,,,认为三个不同地区的人群血型分布总体构成比有差别。,建立假设,H,0,:,不同地区的人群血型分布构成相同,H,1,:,不同地区的人群血型分布构成不同或不全相同,=0.05,计算检验统计,T,
9、11,=1080987/2592=411.5 T,12,=215.83,T,13,=64.17 T,14,=388.75 T,21,=196.87 T,22,=103.32 T,23,=30.72,T,24,=186.10 T,31,=378.88 T,32,=198.8 T,33,=59.12,T,34,=358.15,查,2,界值表,v=,(,3-1,)(,4-1,),=6,,,由于 则,P0.05,,,拒绝,H,0,,,认为三个地区的人群血型分布构成不同或不全相同。,行列表,2,检验注意事项,若,1/5,的理论频数小于,5,进一步增大样本含量,将相临的两行或两列合并,总的结论有统计学意义,即有差异,并不说明任意两组间都有差异,做行,列表的分割才能检验任意两组间是否有差异,有些资料不适合做,x,2,检验,如等级资料,小结,掌握检验在四表格资料、配对四格表资料、行,列表资料中的应用,熟悉检验的基本思想,了解,行,列表的,分割法及四表格的确切概率法,






