1、卡方卡方检验检验 第三节第三节 2 检验检验(Chi-square test)1.基本思想基本思想2.四格表资料的卡方检验四格表资料的卡方检验3.配对设计分类变量资料的卡方检验配对设计分类变量资料的卡方检验4.行行列表资料的卡方检验列表资料的卡方检验2 2检验(检验(Chi-square test)t 是是现现代代统统计计学学的的创创始始人人之之一一,英英国国统统计计学学家家K.Pearson于于1900年年提提出出的的一一种种具具有有广广泛泛用用途途的的假假设设检检验验方方法法。常用于常用于分类变量资料分类变量资料的统计推断。的统计推断。3例例例例:考考考考查查查查某某某某山山山山区区区区小
2、小小小学学学学学学学学生生生生的的的的肺肺肺肺吸吸吸吸虫虫虫虫感感感感染染染染率率率率,调调调调查查查查男男男男生生生生8080人人人人,感感感感染染染染2323人人人人;女女女女生生生生8585人人人人,感感感感染染染染1313人人人人。问问问问男男男男、女女女女生生生生感感感感染率有无差别?染率有无差别?染率有无差别?染率有无差别?-22-22表或四格表表或四格表表或四格表表或四格表(fourfold tablefourfold table)某山区小学男女生的肺吸虫感染率比较某山区小学男女生的肺吸虫感染率比较某山区小学男女生的肺吸虫感染率比较某山区小学男女生的肺吸虫感染率比较1 1.2 2
3、检验的基本思想检验的基本思想检验的基本思想检验的基本思想4实际频数实际频数实际频数实际频数A A(actual frequency)(actual frequency):a a、b b、c c、d dHH0 0:1 1=2 2=,-合计率合计率合计率合计率 某山区小学男女生的肺吸虫感染率比较某山区小学男女生的肺吸虫感染率比较某山区小学男女生的肺吸虫感染率比较某山区小学男女生的肺吸虫感染率比较 2 2检验的基本思想检验的基本思想检验的基本思想检验的基本思想=(a+c)/(a+b+c+d)=36/165=21.82%=(a+c)/(a+b+c+d)=36/165=21.82%理论频数理论频数理论频
4、数理论频数T T(theoretical frequency)(theoretical frequency):5女生:理论感染人数女生:理论感染人数女生:理论感染人数女生:理论感染人数 T T2121=85 36/165=18.55=85 36/165=18.55 理论未感染人数理论未感染人数理论未感染人数理论未感染人数 T T2222=85129/165=66.45=85129/165=66.45男生:理论感染人数男生:理论感染人数男生:理论感染人数男生:理论感染人数 T T1111=8036/165=17.45=8036/165=17.45 理论未感染人数理论未感染人数理论未感染人数理论未
5、感染人数 T T1212=80129/165=62.55=80129/165=62.556基本公式基本公式:-反映了反映了A和和T吻合的程度;吻合的程度;与格子数有关。与格子数有关。HH0 0:1 1=2 2=,-合计率合计率合计率合计率7 2 2 2 2界值表界值表界值表界值表 8 2 2检验的自由度检验的自由度 指可以自由取值的基本格子数指可以自由取值的基本格子数 自由度一定时,其自由度一定时,其 2值的概率分布也就确定。根据自由度值的概率分布也就确定。根据自由度 和检验水准和检验水准 查表查表10-13 可得可得 2界值,界值,若若 2值值 20.05(),),则可按则可按=0.05的检
6、验水准拒绝的检验水准拒绝H0;若若 2值值 20.05(),),则还不能拒绝则还不能拒绝H0。92.四格表资料的卡方检验四格表资料的卡方检验四格表资料四格表资料处处 理理+-合合 计计Aaba+bBcdc+d合合 计计a+cb+dn(a+b+c+d)10例例10-9 某某医医生生欲欲比比较较用用甲甲、乙乙两两种种药药物物治治疗疗动动脉脉硬硬化化的的疗疗效效,甲甲药药治治疗疗71例例,有有效效52例例,乙乙药药治治疗疗42例例,有有效效39例例,结结果果见见表表10-7。问问两两种种药药物物的的有有效效率率是是否否有有差别?差别?表表10-7 甲、乙两种药物治疗动脉硬化的疗效比较甲、乙两种药物治
7、疗动脉硬化的疗效比较11H0:两药有效率相同,即:两药有效率相同,即 1 2H1:两药有效率不同,即:两药有效率不同,即 1 2=0.05(1)建立检验假设,确定检验水准建立检验假设,确定检验水准12 20.025(1)=5.02,20.01(1)=6.63。本本例例5.02 2=6.4840,Tmin513四格表专用公式:四格表专用公式:本例,本例,14校正公式:校正公式:四格表资料四格表资料 2检验的校正检验的校正 2分分布布是是一一种种连连续续性性分分布布,而而分分类类变变量量资资料料属属离离散散性性分分布布,由由此此得得到到的的统统计计量量也也是是不不连连续续的的。为为改改善善 2统统
8、计计量量分分布布的的连连续续性性,英英国国统统计计学学家家Yates F建建议议将将实实际际频频数数和和理理论论频数之差的绝对值减去频数之差的绝对值减去0.5以作校正。以作校正。15在实际工作中,对于四格表资料,通常规定在实际工作中,对于四格表资料,通常规定(1)T5,且,且N40时,直接计算时,直接计算 2值,不用校正;值,不用校正;(2)1T5,且且N40时,用时,用连续性校正连续性校正检验;检验;(3)T1或或N40,不能用卡方检验,用直接计算概,不能用卡方检验,用直接计算概率的方法。率的方法。16例例10-10 某某医医生生研研究究比比较较A、B两两种种药药物物对对急急性性细细菌菌性性肺肺炎炎的的疗疗效效,有有关关资资料料见见表表10-8,问问两两种种药药物物的的疗疗效效差别有无统计学意义?差别有无统计学意义?表表10-8 A、B两药治疗急性细菌性肺炎的疗效比较两药治疗急性细菌性肺炎的疗效比较 17H0:1=2H1:1 2 =0.05 T22=22 8/64=2.75 5 按按=1,查查 2值值表表,20.05(1)=3.84,2=4.79 3.84,P0.05,按按=0.05水水准准,拒拒绝绝H0,接接受受H1,认认为为两两药药的的疗疗效效差差别别有有统统计计学学意意义义,A药药疗疗效效要要好好于于B药。药。18