1、检验Chi-square TestChi-square Test1.主要内容:第一节 四格表 检验第二节 配对四格表 检验第三节 行列表 检验2.分布 是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题。早在1875年,F.Helmet即得出来自正态总体的样本方差的分布服从卡方分布。1900年,K.Pearson也独立地从检验分布的拟合优度发现这一相同的卡方分布。Karl Pearson(1857-1936)3.个相互独立的标准正态变量ui(i=1,2,)的平方和称为 变量,即它的分布即为卡方分布,其自由度为。4.卡方分布5.2检验读作卡方检验,是一种用途广泛的
2、统计方法,主要用于:检验两个(或多个)总体率或构成比之间是否有统计学意义,从而推断两个(或多个)总体率或构成比是否相同。2检验的用途6.检验实际频数(A)和理论频数(T)的差别是否由抽样误差所引起的,也就是由样本率(或样本构成比)来推断总体率(或总体构成比)。2检验的基本思想7.基本计算公式式中,A为实际频数(actual frequency),T为理论频数(theoretical frequency)back8.例8.1 为了解某中药治疗原发性高血压的疗效,将70名高血压患者随机分为两组,试验组用该药加辅助治疗,对照组用安慰剂加辅助治疗,观察结果见表8-1。问:该药治疗原发性高血压是否有效?
3、9.10.1、建立检验假设并确定检验水准H0:1=2,即试验组与对照组的总体有效率相等H1:12,即试验组与对照组的总体有效率不等=0.052、计算检验统计量11.用基本公式计算卡方值:12.四格表卡方检验的专用公式:13.3、查界值表,确定P值,做出推断结论自由度=1,20.05(1)=3.84,2 20.05(1),所以 ,P0.05,在=0.05的检验水准下,拒绝H0,差异有统计学意义,也就是试验组与对照组的总体有效率不等.14.推倒过程15.卡方分布是连续型的分布,卡方界值是由其分布计算而来的。而卡方检验用于分类资料比较时,原始数据是不连续的,用卡方界值表确定P值时可能存在误差。四格表
4、资料中,当n40,有理论频数1T5时,因为理论值太小,会导致2值变大,易出现假阳性结论。四格表2值的连续性校正16.连续性校正公式17.四格表资料2 2公式的正确选择 1)当n40,所有T 5时,用专用公式或普通公式;2)当n40,但有理论频数1T5时,用校正公式;3)n40或有T1,或P时,用确切概率法。连续性校正仅用于 的四格表资料,当 时,一般不作校正。18.例8.2 某医学院抽样调查大学四年级和五年级学生近视眼患病情况,四年级学生的近视率为7.14%,五年级学生的近视率为35.71%,调查结果见下表,试问该大学四年级与五年级学生的近视眼患病率是否一样?年级近视非近视合计近视率(%)四年
5、级2 26287.14五年级5 91435.71合计7354216.67表8-2 两个年级大学生的近视眼患病率比较19.1、建立检验假设并确定检验水准H0:1=2,即四年级与五年级学生的近视眼患病率相同H1:12,即四年级与五年级学生的近视眼患病率不同=0.052、计算检验统计量20.3、查界值表,确定P值,做出推断结论自由度=1,20.05(1)=3.84,20.05,在=0.05的检验水准下,不拒绝H0,说明四年级与五年级学生近视眼患病率差别没有统计学意义,可认为尚未发现四年级与五年级学生近视眼患病率有显著性差异。21.若不采用校正公式:在=0.05水准下,2 2 0.05(1),则P0.
6、05。back22.甲种属性乙种属性+-合计+aba+c-cdc+d合计a+cb+dn=a+b+c+d注意:a、b、c、d代表对子数!表8-16 配对四格表基本结构的23.甲种属性乙种属性+a+-b-+c-d甲属性的阳性率:(a+b)/n乙属性的阳性率:(a+c)/n若H0成立,则有(a+b)/n-(a+c)/n=0,即(b-c)/n=0可见,两个变量阳性率的比较只和b、c有关,而与a、d无关。若H0成立,两种属性不一致的两个格子理论频数都应该是(b+c)/224.配对检验公式推导:25.式中,a,d 为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。配对卡方检验公式使用条件
7、:26.例8.4 现有198份痰标本,每份标本分别用A、B两种培养基培养结核菌,结果如下表,A培养基的阳性培养率为36.36%,B培养基的阳性培养率为34.34%,试问A、B两种培养基的阳性培养率是否相等?B培养基A培养基+-合计+482472-20106126合计68130198表8-5 两种培养基的培养结果27.A 培养基B培养基28.结果统计痰标本A培养基B培养基1+2+3+-4+5+-6+-7-+8+9-10-11+12+13+-14-痰标本A培养基B培养基15+16+17+-18+19+-20+-21-22+-23-24-25+26+-27+28-29.1、建立检验假设并确定检验水平
8、H0:1=2,即两种培养基的阳性培养率相等H1:12,即两种培养基的阳性培养率不相等=0.052、计算检验统计量30.3、查界值表,确定P值,做出推断结论查2界值表,=1,20.05(1)=3.84,2 0.05,在=0.05的检验水准下,不拒绝H0,尚不能认为两种培养基的培养率不同。back31.一、行列表2检验行或列超过两组时称为行列表,或称RC表。32.例8.5 某医院用3种方案治疗急性无黄疸型病毒肝炎254例,观察结果如下表,试比较3种疗法的有效率是否一样。组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75中西医结合组 59157479.73合计14
9、510925457.09表8-3 3种方案治疗肝炎的疗效33.1.建立检验假设并确定检验水准H0:三种治疗方案的有效率相同H1:三种治疗方案的有效率不全相同=0.052.计算检验统计量3.查2界值表,确定P值,做出推断结论=2,20.05(2)=5.99,2 20.05(2),则P 20.05(1),则P0.05,在=0.05的水准下,拒绝H0,认为三个不同地区的人群血型分布总体构成比有差别。38.二、多个样本率间多重比较行列表2检验的结果说明差异有统计学意义,需作两两比较时,先调整值,再进行率的两两比较。检验水准=0.05,做多次比较时,按概率理论,两两比较均正确的概率为(1-0.05)(1
10、-0.05)(1-0.05)(1-0.05),将使类错误扩大,因此,必须重新规定检验水准。1.多个实验组间的两两比较 =/NN为要进行两两比较的次数,k为参加检验的组数。39.组别有效无效合计有效率(%)西药组514910051.00中药组35458043.75合计869418047.781、建立检验假设并确定检验水准H0:西药与中药治疗肝炎的有效率相同;H1:西药与中药治疗肝炎的有效率的有效率不同;=0.05/3=0.017表8-4 西药与中药治疗肝炎疗效的比较40.3、查2界值表,确定P值,做出推断结论=1,20.017(1)=5.70,2 0.017,在=0.017的水准下,不拒绝H0,
11、故可以认为西药与中药治疗肝炎的有效率差异没有统计学意义。2、计算检验统计量41.组别有效无效合计有效率(%)西药组514910051.00中西医结合组59157479.73合计1106417463.22=1,20.017(1)=5.70,2 20.017(1),则P 20.017(1),则P 20.05(3),则P20.05(2),则P0.017,在=0.017的水准下,拒绝H0,接受H1,故可以认为安慰剂与A药的缓解率差异有统计学意义,A药的缓解率高于安慰剂组。同理,可以进行B药与安慰剂组比较,C药与安慰剂组比较=1,20.017(1)=5.70,2 20.05(2),则P0.017,在=0
12、.017的水准下,拒绝H0,接受H1,故可以认为安慰剂与B药的缓解率差异有统计学意义。49.=1,20.017(1)=5.70,2 20.05(2),则P0.017,在=0.017的水准下,拒绝H0,接受H1,故可以认为安慰剂与C药的缓解率差异有统计学意义。50.三、行列表2检验时的注意事项1、行列表中各理论频数不应小于1,并且1T5的格子数不宜超过总格子数的1/5,若发生上述情况,可采用下述方法:(1)增大样本含量以增加理论频数。(2)根据专业知识,考虑删去理论频数太小的行或列,将理论频数过小的格子所在的行或列与性质相近的邻行或列中的实际频数合并。(3)改用双向无序RC 表资料的Fisher确切概率法。2、行列表2检验有统计学意义,并不等于任意两组之间都有统计学意义,要继续做多个样本率的多重比较。51.3、有序的RC 表资料不宜用2检验。52.表8-10两种药治疗慢性气管炎的疗效组别无效好转显效控制合计A药组8001920680603460B药组1060261811453.
©2010-2024 宁波自信网络信息技术有限公司 版权所有
客服电话:4008-655-100 投诉/维权电话:4009-655-100