1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第七章,检验,(,Chi-square Test,),1,2,检验,(Chi-square test),是现代统计学的创始人之一,英国人,K.,Pearson,(,1857-1936,)于,1900,年提出的一种具有广泛用途的统计方法,可用于资料分布的,拟合优度检验,、,两个或多个率或构成比间的比较,等等。,2,3,4,5,6,目 的:,推断两个总体率或构成比之间有无差别,多个总体率或构成比之间有无差别,多个样本率的多重比较,两个分类变量之间有无关联性,频数分布拟合优度的检验。,检验统计量,:,应用,:
2、计数资料,7,第一节,四格表资料的 检验,8,目的:,推断两个总体率(构成比)是,否有差别,要求:,两样本的两分类个体数排列成四,格表资料,9,1,基本思想,例,7-1,某院欲比较异梨醇口服液(试验组)和氢氯噻嗪,+,地塞米松(对照组)降低颅内压的疗效。将,200,例颅内压增高症患者随机分为两组,结果见表,7-1,。问两组降低颅内压的总体有效率有无差别?,10,表,7-1,两组降低颅内压有效率的比较,11,本例资料经整理成图,7-2,形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有 四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。,12,图,7-2,四
3、格表资料的基本形式,13,基本思想:可通过 检验的基本公式来理解。,式中,,A,为实际频数(,actual frequency,),,T,为理论频数(,theoretical frequency,)。,式中,,TRC,为第,R,行,C,列的理论频数,nR,为相应的行合计,nC,为相应的列合计,T,为在无效假设前提下(两总体率相等,等于合计率)推算的预期值。,14,如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,,均等于合计的有效率,87%,。,那么在这个前提下,理论上,,试验组的,104,例颅内压增高症患者中有效者应为,104(174/200,)=90.48,,无效者为,104(2
4、6/200)=13.52,;同理,,对照组的,96,例颅内压增高症患者中有效者应为,96(174/200)=83.52,,无效者为,96(26/200)=12.48,。,15,检验统计量 值反映了实际频数与理论频数的吻合程度。,若检验假设,H,0,:,1,=,2,成立,四个格子的实际频数,A,与理论频数,T,相差不应该很大,即统计量不应该很大。如果 值很大,即相对应的,P,值很小,若 ,则反过来推断,A,与,T,相差太大,超出了抽样误差允许的范围,从而怀疑,H,0,的正确性,继而拒绝,H,0,,,接受其对立假设,H,1,,即,1,2,。,16,由公式(,7-1,)还可以看出:值的大小还取决于,
5、个数的多少(严格地说是自由度,的大小)。由于各,皆是正值,故自由度,愈大,值也会愈大;所以只有考虑了自由度,的影响,值才能正确地反映实际频数,A,和理论频数,T,的吻合程度。,检验的自由度取决于可以自由取值的格子数目,而不是样本含量,n,。,四格表资料只有两行两列,,v=1,,即在周边合计数固定的情况下,,4,个基本数据当中只有一个可以自由取值。,17,(,1,)分布是一种连续型分布:按分布的密度函数可给出自由度,=1,,,2,,,3,,,的一簇分布曲线(图,7-1,)。,(,2,)分布的一个基本性质是可加性:如果两个独立的随机变量,X,1,和,X,2,分别服从自由度,1,和,2,的分布,即
6、那么它们的和(,X,1,+,X,2,),服从自由度(,1,+,2,),的 分布,即,。,2,分布,18,(,3,),界值:当,v,确定后,分布曲线下右侧尾部的面积为,a,时,横轴上相应的 值,记作,(,见附表,8),。值愈大,,p,值愈小;反之,值愈小,,p,值愈大。,19,20,(,1,)建立检验假设,确定检验水平。,H,0,:,1,=,2,即试验组与对照组降低颅内压的,总体,有效率,相等,H,1,:,1,2,即试验组与对照组降低颅内压的,总体,有效率,不相等,=0.05,3.,假设检验步骤,21,(,2,)求检验统计量值,22,以,v=1,查附表,8,的 界值表得,P0.005,。按,a
7、0.05,检验水准拒绝,H,0,,接受,H,1,,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪,+,地塞米松的有效率。,23,二、四格表资料检验的专用公式,24,分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量 的抽样分布亦呈离散性质。为改善 统计量 分布的连续性,则需行连续性校正。,25,三、四格表资料检验的校正公式,26,四格表资料 检验公式选择条件:,,专用公式;,,校正公式;,,直接计算概率。,27,例,7-2,某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将,78,例脑血管疾病患者随机分为两组,结果见表,7-2,
8、问两种药物治疗脑血管疾病的有效率是否相等?,28,表,7-2,两种药物治疗脑血管疾病有效率的比较,29,本例 ,故用四格表资料 检验的校正公式,v=1,,查 界值表得,0.05P0.10,。按,a,=0.05,检验水准不拒绝,H,0,,尚不能认为两种药物治疗脑血管疾病的有效率不等。,30,本资料若不校正时,,结论与之相反。,31,第二节,配对四格表资料的 检验,32,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即,四格表资料,和,配对四格表资料,。,33,例,7-3,某实验室分别用乳胶凝集法和免疫荧光法对,58
9、名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表,7-3,。问两种方法的检测结果有无差别?,34,表,7-3,两种方法的检测结果,35,上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有,四种可能,:,两种检测方法皆为阳性数,(,a,),;,两种检测方法皆为阴性数,(,d,),;,免疫荧光法为阳性,乳胶凝集法为,阴性数,(,b,),;,乳胶凝集法为阳性,免疫荧光法为,阴性数,(,c,),。,36,其中,,a,d,为两法观察结果一致的两种情况,,b,c,为两法观察结果不一致的两种情况。,检验统计量为,37,注意:,本法一般用于,样本含量不太大,的资料。因为它仅考虑了两法结果不一致
10、的两种情况,(,b,c,),,,而未考虑样本含量,n,和两法结果一致的两种情况,(,a,d,),。,所以,当,n,很大且,a,与,d,的数值很大(即两法的一致率较高),,b,与,c,的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。,38,检验步骤:,,用校正公式,v,1,,查 界值表得,0.01P0.025,。,按,a,=0.05,检验水准拒绝,H,0,,接受,H,1,,可,以认为两种方法的检测结果不同,免疫荧,光法的阳性检测率较高。,39,第三节,四格表资料的,Fisher,确切概率法,40,条件:,n40,,或,T0,,须计算满足,D,i,D,*,和,P,i,P,*,条
11、件的各种组合下四格表的累计概率。若,D,*,0,,则计算满足,D,i,D,*,和,P,i,P,*,条件的各种组合下四格表的累计概率。,48,(,2,)双侧检验 计算满足 和,PiP,*,条件的各种组合下四格表的累计概率。若遇到,a+b,c+d,或,a+c,b+d,时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,然后乘以,2,即得双侧累计概率。,49,二、,检验步骤(本例,n,330.05,按,a,=0.05,检验水准不拒绝,H,0,,尚不能认为预防注射与非预防的新生儿,HBV,的感染率不等。,51,表,7-5,例,7-4,的,Fisher,确切概率法计算表,52
12、例,7-5,某单位研究胆囊腺癌、腺瘤的,P,53,基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各,10,份,用免疫组化法检测,P,53,基因,资料见表,7-6,。问胆囊腺癌和胆囊腺瘤的,P,53,基因表达阳性率有无差别?,53,表,7-6,胆囊腺癌与胆囊腺瘤,P53,基因表达阳性率的比较,54,本例,a,+,b,+,c,+,d,=10,,,由表,7-7,可看出,四格表内各种组合以,i,=4,和,i,=5,的组合为中心呈,对称分布,。,表,7-7,例,7-5,的,Fisher,确切概率法计算表,*,为现有样本,55,(,1,)计算现有样本的,D,*,和,P,*,及各组合下四格表的,D,i,。,
13、本例,D,*=50,,,P,*=0.02708978,。,(,2,),计算满足,D,i,50,条件的各组合下四格表的概率,P,i,。,(,3,),计算同时满足,D,i,50,和,P,i,P,*,条件的四格表的累,计概率。本例为,P,7,和,P,8,,,(,4,),计算双侧累计概率,P,。,P,0.05,,按,=0.05,检验水准不拒绝,H,0,,,尚不能认为胆囊腺癌与胆囊腺瘤的,P,53,基因表达阳性率不等。,56,注意:,例,7-5,中,若专业上有理由认为胆囊腺癌不会低于胆囊腺瘤的,P,53,基因表达阳性率,则进行单侧检验,,H,0,:,p,1,p,2,,,H,1,:,p,1,p,2,,,a
14、0.05,,由表,7-7,计算单侧概率,P,P,7,+P,8,0.0286,,,0.01P0.05,单侧检验拒绝,H,0,,接受,H,1,,可以认为胆囊腺癌的,P,53,基因表达阳性率高于胆囊腺瘤。,57,第四节,行,列表资料的 检验,58,行,列表资料,多个样本率比较时,有,R,行,2,列,称为,R,2,表;,两个样本的构成比比较时,有,2,行,C,列,称,2,C,表;,多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为,R,C,表。,59,检验统计量,60,一、多个样本率的比较,61,例,7-6,某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,
15、资料见表,7-8,。问三种疗法的有效率有无差别?,表,7-8,三种疗法有效率的比较,62,检验步骤:,H,0,:,p,1,=,p,2,=,p,3,,即三种疗法,有效率相等,H,1,:三种疗法,有效率不全相等,a,=0.05,查 界值表得,P0.005,。按,a,=0.05,检验水准拒绝,H,0,,接受,H,1,,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,63,二、样本构成比的比较,64,例,7-7,某医师在研究血管紧张素,I,转化酶,(ACE),基因,I/D,多态(分,3,型)与,2,型糖尿病肾病,(DN),的关系时,将,249,例,2,型糖尿病患者按有无糖尿病肾病分为两组,资料见
16、表,7-9,。问两组,2,型糖尿病患者的,ACE,基因型总体分布有无差别?,表,7-9 DN,组与无,DN,组,2,型糖尿病患者,ACE,基因型分布的比较,65,检验步骤,H,0,:两组总体构成比相同,H,1,:两组总体构成比不同,a,0.05,查 界值表得,0.01P0.025,。按,a,=0.05,检验水准,拒绝,H,0,,接受,H,1,,可认为,DN,与无,DN,的,2,型糖尿病,患者的,ACE,基因型分布不同。,66,三、双向无序分类资料的关联性检验,R,C,表中两个分类变量皆为无序分类变量的行,列表资料,又称为双向无序,R,C,表资料。,注意,:,双向无序分类资料为两个或多个样本,做
17、差别检验(例,7-7,);若为单样本,做关联性检验,。,67,例,7-8,测得某地,5801,人的,ABO,血型和,MN,血型结果如表,7-10,,问两种血型系统之间是否有关联?,表,7-10,某地,5801,人的血型,(单样本,做关联性检验),68,表,7-10,资料,可用行,列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算,Pearson,列联系数,C,进一步分析关系的密切程度:,列联系数,C,取值范围在,0,1,之间。,0,表示完全独立;,1,表示完全相关;愈接近于,0,,关系愈不密切;愈接近于,1,,关系愈密切。,69,检验步骤,H,0,:两种血型系统间无关联,
18、H,1,:两种血型系统间有关联,a,=0.05,70,由于列联系数,C,=0.1883,,,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,查 界值表得,P,0.05,。按,a,=0.05,检验水准,拒绝,H,0,,接受,H,1,,可认为两种血型系统间,有关联,其,Pearson,列联系数为,71,四、行,列表资料 检验的,注意事项,1,行列表中的,各格,T,1,,并且,1,T,5,的格子数不宜超过,1/5,格子总数,否则可能产生偏性。,处理方法有三种:,(,1,)增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。,72,(,
19、2,)根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。,注意:,不同年龄组可以合并,但不同血型就不能合并。,(,3,)改用双向无序,R,C,表的,Fisher,确切概率法。,73,2,多个样本率比较,若所得统计推断为拒绝,H,0,,接受,H,1,时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较,(见第五节),。,74,3,医学期刊中常见这样的情况:不管,R,C,表资料中的两个分类变量是有序还是无序,均用 检验分析。这种做法
20、是不妥的。对于有序的,R,C,表资料不宜用 检验,因为行,列表资料的 检验与分类变量的顺序无关,当有序变量的,R,C,表资料中的分类顺序固定不变时,无论将任何两行(或两列)频数互换,所得 值皆不变,其结论相同,这显然是不妥的。因此在实际应用中,对于,R,C,表资料要根据其分类类型和研究目的选用恰当的检验方法(见第六节)。,75,第五节,多个样本率间的多重比较,76,当多个样本率比较的,R,2,表资料 检验,推断结论为拒绝,H,0,,接受,H,1,时,要进一步推断哪两两总体率有差别,若直接用四格表资料的 检验进行多重比较,将会加大犯,类错误的概率。,样本率间的多重比较不能直接用四格表资料的 检验
21、多个样本率间的多重比较的方法有 分割法、,Scheffe,可信区间法和,SNK,法。本节仅仅介绍一种基于 分割法的多个样本率间多重比较的方法,后两种方法可参阅有关书籍。,77,因分析目的不同,,k,个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:,分割法,一、基本思想,多个样本率比较的资料可整理成,2,k,表资料,若经行,列表资料 检验的结论为拒绝,H,0,,接受,H,1,时,可不经任何处理,直接用分割法把,2,k,表分成多个独立的四格表进行两两比较,但必须重新规定检验水准。其目的是为保证检验假设中,I,型错误,a,的概率不变。,78,1,多个实验组间的两两
22、比较 分析目的为,k,个实验组间,任两个率均进行比较时,须进行 次独立的四格表 检验,再加上总的行,列表资料的 检验,共 次检验假设。故检验水准,a,用下式估计,1,多个实验组间的两两比较 分析目的为,k,个实验组间,任两个率均进行比较时,须进行 次独立的四格表 检验,再加上总的行,列表资料的 检验,共 次检验假设。故检验水准,a,用下式估计。,式中 ,,k,为样本率的个数。,79,2,实验组与同一个对照组的比较,分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。其检验水准,a,用下式估计,式中,k,为样本率的个数。由该式估计的检验水准,a,较保守(,a,通常较小)。,80,81,
23、二、多个实验组间的,两两比较,82,例,7-9,对例,7-6,中表,7-8,的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?,二、多个实验组间的,两两比较,83,检验步骤,本例为,3,个实验组间的两两比较,H,0,:,p,1,p,2,,即任两对比组的总体有效率相等,H,1,:,p,1,p,2,,即任两对比组的总体有效率不等,a,0.05,84,表,7-12,三种疗法有效率的两两比较,85,按,a,0.0125,检验水准,物理疗法组与药物治疗组拒绝,H,0,,接受,H,1,;物理疗法组与外用膏药组拒绝,H,0,接受,H1,;,药物治疗组与外用膏药组不拒绝,H,0;,
24、86,例,7-10,以表,7-8,资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?,H,0,:,p,T,p,C,,即各试验组与对照组的总体有效率相等,H1,:,p,T,p,C,,即各试验组与对照组的总体有效率不等,a,0.05,本例为各实验组与同一对照组的比较,三、各,实验组与同一个对照组,的比较,87,物理疗法组与药物治疗组比较:,=6.76,,,P0.0125,按,a,=0.0125,检验水准,物理疗法组与药物治疗组拒绝,H,0,接受,H,1,,可认为物理疗法组与药物治疗组的总体有效率有差别;外用膏药组与药物治疗组不拒绝,H,0,,尚
25、不能认为两总体有效率有差别。结合表,7-8,资料,物理疗法的有效率高于药物治疗。,88,第七节,频数分布拟合优度的 检验,89,医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法,但,只适用于正态分布,。,Pearson,值能反映实际频数和理论频数的吻合程度,故 检验可用于推断频数分布的拟合优度,且应用广泛。如正态分布,二项分布,,Poisson,分布,负二项分布等。,90,例,7-12,观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为,279,个取样单位,统计各取样单位历年累计病例数,资料见表,7-15,的第,(1
26、),、,(2),栏,问此资料是否服从,Poisson,分布?,91,表,7-15 Poisson,分布的拟合与检验,*:,X,8,的概率:,1-0.9961=0.0039,92,本例,n=279,,,均数,u=686/279=2.46,,,均数与方差相近,可试拟合,Poisson,分布。,H0,:本资料服从,Poisson,分布,H1,:本资料不服从,Poisson,分布,a,=0.10,93,按,Poisson,分布概率函数 ,求得取样单位内病例数为,0,,,1,,,2,,,的概率,P(X),,理论频数,T,X,=P(X)*n,,列入表,7-15,的第,(3),、(,4,)、(,5,)栏。因
27、理论数,T,7,=2.6,,,T,8,=1.1,,皆小于,5,,故合并在,T,6,。,94,以,v=7-2=5(,因,T,6,T,7,T,8,合并后只有,7,行,计算,Poisson,分布的理论频数时用了均数与总例数,n,,故,v=7-2),,查 界值表,得,0.75P0.9,。按,a,=0.10,检验水准不拒绝,H,0,,可认为本资料服从,Poisson,分布。,95,小 结,掌握,(1),卡方检验的基本思想和用途;,(2),成组设计四格表资料卡方检验的计算及应用条件;,(3),配对设计四格表资料卡方检验;,(4),行,X,列表资料卡方检验及应用时应注意的问题;,熟悉,行,X,列表资料卡方检验应用时应注意的问题。,行,X,列表资料两两比较的卡方分割法。,96,






