第七章卡方检验.ppt-资源下载-咨信网-让知识获取变得高效

第七章卡方检验.ppt

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,第七章,检验,（,Chi-square Test,）,1,2,检验,(Chi-square test),是现代统计学的创始人之一，英国人,K.,Pearson,（,1857-1936,）于,1900,年提出的一种具有广泛用途的统计方法，可用于资料分布的,拟合优度检验,、,两个或多个率或构成比间的比较,等等。,2,3,4,5,6,目的：,推断两个总体率或构成比之间有无差别,多个总体率或构成比之间有无差别,多个样本率的多重比较,两个分类变量之间有无关联性,频数分布拟合优度的检验。,检验统计量,：,应用,：

2、计数资料,7,第一节,四格表资料的检验,8,目的：,推断两个总体率（构成比）是,否有差别,要求：,两样本的两分类个体数排列成四,格表资料,9,1,基本思想,例,7-1,某院欲比较异梨醇口服液（试验组）和氢氯噻嗪,+,地塞米松（对照组）降低颅内压的疗效。将,200,例颅内压增高症患者随机分为两组，结果见表,7-1,。问两组降低颅内压的总体有效率有无差别？,10,表,7-1,两组降低颅内压有效率的比较,11,本例资料经整理成图,7-2,形式，即有两个处理组，每个处理组的例数由发生数和未发生数两部分组成。表内有四个基本数据，其余数据均由此四个数据推算出来的，故称四格表资料。,12,图,7-2,四

3、格表资料的基本形式,13,基本思想：可通过检验的基本公式来理解。,式中，,A,为实际频数（,actual frequency,），,T,为理论频数（,theoretical frequency,）。,式中，,TRC,为第,R,行,C,列的理论频数,nR,为相应的行合计,nC,为相应的列合计,T,为在无效假设前提下（两总体率相等，等于合计率）推算的预期值。,14,如上例，无效假设是试验组与对照组降低颅内压的总体有效率相等，,均等于合计的有效率,87%,。,那么在这个前提下，理论上，,试验组的,104,例颅内压增高症患者中有效者应为,104(174/200,)=90.48,，无效者为,104(2

4、6/200)=13.52,；同理，,对照组的,96,例颅内压增高症患者中有效者应为,96(174/200)=83.52,，无效者为,96(26/200)=12.48,。,15,检验统计量值反映了实际频数与理论频数的吻合程度。,若检验假设,H,0,:,1,=,2,成立，四个格子的实际频数,A,与理论频数,T,相差不应该很大，即统计量不应该很大。如果值很大，即相对应的,P,值很小，若，则反过来推断,A,与,T,相差太大，超出了抽样误差允许的范围，从而怀疑,H,0,的正确性，继而拒绝,H,0,，,接受其对立假设,H,1,，即,1,2,。,16,由公式（,7-1,）还可以看出：值的大小还取决于,

5、个数的多少（严格地说是自由度,的大小）。由于各,皆是正值，故自由度,愈大，值也会愈大；所以只有考虑了自由度,的影响，值才能正确地反映实际频数,A,和理论频数,T,的吻合程度。,检验的自由度取决于可以自由取值的格子数目，而不是样本含量,n,。,四格表资料只有两行两列，,v=1,，即在周边合计数固定的情况下，,4,个基本数据当中只有一个可以自由取值。,17,（,1,）分布是一种连续型分布：按分布的密度函数可给出自由度,=1,，,2,，,3,，,的一簇分布曲线（图,7-1,）。,（,2,）分布的一个基本性质是可加性：如果两个独立的随机变量,X,1,和,X,2,分别服从自由度,1,和,2,的分布，即

6、那么它们的和（,X,1,+,X,2,）,服从自由度（,1,+,2,）,的分布，即,。,2,分布,18,（,3,）,界值：当,v,确定后，分布曲线下右侧尾部的面积为,a,时，横轴上相应的值，记作,(,见附表,8),。值愈大，,p,值愈小；反之，值愈小，,p,值愈大。,19,20,（,1,）建立检验假设，确定检验水平。,H,0,:,1,=,2,即试验组与对照组降低颅内压的,总体,有效率,相等,H,1,:,1,2,即试验组与对照组降低颅内压的,总体,有效率,不相等,=0.05,3.,假设检验步骤,21,（,2,）求检验统计量值,22,以,v=1,查附表,8,的界值表得,P0.005,。按,a

7、0.05,检验水准拒绝,H,0,，接受,H,1,，可以认为两组降低颅内压总体有效率不等，即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪,+,地塞米松的有效率。,23,二、四格表资料检验的专用公式,24,分布是一连续型分布，而四格表资料属离散型分布，由此计算得的统计量的抽样分布亦呈离散性质。为改善统计量分布的连续性，则需行连续性校正。,25,三、四格表资料检验的校正公式,26,四格表资料检验公式选择条件：,，专用公式；,，校正公式；,，直接计算概率。,27,例,7-2,某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效，将,78,例脑血管疾病患者随机分为两组，结果见表,7-2,

8、问两种药物治疗脑血管疾病的有效率是否相等？,28,表,7-2,两种药物治疗脑血管疾病有效率的比较,29,本例，故用四格表资料检验的校正公式,v=1,，查界值表得,0.05P0.10,。按,a,=0.05,检验水准不拒绝,H,0,，尚不能认为两种药物治疗脑血管疾病的有效率不等。,30,本资料若不校正时，,结论与之相反。,31,第二节,配对四格表资料的检验,32,与计量资料推断两总体均数是否有差别有成组设计和配对设计一样，计数资料推断两个总体率（构成比）是否有差别也有成组设计和配对设计，即,四格表资料,和,配对四格表资料,。,33,例,7-3,某实验室分别用乳胶凝集法和免疫荧光法对,58

9、名可疑系统红斑狼疮患者血清中抗核抗体进行测定，结果见表,7-3,。问两种方法的检测结果有无差别？,34,表,7-3,两种方法的检测结果,35,上述配对设计实验中，就每个对子而言，两种处理的结果不外乎有,四种可能,:,两种检测方法皆为阳性数,(,a,),；,两种检测方法皆为阴性数,(,d,),；,免疫荧光法为阳性，乳胶凝集法为,阴性数,(,b,),；,乳胶凝集法为阳性，免疫荧光法为,阴性数,(,c,),。,36,其中，,a,d,为两法观察结果一致的两种情况，,b,c,为两法观察结果不一致的两种情况。,检验统计量为,37,注意：,本法一般用于,样本含量不太大,的资料。因为它仅考虑了两法结果不一致

10、的两种情况,(,b,c,),，,而未考虑样本含量,n,和两法结果一致的两种情况,(,a,d,),。,所以，当,n,很大且,a,与,d,的数值很大（即两法的一致率较高），,b,与,c,的数值相对较小时，即便是检验结果有统计学意义，其实际意义往往也不大。,38,检验步骤：,，用校正公式,v,1,，查界值表得,0.01P0.025,。,按,a,=0.05,检验水准拒绝,H,0,，接受,H,1,，可,以认为两种方法的检测结果不同，免疫荧,光法的阳性检测率较高。,39,第三节,四格表资料的,Fisher,确切概率法,40,条件：,n40,，或,T0,，须计算满足,D,i,D,*,和,P,i,P,*,条

11、件的各种组合下四格表的累计概率。若,D,*,0,，则计算满足,D,i,D,*,和,P,i,P,*,条件的各种组合下四格表的累计概率。,48,（,2,）双侧检验计算满足和,PiP,*,条件的各种组合下四格表的累计概率。若遇到,a+b,c+d,或,a+c,b+d,时，四格表内各种组合的序列呈对称分布，此时按单侧检验规定条件只计算单侧累计概率，然后乘以,2,即得双侧累计概率。,49,二、,检验步骤（本例,n,330.05,按,a,=0.05,检验水准不拒绝,H,0,，尚不能认为预防注射与非预防的新生儿,HBV,的感染率不等。,51,表,7-5,例,7-4,的,Fisher,确切概率法计算表,52

12、例,7-5,某单位研究胆囊腺癌、腺瘤的,P,53,基因表达，对同期手术切除的胆囊腺癌、腺瘤标本各,10,份，用免疫组化法检测,P,53,基因，资料见表,7-6,。问胆囊腺癌和胆囊腺瘤的,P,53,基因表达阳性率有无差别？,53,表,7-6,胆囊腺癌与胆囊腺瘤,P53,基因表达阳性率的比较,54,本例,a,+,b,+,c,+,d,=10,，,由表,7-7,可看出，四格表内各种组合以,i,=4,和,i,=5,的组合为中心呈,对称分布,。,表,7-7,例,7-5,的,Fisher,确切概率法计算表,*,为现有样本,55,（,1,）计算现有样本的,D,*,和,P,*,及各组合下四格表的,D,i,。,

13、本例,D,*=50,，,P,*=0.02708978,。,（,2,）,计算满足,D,i,50,条件的各组合下四格表的概率,P,i,。,（,3,）,计算同时满足,D,i,50,和,P,i,P,*,条件的四格表的累,计概率。本例为,P,7,和,P,8,，,（,4,）,计算双侧累计概率,P,。,P,0.05,，按,=0.05,检验水准不拒绝,H,0,，,尚不能认为胆囊腺癌与胆囊腺瘤的,P,53,基因表达阳性率不等。,56,注意：,例,7-5,中，若专业上有理由认为胆囊腺癌不会低于胆囊腺瘤的,P,53,基因表达阳性率，则进行单侧检验，,H,0,：,p,1,p,2,，,H,1,：,p,1,p,2,，,a

14、0.05,，由表,7-7,计算单侧概率,P,P,7,+P,8,0.0286,，,0.01P0.05,单侧检验拒绝,H,0,，接受,H,1,，可以认为胆囊腺癌的,P,53,基因表达阳性率高于胆囊腺瘤。,57,第四节,行,列表资料的检验,58,行,列表资料,多个样本率比较时，有,R,行,2,列，称为,R,2,表；,两个样本的构成比比较时，有,2,行,C,列，称,2,C,表；,多个样本的构成比比较，以及双向无序分类资料关联性检验时，有行列，称为,R,C,表。,59,检验统计量,60,一、多个样本率的比较,61,例,7-6,某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效，

15、资料见表,7-8,。问三种疗法的有效率有无差别？,表,7-8,三种疗法有效率的比较,62,检验步骤：,H,0,：,p,1,=,p,2,=,p,3,，即三种疗法,有效率相等,H,1,：三种疗法,有效率不全相等,a,=0.05,查界值表得,P0.005,。按,a,=0.05,检验水准拒绝,H,0,，接受,H,1,，可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。,63,二、样本构成比的比较,64,例,7-7,某医师在研究血管紧张素,I,转化酶,(ACE),基因,I/D,多态（分,3,型）与,2,型糖尿病肾病,(DN),的关系时，将,249,例,2,型糖尿病患者按有无糖尿病肾病分为两组，资料见

16、表,7-9,。问两组,2,型糖尿病患者的,ACE,基因型总体分布有无差别？,表,7-9 DN,组与无,DN,组,2,型糖尿病患者,ACE,基因型分布的比较,65,检验步骤,H,0,：两组总体构成比相同,H,1,：两组总体构成比不同,a,0.05,查界值表得,0.01P0.025,。按,a,=0.05,检验水准,拒绝,H,0,，接受,H,1,，可认为,DN,与无,DN,的,2,型糖尿病,患者的,ACE,基因型分布不同。,66,三、双向无序分类资料的关联性检验,R,C,表中两个分类变量皆为无序分类变量的行,列表资料，又称为双向无序,R,C,表资料。,注意,:,双向无序分类资料为两个或多个样本，做

17、差别检验（例,7-7,）；若为单样本，做关联性检验,。,67,例,7-8,测得某地,5801,人的,ABO,血型和,MN,血型结果如表,7-10,，问两种血型系统之间是否有关联？,表,7-10,某地,5801,人的血型,（单样本，做关联性检验）,68,表,7-10,资料，可用行,列表资料检验来推断两个分类变量之间有无关系（或关联）；若有关系，可计算,Pearson,列联系数,C,进一步分析关系的密切程度：,列联系数,C,取值范围在,0,1,之间。,0,表示完全独立；,1,表示完全相关；愈接近于,0,，关系愈不密切；愈接近于,1,，关系愈密切。,69,检验步骤,H,0,：两种血型系统间无关联,

18、H,1,：两种血型系统间有关联,a,=0.05,70,由于列联系数,C,=0.1883,，,数值较小，故认为两种血型系统间虽然有关联性，但关系不太密切。,查界值表得,P,0.05,。按,a,=0.05,检验水准,拒绝,H,0,，接受,H,1,，可认为两种血型系统间,有关联，其,Pearson,列联系数为,71,四、行,列表资料检验的,注意事项,1,行列表中的,各格,T,1,，并且,1,T,5,的格子数不宜超过,1/5,格子总数，否则可能产生偏性。,处理方法有三种：,（,1,）增大样本含量以达到增大理论频数的目的，属首选方法，只是有些研究无法增大样本含量，如同一批号试剂已用完等。,72,（,

19、2,）根据专业知识，删去理论频数太小的行或列，或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。,注意：,不同年龄组可以合并，但不同血型就不能合并。,（,3,）改用双向无序,R,C,表的,Fisher,确切概率法。,73,2,多个样本率比较，若所得统计推断为拒绝,H,0,，接受,H,1,时，只能认为各总体率之间总的来说有差别，但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别，需进一步做多个样本率的多重比较,（见第五节）,。,74,3,医学期刊中常见这样的情况：不管,R,C,表资料中的两个分类变量是有序还是无序，均用检验分析。这种做法

20、是不妥的。对于有序的,R,C,表资料不宜用检验，因为行,列表资料的检验与分类变量的顺序无关，当有序变量的,R,C,表资料中的分类顺序固定不变时，无论将任何两行（或两列）频数互换，所得值皆不变，其结论相同，这显然是不妥的。因此在实际应用中，对于,R,C,表资料要根据其分类类型和研究目的选用恰当的检验方法（见第六节）。,75,第五节,多个样本率间的多重比较,76,当多个样本率比较的,R,2,表资料检验，推断结论为拒绝,H,0,，接受,H,1,时，要进一步推断哪两两总体率有差别，若直接用四格表资料的检验进行多重比较，将会加大犯,类错误的概率。,样本率间的多重比较不能直接用四格表资料的检验

21、多个样本率间的多重比较的方法有分割法、,Scheffe,可信区间法和,SNK,法。本节仅仅介绍一种基于分割法的多个样本率间多重比较的方法，后两种方法可参阅有关书籍。,77,因分析目的不同，,k,个样本率两两比较的次数不同，故重新规定的检验水准的估计方法亦不同。通常有两种情况：,分割法,一、基本思想,多个样本率比较的资料可整理成,2,k,表资料，若经行,列表资料检验的结论为拒绝,H,0,，接受,H,1,时，可不经任何处理，直接用分割法把,2,k,表分成多个独立的四格表进行两两比较，但必须重新规定检验水准。其目的是为保证检验假设中,I,型错误,a,的概率不变。,78,1,多个实验组间的两两

22、比较分析目的为,k,个实验组间，任两个率均进行比较时，须进行次独立的四格表检验，再加上总的行,列表资料的检验，共次检验假设。故检验水准,a,用下式估计,1,多个实验组间的两两比较分析目的为,k,个实验组间，任两个率均进行比较时，须进行次独立的四格表检验，再加上总的行,列表资料的检验，共次检验假设。故检验水准,a,用下式估计。,式中，,k,为样本率的个数。,79,2,实验组与同一个对照组的比较,分析目的为各实验组与同一个对照组的比较，而各实验组间不须比较。其检验水准,a,用下式估计,式中,k,为样本率的个数。由该式估计的检验水准,a,较保守（,a,通常较小）。,80,81,

23、二、多个实验组间的,两两比较,82,例,7-9,对例,7-6,中表,7-8,的资料进行两两比较，以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别？,二、多个实验组间的,两两比较,83,检验步骤,本例为,3,个实验组间的两两比较,H,0,：,p,1,p,2,，即任两对比组的总体有效率相等,H,1,：,p,1,p,2,，即任两对比组的总体有效率不等,a,0.05,84,表,7-12,三种疗法有效率的两两比较,85,按,a,0.0125,检验水准,物理疗法组与药物治疗组拒绝,H,0,，接受,H,1,；物理疗法组与外用膏药组拒绝,H,0,接受,H1,；,药物治疗组与外用膏药组不拒绝,H,0;,

24、86,例,7-10,以表,7-8,资料中的药物治疗组为对照组，物理疗法组与外用膏药组为试验组，试分析两试验组与对照组的总体有效率有无差别？,H,0,：,p,T,p,C,，即各试验组与对照组的总体有效率相等,H1,：,p,T,p,C,，即各试验组与对照组的总体有效率不等,a,0.05,本例为各实验组与同一对照组的比较,三、各,实验组与同一个对照组,的比较,87,物理疗法组与药物治疗组比较：,=6.76,，,P0.0125,按,a,=0.0125,检验水准,物理疗法组与药物治疗组拒绝,H,0,接受,H,1,，可认为物理疗法组与药物治疗组的总体有效率有差别；外用膏药组与药物治疗组不拒绝,H,0,，尚

25、不能认为两总体有效率有差别。结合表,7-8,资料，物理疗法的有效率高于药物治疗。,88,第七节,频数分布拟合优度的检验,89,医学研究实践中，常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法，但,只适用于正态分布,。,Pearson,值能反映实际频数和理论频数的吻合程度，故检验可用于推断频数分布的拟合优度，且应用广泛。如正态分布，二项分布，,Poisson,分布，负二项分布等。,90,例,7-12,观察某克山病区克山病患者的空间分布情况，调查者将该地区划分为,279,个取样单位，统计各取样单位历年累计病例数，资料见表,7-15,的第,(1

26、),、,(2),栏，问此资料是否服从,Poisson,分布？,91,表,7-15 Poisson,分布的拟合与检验,*：,X,8,的概率：,1-0.9961=0.0039,92,本例,n=279,，,均数,u=686/279=2.46,，,均数与方差相近，可试拟合,Poisson,分布。,H0,：本资料服从,Poisson,分布,H1,：本资料不服从,Poisson,分布,a,=0.10,93,按,Poisson,分布概率函数，求得取样单位内病例数为,0,，,1,，,2,，,的概率,P(X),，理论频数,T,X,=P(X)*n,，列入表,7-15,的第,(3),、（,4,）、（,5,）栏。因

27、理论数,T,7,=2.6,，,T,8,=1.1,，皆小于,5,，故合并在,T,6,。,94,以,v=7-2=5(,因,T,6,T,7,T,8,合并后只有,7,行，计算,Poisson,分布的理论频数时用了均数与总例数,n,，故,v=7-2),，查界值表，得,0.75P0.9,。按,a,=0.10,检验水准不拒绝,H,0,，可认为本资料服从,Poisson,分布。,95,小结,掌握,(1),卡方检验的基本思想和用途；,(2),成组设计四格表资料卡方检验的计算及应用条件；,(3),配对设计四格表资料卡方检验；,(4),行,X,列表资料卡方检验及应用时应注意的问题；,熟悉,行,X,列表资料卡方检验应用时应注意的问题。,行,X,列表资料两两比较的卡方分割法。,96,

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
特别说明：	请自助下载，系统不会自动发送文件的哦；如果您已付费，想二次下载，请登录后访问：我的下载记录
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？