1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,非参数检验的适用情况,总体分布形式未知或分布类型不明,偏态分布的资料,等级资料,:不能精确测定,只能以严重程度、优劣等级、次序先后等表示,不满足参数检验条件的资料:各组方差明显不齐,数据两端或一端是不确定数值,如“50mg”等(开口资料),尤其适用,医学研究中的等级资料,疗效,:痊愈、显效、有效、无效、恶化,化验结果,:、,体格发育,:下等、中下、中等、中上、上等,心功能分级,:、,文化程度,:小学、中学、大学、研究生,营养水平,:差、一般、好,诸如此类只能用严重程度、优劣等级、时序先后等形式表达的
2、资料,既非呈连续分布的定量资料,也非仅按属性归类的无序分类资料,它们对观察指标的表达,比“定量”粗,,而,比一般的“定性”细,,组成了,有确定顺序差别,的若干“阶梯”,但毗邻的阶梯之间既不能度量,又非等距。,人们通常把该类介于定量与定性之间的资料称作,等级资料,,又称,有序分类资料,。,非参数检验的缺点:,对适宜用参数方法的资料,若用非参数法处理,常损失部分信息,降低效率,虽然许多非参数法计算简单,但不少问题的计算仍嫌繁杂,秩和检验就是非参数检验方法的一种。,对数据从小到大排序,该排序号在统计学上称为,秩,(秩次、秩序),。,将等级变成秩次的方法称为,秩变换,。,秩次与秩和,秩和,是同组秩次之
3、和。,例:某实验室检测了两组各6人的尿蛋白,结果如下:,A组:、+,B组:、+、+、+、+、+,依从小到大(也可从大到小)的顺序把它们统一排列起来,并标明秩次,结果如下:,A组:,+,B组:,+,+,+,+,+,1,2,3,4,5,6,7,8,9,10,11,12,相同等级取平均秩次,A组:,+,B组:,+,+,+,+,+,1,2,4.5,8.5,11.5,两组的秩和(T)分别为:,T,A,25,T,B,53,设A组有n,1,例,B组有n,2,例,n,1,+n,2,=N例,则,T,A,+T,B,=N(N+1)/2=78,秩和检验是通过秩次的排列求出秩和,从而对总体的分布或分布位置进行假设检验的
4、方法。,秩次一定程度上反映了等级的高低;,秩和一定程度上反映了等级(各组秩次)的分布位置。,成组设计两组比较的秩和检验,对于计量数据,如果资料,方差相等,,且服从,正态,分布,就可以用,t,检验比较两样本均数。,如果此假定不成立或不能确定是否成立,就应采用秩和检验来分析两样本是否来自同一总体(,Wilcoxon两样本比较法,)。,例 某实验室观察在缺氧条件下猫和兔的生存时间,结果见表,试问在缺氧条件下猫和兔的生存时间有无差别?,两独立样本秩和检验计算表,兔,猫,观察值,秩号,观察值,秩号,7,4,3,1,14,6,5,2,22,10,6,3,36,11,10,5,40,13,17,7,48,1
5、4,18,8,63,15,20,9,98,16,39,12,n,1,=8,秩和,T,1,=89,n,2,=8,秩和,T,2,=47,原始资料的两样本秩和检验,解:建立检验假设,确定检验水准,H,0,:,两样本来自相同总体(或两样本的总体分布相同);,H,1,:,两样本来自不同总体(或两样本的总体分布不同),=0.05,计算检验统计量,编秩:,两样本混合编秩次,求得,T,1,、,T,2,,确定,T,。,本例,T=47,成组设计两样本比较秩和检验的基本思想,假设含量分别为n,1,和n,2,的两个样本,分别来自分布相同的两个总体,则n,1,样本的秩和T与其平均秩和n,1,(N+1)/2应相差不大(N
6、n,1,+n,2,),若相差悬殊超出了所取检验水准的界值范围,表示抽得现有样本统计量T值的概率很小,因而拒绝假设,相反,若P不小,则不能拒绝假设。,基 本 思 想,两样本来自同一总体,任一组秩和不应太大或太小,如果两总体分布相同,假定:两组样本的总体分布形状相同,T,与,平均,秩和 应相差不大,T为样本例数较小者对应的秩和,查表法,(n,1,10,n,2,n,1,10)查T界值表(附表11),n,1,与n,2,n,1,交叉处即为T的界值,如果,T,位于检验界值区间内,不拒绝,H,0,;否则,拒绝,H,0,本例,T,=47,取,=0.05,查表得双侧检验界值区间(49,87),,T,位于区间外
7、P,10,超出T界值表范围,需用正态近似法,t,j,为第j个相同秩次的个数,本例t,1,=83,t,2,=181,t,3,=116,t,4,=23,本例相同秩次极多,需进行校正,u,c,=3.5961u,0.05,=1.96,P0.05,按=0.05的水准,拒绝H,0,,接受H,1,,差异有统计学意义。可认为复方猪胆胶囊治疗老年性慢性支气管炎喘息型与单纯型的疗效分布不同。,例,某医生在研究再生障碍性贫血时,测得不同,程度再生障碍性贫血患者血清中可溶CD,8,抗原水,平(U/ml)如表第、栏,问不同程度再生,障碍性贫血患者血清中可溶性CD,8,抗原水平有无,差别?,多个样本比较秩和检验,(K
8、ruskal-Wallis test),原始资料的多样本秩和检验,不同程度再生障碍性贫血患者血清中可溶CD,8,抗原水平(U/ml),正常组,轻度组,重度组,抗原水平,秩次,抗原水平,秩次,抗原水平,秩次,(1),(2),(3),(4),(5),(6),42,1,448,9,562,11,51,2,555,10,631,15,98,3,585,12,653,16,141,4,620,13.5,712,17.5,141,318,382,408,620,5,6,7,8,13.5,712,753,758,845,896,17.5,19,20,23,25.5,762,843,849,896,901,2
9、1,22,24,25.5,27,R,i,49.5,-,149.5,-,179,建立检验假设,确定检验水准,H,0,:,3,个总体的分布位置相同,H,1,:,3,个总体的分布位置不全相同,=0.05,(2)计算检验统计量,H,混合编秩,相同数值,取平均秩,算得各组的秩和,R,(8.3),式中 为各组例数,,N,=,,,R,i,为各组秩和。将本例有关数据代入式(8.3),:,3,确定,P,值,做出推断结论,若组数,k,=3,每组例数9,可直接查附表12,,H,界值表,得,P,值;若,k,4,或最大样本例数大于9,则,H,近似服从,=,k,1的,2分布,可查附表3,,2界值表。,本例以,N,=27,
10、n,1,=,n,2,=,n,3,=9,查附表,11,,,H,界值表,得,P,2,0.005,2,,,P,0.005。按,=0.05水准,拒绝,H,0,,接受,H,1,,差别有统计学意义。故可认为三药疗效总的来说有差别。,Wilcoxon符号秩和检验,(Wilcoxon signed rank test)也称两个相关样本资料的符号秩和检验(或Wilcoxon 配对法),主要用于,配对数值变量资料的比较,和,单一样本与总体中位数的比较,。,配对设计两样本比较,提出检验假设,H,0,:差值的总体中位数M,d,=0(即两总体分布位置相同),H,1,:差值的总体中位数M,d,0(即两总体分布位置不相
11、同),=0.05,求差值d,依 从小到大编秩:,求秩和,确定P值,作出统计结论,小样本时(,n50,),查T界值表,大样本时(,n50,),用正态近似法,步骤,按差值的绝对值从小到大编秩。,编秩时,若差值为0,舍去不计;,若差值绝对值相等,则取其平均秩次。,某研究者为了解A、B两种照射方式对家兔造成的皮肤损伤程度,按性别、体重、年龄对家兔进行了配对,然后将每对随机分配到A、B辐射组,观察,结果如下,试分析两组辐射危害是否一致。,原始资料的配对秩和检验,家兔号,A照射,B照射,d=A-B,秩次,(1),(2),(3),(4),(5),1,39,55,-16,-10,2,42,54,-12,-9,
12、3,51,55,-4,-3,4,43,47,-4,-3,5,55,53,2,1,6,45,63,-18,-11,7,22,52,-30,-12,8,48,44,4,3,9,40,48,-8,-6,10,45,55,-10,-8,11,40,32,8,6,12,49,57,-8,-6,合计,T,=10,T,-,=68,家兔皮肤损伤程度(评分),H,0,:A、B两种照射方式对家兔造成的皮肤损伤程度差值的总体中位数为零,即Md0,H,1,:A、B两种照射方式对家兔造成的皮肤损伤程度差值的总体中位数不为零,即Md0,=0.05,建立假设检验,确定检验水准,求差值,编秩,求秩和,确定检验统计量T,正秩和
13、T,+,=10,负秩和T,-,68,T,+,+T,-,n(n+1)/2=78,取,T=10,确定P值,做出统计结论,本例n12,T10,查T界值表得,0.02P0.05,按=0.05的水准拒绝H,0,,接受H,1,,差别有统计学意义,故可以认为A、B两种照射方式造成的急性皮肤损伤程度不同,B照射造成的损伤程度比A照射严重。,当n较大时(n50),T分布近似正态分布,其,均数,为,n(n+1)/4,,,方差,为,n(n+1)(2n+1)/24,,可采用,正态近似法,作u检验,连续性校正值,当相同秩次较多时,用,校正值,u,c,t,j,为第j(j=1,2,)个相同秩次的个数,例 用配对设计观察两种
14、方法治疗扁平足效果记录如下,问哪种方法好。,病例号,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,A法,好,好,好,好,差,中,好,好,中,差,好,差,好,中,好,中,B法,差,好,差,中,中,差,中,差,中,差,好,差,中,差,中,差,检验前,需把资料数量化,取“好”=3、“中”=2、“差”=1,建立假设、确定检验水准,H,0,:两法疗效差值的总体中位数为0,H,1,:两法疗效差值的总体中位数不为0,=0.05,等级资料的配对秩和检验,病例号,A法,B法,差值d,秩次,1,3,1,2,10,2,3,3,0,3,3,1,2,10,4,3,2,1,4.5,5,1,
15、2,-1,-4.5,6,2,1,1,4.5,7,3,2,1,4.5,8,3,1,2,10,9,2,2,0,10,1,1,0,11,3,3,0,12,1,1,0,13,3,2,1,4.5,14,2,1,1,4.5,15,3,2,1,4.5,16,2,1,1,4.5,T,+,=61.5,T,-,=4.5,求差值,编秩,求秩和,确定检验统计量T,本例,T,+,=61.5,T,-,=4.5,,取,T=4.5,确定P值,做出统计结论,本例T=4.5,n=11(n为非零差值的个数),查T界值表得P0.01,故按=0.05的水准拒绝H,0,,接受H,1,,差别有统计学意义,可以认为两种方法的疗效不同,A法优
16、于B法。,基本思想,假定两种处理方法的效应相同,则样本非0差值之产生纯系抽样误差所致,其总体分布应以0为中位数,且越接近于0,频数分布越密集;,同理,在自身前后对比研究中,若处理无效,则每一受试对象处理前后所得结果之差值的总体亦应以0为中位数。,若此假设成立,则样本差值之正秩和及负秩和均应与其理论秩和,n,(,n,+1)/4比较接近。若从样本求得一个偏离,n,(,n,+1)/4很远的,T,值,且其相应的,P,小于检验水准,时,根据小概率原理,我们就有理由拒绝,H,0,,接受,H,1,;反之,若,P,不是太小,则没有理由拒绝,H,0,。,区组设计的等级资料用M检验,又称Friedman秩和检验,
17、区组设计资料的秩和检验,例8.6 五位评委分别评定了4种葡萄酒的一至四4个等级,设一级为最优,二级其次,依次类推,结果如表8.5,问对四种酒的评判等级是否一致?,表8.5 五位评委对4种葡萄酒作等级评定(一至四级),评委,白兰地,W,白兰地,X,白兰地,Y,白兰地,Z,A,四(4),二(2),一(1),三(3),B,四(4),一(1),二(2),三(3),C,三(3),一(1),二(2),四(4),D,四(4),二(2),三(3),一(1),E,三(3),一(1),二(2),四(4),R,i,18,7,10,15,(1)建立检验假设:,H,0,:对4种葡萄酒评判等级的总体分布相同;,H,1,:
18、对4种葡萄酒评判等级的总体分布不同或不全相同。,=0.05,(2)编秩并求秩和 先在每一区组内将数据从小到大编秩(见括弧内数字),如有相同数据,取平均秩次;再按处理组求各组秩和,R,i,,,i,=1,2,k,。,(3)计算检验统计量 按式(8.8)计算检验统计量,M,值:,(8.8),式中,b,为区组数,,k,为处理组数。本例,b,=5,,k,=4,代入公式(8.8):,(4)确定,P,值,作出结论,根据区组数,b,与处理组数,k,查附表13,区组设计多组比较的Friedman检验用,M,界值表,得到,P,值范围。本例,b,=5,,k,=4,查表得:,M,0.05,=7.80,,M,0.01,=9.96。,M,0.05,M,M,0.01,,0.01,P,0.05。按,=0.05水准,拒绝,H,0,,接受,H,1,,差异有统计学意义,故可认为四种酒的等级总的来说有差别。,秩和检验的主要优点:,适用范围广:可用于任意分布的资料,尤其适用于有序分类资料、分布明显偏态、分布不明、不规则或方差不齐的数值变量资料(等级资料最适用);,搜集资料方便。,秩和检验的主要缺点:,对适宜用参数方法的资料,若用秩和检验处理,因没有充分利用资料提供的信息,而降低效率。,






