1、第八章第八章 等级资料的分析等级资料的分析 Analysis of Ranked Data 曾平曾平流行病与流行病与卫生统计学教研室卫生统计学教研室 0516-1医学研究中的等级资料医学研究中的等级资料n疗疗 效:痊愈、显效、有效、无效、恶化效:痊愈、显效、有效、无效、恶化n化验结果:、化验结果:、+、+n体格发育:下等、中下、中等、中上、体格发育:下等、中下、中等、中上、上等上等n文化程度:小学、中学、大学、研究生文化程度:小学、中学、大学、研究生n多个分类之间具有程度或等级的差别多个分类之间具有程度或等级的差别,称为称为有序多分类资料有序多分类资料或或者半定量资料者半定量资料。2n秩次与秩
2、和秩次与秩和n两样本比较的秩和检验两样本比较的秩和检验n多组比较的秩和检验多组比较的秩和检验n配对符号秩和检验配对符号秩和检验n配伍设计的秩和检验配伍设计的秩和检验n多重比较多重比较n秩和检验的正确应用秩和检验的正确应用38.1 秩次与秩和秩次与秩和 n秩次秩次(rank),秩统计量秩统计量 是指全部观察值按某种顺序排列的位序。是指全部观察值按某种顺序排列的位序。n秩和秩和(rank sum):同组同组秩次之和。秩次之和。4例例8.1 12个人的尿蛋白检测结果个人的尿蛋白检测结果 A组:组:-、+、+、+、+B组:组:+、+、+、+、+、+A组:组:-+B组:组:+1 2 3 4 5 76 8
3、 9 10 11 12 1 2 4.5 4.5 4.5 8.54.5 8.5 8.5 8.5 11.5 11.55 秩和秩和n A组:组:、+、+、+、+秩和:秩和:1 2 4.5 4.5 4.5 8.5 TA25 n B组:组:+、+、+、+、+、+秩和:秩和:4.5 8.5 8.5 8.5 11.5 11.5 TB53 TA+TB=N(N+1)/2=78,用以判断编秩是否正确。,用以判断编秩是否正确。6n 秩变换秩变换(rank transformation):将等级将等级(或其他或其他数值变量数值变量)变成秩次的方法;变成秩次的方法;n秩次:在一定程度上反映了等级的高低;秩次:在一定程度
4、上反映了等级的高低;n秩和:在一定程度上反映了等级的分布位置;秩和:在一定程度上反映了等级的分布位置;n对等级的分析,转化为对秩次的分析。对等级的分析,转化为对秩次的分析。秩和检验秩和检验就是通过秩次的排列求出秩和就是通过秩次的排列求出秩和,进行假设检验。,进行假设检验。7 8.2 两样本比较的秩和检验两样本比较的秩和检验n两样本两样本Wilcoxon假设检验假设检验H0:A、B两组等级两组等级分布相同分布相同;H1:A、B两组等级分布不同。两组等级分布不同。=0.05。8基本思想基本思想n如果如果H0 成立,即两组分布位置相同,成立,即两组分布位置相同,则则A组的组的实际秩和应接近理论秩和实
5、际秩和应接近理论秩和n1(N+1)/2;n(B组的实际秩和应接近理论秩和组的实际秩和应接近理论秩和n2(N+1)/2)。或相差不大。或相差不大。n如果相差较大,超出了预定的界值,则可认为如果相差较大,超出了预定的界值,则可认为H0不成立。不成立。9 A组组 B组组 和和 n实际秩和实际秩和 25 53 78 n理论秩和理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2 39 39 78n差值差值 14 14 0 实质差别还是实质差别还是抽样误差?抽样误差?n如果如果H0成立,则理论秩和与实际秩和之差纯成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。粹由抽样误差造成。10 检验
6、结果检验结果n如果如果H0成立,则按成立,则按0.05水准,水准,查附表查附表11,A 组秩和之界值为组秩和之界值为2652。n现现A组组的的实实际际秩秩和和为为25,在在界界值值之之外外,故故拒拒绝绝H0,接接受受H1,认认为为两两组组的的分分布布位位置置不同。不同。11 秩和检验的结论判断秩和检验的结论判断nA组的实际秩组的实际秩在界值之外在界值之外,则拒绝,则拒绝H0,接受接受H1。(小于小于或等于或等于下界,大于下界,大于或等于或等于上界上界)nA组的实际秩组的实际秩在界值之内在界值之内,则不拒绝,则不拒绝H0。(大于下界且小于上界大于下界且小于上界)12某药对两种慢性支气管炎病人的疗
7、效比较某药对两种慢性支气管炎病人的疗效比较13检验步骤检验步骤(一一)nH0:两型老慢支疗效分布相同;两型老慢支疗效分布相同;nH1:两型老慢支两型老慢支疗疗效分布不同。效分布不同。n =0.05。n编秩编秩 14n求秩和求秩和 T1 、T2n确定检验统计量确定检验统计量T n110或或n2-n110时,正态近似法时,正态近似法 检验步骤检验步骤(三三)16正态近似法正态近似法tj 为相同秩次的个数为相同秩次的个数17P 20.005,2,P0.005;按按 =0.05水准拒绝水准拒绝H0,接受接受H1,认为认为三药疗效有差别。三药疗效有差别。需要进一步两两比较需要进一步两两比较。248.4
8、配对符号秩和检验配对符号秩和检验nWilcoxon符号秩和检验符号秩和检验n计算等级之差值,对差值计算等级之差值,对差值绝对值绝对值进行编秩,并进行编秩,并冠以差值的符号。冠以差值的符号。n查查 T 界值表,或用近似界值表,或用近似 u 检验,计算检验,计算 P 值;作值;作出结论。出结论。25符号秩和检验的假设符号秩和检验的假设H0:差值的差值的总体中位数为总体中位数为0;H1:差值的总体中位数不为差值的总体中位数不为0。=0.05。当当n50时时(n为不为为不为0的对子数的对子数),查界值表,查界值表(附表附表10);当当n50时,用时,用u近似近似26扁平足疗效例扁平足疗效例 用配对设计
9、观察两种方法治疗扁平足效果记录用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好。如下,问那种方法好。病例号病例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 A法法 好好 好好 好好 好好 差差 中中 好好 好好 中中 差差 好好 差差 好好 中中 好好 中中 B法法 差差 好好 差差 中中 中中 差差 中中 差差 中中 差差 好好 差差 中中 差差 中中 差差2728检验步骤检验步骤(一)n建立假设,确立检验水准建立假设,确立检验水准nH0:两法疗效差值的总体中位数为两法疗效差值的总体中位数为 0;nH1:差值的总体中位数不为差值的总体中位数不为
10、0。n =0.05 29n计算检验统计量计算检验统计量n编秩:编秩:n求秩和:求秩和:T=61.5,T=4.5 n确定检验统计确定检验统计量量T:T或或T作为统计量作为统计量 T 检验步骤检验步骤(二)30n界定界定P 值,下结论值,下结论n本例本例T=61.5,T=4.5,已超出附表已超出附表10中双侧中双侧P0.01相对应的界值相对应的界值561,故得,故得P 0.01。n按按 =0.05水准拒绝水准拒绝H0,接受接受H1,认为两种方法认为两种方法疗效的总体分布不同。结合资料可认为疗效的总体分布不同。结合资料可认为A法优法优于于B法。法。检验步骤检验步骤(三)31符号秩和检验的基本思想符号
11、秩和检验的基本思想n总秩和为总秩和为TN(N+1)/2n如如H0成立,则正负各半,成立,则正负各半,T+与与 T 均接近均接近 N(N+1)/4。n如果相差太大,超出了事先规定的界值,如果相差太大,超出了事先规定的界值,则则H0不成立。不成立。32u 的校正的校正n当重复的秩次较多时,当重复的秩次较多时,u 需要校正:需要校正:33配伍设计的秩和检验配伍设计的秩和检验n配伍设计配伍设计n使用范围:应用于不满足配伍设计方差使用范围:应用于不满足配伍设计方差分析的条件。分析的条件。n称为称为M检验或检验或Friedman秩和检验。秩和检验。34评委评委白兰地白兰地W白兰地白兰地X白兰地白兰地Y白兰
12、地白兰地ZA四四(4)二二(2)一一(1)三三(3)B四四(4)一一(1)二二(2)三三(3)C三三(3)一一(1)二二(2)四四(4)D四四(4)二二(2)三三(3)一一(1)E三三(3)一一(1)二二(2)四四(4)Ri1871015 五位评委对五位评委对4 4种葡萄酒作等级评定种葡萄酒作等级评定(一至四级一至四级)35n将每一配伍组数据由小到大编秩,相同值将每一配伍组数据由小到大编秩,相同值 取平均取平均;n分别求出各处理组的秩和分别求出各处理组的秩和;n将有关数据带入公式。将有关数据带入公式。确定确定P值值(p.289)b=5,k=4,查表查表13,;当;当b或或k超超出表的范围,出表
13、的范围,M 近似服从近似服从36当有相同秩次,且当有相同秩次,且M 按近似按近似 分布进行推断分布进行推断时需校正:时需校正:37两两比较(两两比较(q检验)检验)1、建立检验假设、建立检验假设 H0:对四种葡萄酒评判结果总体分布相同对四种葡萄酒评判结果总体分布相同 H1:对四种葡萄酒评判结果总体分布不同或不全同对四种葡萄酒评判结果总体分布不同或不全同2、计算统计量、计算统计量 将各处理组的秩和从大到小排列:将各处理组的秩和从大到小排列:18 15 10 7 组次组次 1 2 3 4 原组原组 W Z Y X3839 对四种酒评价结果的两两比较对四种酒评价结果的两两比较对比组对比组 组数组数
14、两秩和之差两秩和之差 P A与与B a1与与4 4 18-7 3.8105 P0.051与与2 2 18-15 1.0392 P0.052与与4 3 15-7 2.7713 P0.052与与3 2 15-10 1.7321 P0.053与与4 2 10-7 1.0392 P0.05403、确定、确定P值值 以以 查查 q 值表值表(P.342)4、统计推断统计推断 按按 =0.05水准,水准,41适用范围:适用范围:n等级资料;等级资料;n计量资料中:计量资料中:u资料中含有资料中含有不确定值不确定值u极度偏态资料,或个别数值偏离过大极度偏态资料,或个别数值偏离过大u各组离散度相差悬殊各组离散
15、度相差悬殊u分布未知分布未知u兼有等级和定量性质的资料兼有等级和定量性质的资料8.6 秩和检验的正确应用秩和检验的正确应用42秩和检验的优缺点秩和检验的优缺点n在在总体的分布类型已知的条件下,对总体的分布类型已知的条件下,对总体的参总体的参数数进行检验,称为进行检验,称为参数检验参数检验。n在总体的分布类型未知或者不考虑总体的分布在总体的分布类型未知或者不考虑总体的分布的条件下,对的条件下,对总体的分布总体的分布进行检验,称为进行检验,称为非参非参数检验数检验。n适用于任意分布类型的资料,不受总体分布适用于任意分布类型的资料,不受总体分布的制约。的制约。43n如如资资料料满满足足 t 检检验验的的条条件件,应应该该用用 t 检检验验进进行行分分析析。此此时时,如如果果对对这这类类资资料料用用Wilcoxon秩秩和和检检验验检检验验功功效效降降低低;尤尤其其样样本本含含量量较较小小时,降低更加明显。时,降低更加明显。n如资料不满足如资料不满足 t 检验的条件,而用了检验的条件,而用了t 检验,检验,同样降低了检验效能。同样降低了检验效能。4445