资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,Page,*,Department of Epidemiolgy&Biostatistics,主要内容,参数统计和非参数统计,秩次与秩和,配对设计样本比较的秩和检验,成组设计两样本比较的秩和检验,成组设计多样本比较的秩和检验,随机区组设计样本比较的秩和检验,多样本资料的两两比较,秩和检验的正确应用,1,一,非参数统计的概念,如果在一个统计问题中,总体分布形式已知,只是几个参数未知,推断目的是对未知参数进行估计和检验,这种统计方法称,参数统计(parametric statistics),。,2,如果事先对总体分布只有少量的信息,或者已知总体分布与检验的条件不相符时,采用的一种与总体分布形式无关的统计方法,称,非参数统计(nonparametric statistics),。,3,等级资料的特点,既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;,比“定量”粗,而比一般的“定性”细;,等级间既非等距,亦不能度量。,6,秩和检验是建立在秩(rank)及秩统计量基础上的非参数方法。,7,非参数检验方法,符号检验,秩和检验,游程检验,Ridit分析,中位数检验,等级相关,等等,8,威尔柯克逊(Wilcoxon)在,1945,年首先提出了比较两个总体分布函数的秩和检验法。,9,非参数检验的优点.缺点,优点是应用范围广、简便。,缺点是若对符合参数检验条件的资料用非参数检验,则检验效率降低,第二类错误的概率增大。,10,二.秩次与秩和,秩次(rank),秩统计量,是指全部观察值按某种顺序排列的位序;,秩和(rank sum),同组秩次之和,11,编秩,A组:,秩次 1 2 4.5 4.5 4.5 8.5,T,A,=25,B组:,秩次 4.5 8.5 8.5 8.5 11.5 11.5,T,B,=53,T,A,+,T,B,=,N,(,N,+1)/2=,78,12,秩次:在一定程度上反映了等级的高低;,秩和:在一定程度上反映了等级的分布位置。,对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验。,13,三配对设计差值的符号秩和检验(,Wilcoxon,符号秩和检验),配对符号秩和检验主要用于配对设计的计量资料的检验。,14,例 某医院试用新旧两种方法检测AST,新方法的检测时间有20分钟缩短为10分钟。现用两种方法分别检测10个血清样品,结果如下,问两法所得结果有无差别?,15,两种方法测定血清谷草转氨酶(mmol/sL),样品号,旧法,新法,1,40,60,2,132,142,3,212,210,4,80,82,5,38,25,6,212,243,7,230,237,8,95,100,9,236,200,10,38,43,16,此例与前面介绍的哪种统计方法类似?,是如何进行统计的?,应用条件?,17,(1)建立假设和确定,H,0,:两种方法所测得差值的总体中位数M,d,=0,H,1,:M,d,0,=0.05,18,(2)求差值,19,(3)编秩,-,-,20,编秩:依差数的绝对值大小由小到大编秩,再由差值的符号给秩加符号。编秩时如果差数为0,舍去不计;若差数相等,则取平均秩次。,21,(4),求秩和并确定检验统计量,求出T,+,T,-,T,+,=18.5 T,-,=36.5,22,(5)确定p值和作出统计推断,n,50,时 查附表9得n=10时,双侧p=0.10界值是1045,而T+=18.5在其中,p0.10,按双侧0.05水准,不拒绝,H,0,,差异无统计学意义,故尚不能认为两法测定血清中谷丙转氨酶含量有差别。,(注:差数有0时n相应减小),23,符号秩和检验,T,界值表,N=10,双侧 单侧,10 45 0.10 0.05,8 47 0.05 0.025,5 50 0.02 0.01,3 52 0.01 0.005,间距,35,39,45,49,10(10+1)/4=27.5(,理论值,),24,正态近似法(n50时),25,u,的校正,当重复的秩次较多时,,u,需要校正:,26,符号秩和检验的基本思想,总秩和为TN(N+1)/2,如,H,0,成立,则正负各半,即差值总体中位数为0,,T,+,与,T,均接近,N,(,N,+1)/4。,如果理论值和实际值相差太大,超出了事先规定的界值,则,H,0,不成立。,这里以较小值最为统计量T,故若实际值小于界值,则拒绝H,0,27,例2 用过硫酸铵分光光度法和示波极谱法测定水中锰的含量(mg/L),结果如下,问两法所得结果有无差别?,28,四.成组设计两样本比较的秩和检验,适用,于两组计量资料(尤其用于不符合t检验条件的两组计量资料)和两组等级资料,29,例:缺氧条件下猫和兔的生存时间,猫,兔,生存时间(min),秩次,生存时间(min),秩次,25,9.5,14,1,34,13,15,2,44,15,16,3,46,16,17,4,46,17,19,5,48,18,21,6.5,49,19,21,6.5,50,20,23,8,25,9.5,28,11,30,12,35,14,n,1,=8,T,1,=127.5,n,2,=12,T,2,=82.5,30,编秩:,假设:,H,0,:猫和兔在缺氧条件下生存时间总体分布相同;,H,1,:猫和兔在缺氧条件下生存时间总体分布不同;,=0.05。,求秩和并确定检验统计量:,T=127.5,31,猫组 兔组 和,实际秩和,127.5 82.5 210,理论秩和,n,1,(,N,+1)/2,n,2,(,N,+1)/2,N,(,N,+1)/2,84,126,210,差值,43.5 -43.5,0,抽样误差?,如果不拒绝,H,0,,则理论秩和与实际秩和之差纯粹由抽样误差造成。,32,基本思想,如果,H,0,成立,即两组分布位置相同,,则猫组的实际秩和应接近理论秩和n,1,(N+1)/2;,兔组的实际秩和应接近理论秩和n,2,(N+1)/2.,或相差不大。,如果相差较大,超出了预定的界值,则可认为H,0,不成立。,33,两样本秩和检验,T,界值,n,1,=8,n,2,-n,1,=4,双侧 单侧,62106 0.10 0.05,58 110 0.05 0.025,53 115 0.02 0.01,51 117 0.01 0.005,间距,44,52,62,66,8(20+1)/2=84(理论值),34,确定P值和做出推断结论:,本例,查附表10,得双侧p10或n,2,-n,1,10时,相同秩次多时校正,38,建立检验假设:,H,0,:两型支气管炎疗效总体分布相同;,H,1,:两型支气管炎疗效总体分布不同。,=0.05。,编秩,求秩和T。,确定检验统计量T 若两样本例数不等,以例数较少者为n,1,,检验统计量T=T,2,=11186。,确定P值,作出推断结论,39,40,P,0.05,按,=0.05水准,拒绝,H,0,,差异有统计学意义。可以认为该药治疗两种支气管炎的疗效有差别。,41,疗 效控制显效有效无效合计,单纯型 62 41 14 11 128,喘息型 20 37 16 15 88,合 计 82 78 30 26 216,构成比的比较:,2,=15.59,P,=0.001,42,构成比的比较与平均秩次的比较,group A group B,控制,100 0,显效,0 100,有效,0 100,无效,100 0,构成比比较:不同,平均秩比较:相同,43,五.成组设计多样本的秩和检验,Kruskal-Wallis法,适用,于等级资料及不宜用参数检验的计量资料的多组比较。,44,先对所有数据编秩;,计算,H,统计量;,查,H,界值表,或用近似,2,检验,,计算,P,值;,界定,P,值,作出结论。,45,【例8.5】某医生在研究再生障碍性贫血时,测得不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平(U/ml),问不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有无差别?,46,不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平,正常组,秩次,轻度组,秩次,重度组,秩次,(1),(2),(3),(4),(5),(6),42,1,448,9,562,11,51,2,555,10,631,15,98,3,585,12,653,16,141,4,620,13.5,712,17.5,141,5,712,17.5,762,21,318,6,753,19,843,22,382,7,758,20,849,24,408,8,845,23,896,25.5,620,13.5,896,25.5,901,27,R,i,49.5,149.5,179,n,i,9,9,9,47,H,0,:三组血清中可溶性CD8抗原水平总体分布相同;,H,1,:三组血清中可溶性CD8抗原水平总体分布不同或不全相同;,=0.05。,计算,H,统计量,48,查,H,界值表,本例,k,=3,,n,1,=n,2,=n,3,=9,查附表11,得,P,0.001。按,=0.05水准拒绝,H,0,,接受,H,1,,差异有统计学意义,可认为不同程度再生障碍性贫血患者血清中可溶性CD8抗原水平有差别。,49,三种复方制剂治疗慢性胃炎的疗效比较,疗效,例数,合计,秩次,范围,平均,秩次,秩和,复方,复方,复方,复方,复方,复方,(1),(2),(3),(4),(5),(6),(7)=,(1)(6),(8)=,(2)(6),(9)=,(3)(6),痊愈,42,5,6,53,153,27,1134,135,162,显效,186,17,20,223,54276,165,30690,2805,3300,有效,75,36,26,137,277413,345,25875,12420,8970,无效,50,42,31,123,414536,475,23750,19950,14725,合计,353,100,83,536,81449,35310,27157,50,H,0,:三种复方制剂治疗慢性胃炎的疗效总体分布相同;,H,1,:三种复方制剂治疗慢性胃炎的疗效总体分布不同或不全相同;,=0.05。,51,H,的校正与,2,近似,当有相同秩次时,,H,需校正:,当,n,较大时,,H,近似服从,=,k,1 的,2,分布。,故可按,2,分布获得概率,P,,作出统计推断。,52,53,下结论,查自由度为2的,2,界值表,P0.005,,拒绝H0。认为三药疗效有差别。,该结论只能说明总的来说三组间存在差别!,54,六.随机区组设计资料的秩和检验,Friedman检验,步骤,配伍组内编秩,计算M统计量,查M界值表,下结论,55,随机区组设计资料的秩和检验,24只小鼠按不同窝别分为8组,随机分配到三种不同饲料组,喂养一定时间后,测得小鼠肝中铁的含量(,g/g),问不同饲料对小鼠肝中铁的含量有无影响?,56,窝别,(配伍组),A,B,C,1,1.00(2),0.96(1),2.07(3),2,1.01(1),1.23(2),3.72(3),3,1.13(1),1.54(2),4.50(3),4,1.14(1),1.96(2),4.90(3),5,1.70(1),2.94(2),6.00(3),6,2.01(1),3.68(2),6.84(3),7,2.23(1),5.59(2),8.23(3),8,2.63(1),6.96(2),10.33(3),R,i,9,15,24,57,H,0,:三组小鼠肝脏铁的含量总体分布相同;,H,1,:三组小鼠肝脏铁的含量总体分布不同或不全相同;,=0.05。,58,根据配伍组数,b,与处理组数,k,查附表12,配伍组设计多组比较的Friedman检验用,M,界值表,得,P,值范围。,本例,b,=8,,k,=3,查表得:,M,0.05,=6.250,,M,0.01,=9.000,,P,0.01,按,=0.05水准拒绝,H,0,接受,H,1,差异有统计学意义,可认为三种不同饲料对小鼠肝脏中铁的含量有影响。,59,七.多样本资料的两两比较,成组设计和或随机区组设计资料,拒绝,H,0,后只说明总的来讲,几组之间存在差异,不能说明各组间的相互关系。,两两比较,对于成组设计的秩和检验:,扩展的t检验,对于区组设计的秩和检验:,q,检验,两两比较仅在拒绝了相应的H,0,后才有必要进行!,60,检验统计量,=N-k,61,八.参数检验的正确应用,主要对等级资料进行分析;,秩和检验可用于任意分布(distribution free)的资料;,62,秩和检验用于定量资料,计量资料中:,极度偏态资料,或个别数值偏离过大,各组离散度相差悬殊,资料中含有不确定值,大于5年,0.001,1:1024以上,兼有等级和定量性质的资料,63,用二种食物配方饲养大白鼠,观察心肌坏死面积。分析二组间的差异。,A组:(n=29,mean,3.61,),0,0,0,0,0,0,0,0,0,0,0.2,0.3,0.4,0.4,0.6,1,1.6,2.2,2.6,3.3,4.3,5.1,5.4,5.5,6.1,6.2,9.7,13.8,36,B组:(n=28,mean,1.06,),0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0.2,0.2,0.2,0.3,0.4,0.4,0.9,0.9,1.3,1.7,2.8,7.4,13,64,特点,0,特别多,无论用什么变换均不可能改变分布的偏性;,0,与其它数的区别是质的区别。,65,分析一:组心肌坏死率比较,按四格表作,2,检验:,无心肌坏死 有心肌坏死 合计 心肌坏死率(%),甲组 10 19 29 65.5,乙组 15 13 28 46.4,C,2,=1.404,P,=0.24,66,分析二:二组平均心肌坏死面积的比较,二组平均心肌坏死面积的,t,检验:,t,=1.7755,,P,=0.0814,67,分析三:按等级资料处理:,两组秩和检验:,n 秩和 理论秩和,A组 29 968 841,B组 28 685 812,合计 57 1653 1653,u=2.119,,P,=0.0341。,68,看看如何分析?,两组计量资料的比较,1.37,5.55,6.43,3.45,5.58,7.24,6.05,11.98,6.84,8.22,1.09,11.41,6.18,5.11,.61,8.64,5.55,5.65,8.71,12.48,69,分析方法一 两组秩和检验,两组秩和检验:,n 秩和 理论秩和,A组 10 83.5 105.0,B组 10 126.5 105.0,合计 20 210.0 210.0,u=1.63,,P,=0.1040。,70,分析方法二 两组t检验,是否可以用两组资料的t检验?,服从正态性和方差齐性的要求。,利用两个样本均数的t检验,71,分组 n 均数 标准误 标准差,第一组 10 4.84 0.88 2.79,第二组 10 7.97 1.00 3.15,差 值 -3.13 1.33,自由度 18,t=-2.36,P=0.0301,72,成组设计两样本比较,如资料满足,t,检验的条件,应该用,t,检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验功效降低;尤其样本含量较小时,降低更加明显。,如资料不满足,t,检验的条件,而用了,t,检验,同样降低了检验效能。,73,配对设计差值的符号秩和检验,输入数据,74,2选择菜单analyzeNonparametric Tests2 Related Samples,75,3将配对的2变量放入Test Pair List框中,76,4结果:,77,成组设计两样本比较的秩和检验,1输入数据,78,2.选择菜单analyzeNonparametric Tests2 Independent Samples,79,3填Test Variable ListGrouping Variable,单击Define Group。,80,4填上分组变量的2个水平1与2。,81,5结果:,82,83,疗 效控制显效有效无效合计,单纯型 62 41 14 11 128,喘息型 20 37 16 15 88,84,85,86,87,88,
展开阅读全文