资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,*,第,12,章 非参数检验,说明:非参数检验这章,请看下面吴喜之教授的讲义,更为具体的可参看,统计分析与,SPSS,的应用,薛薇 编著 人大出版社,,2002.7,第二次印刷,非参数检验的概念,是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。,这类方法的假定前提比参数性假设检验方法少的多,也容易满足,适用于计量信息较弱的资料且计算方法也简单易行,所以在实际中有广泛的应用。,非参数检验的过程,1.,Chi-Square test,卡方检验,2.Binomial test,二项分布检验,3.Runs test,游程检验,4.1-Sample,Kolmogorov,-Smirnov test,一个样本柯尔莫哥洛夫,-,斯米诺夫检验,5.,2,independent Samples Test,两个独立样本检验,6.K independent Samples Test K,个独立样本检验,7.2 related Samples Test,两个相关样本检验,8.K related Samples Test,两个相关样本检验,12.1,卡方检验,Chi-Square test,这里介绍的卡方检验可以检验列联表中某一个变量的各个水平是否有同样比例或者等于你所想象的比例,(,如,5:,4:1),实例,1,:掷骰子,300,次,变量,LMT,,,1,、,2,、,3,、,4,、,5,、,6,分别代表六面的六个点,试问这骰子是否均匀。数据,data12-01,(,300,个,cases,)。,Analyze,Nonparametric Tests,Chi Square,Test Variable:,lmt,想要检验的变量,由于这是一个均匀分布检测,使用默认选择(,Expected Values,:,All categories equal,作为零假设);,比较有用的结果:,sig,=.1110.5,,,不能拒绝零假设,认为均匀。,实例,1,的数据可以组织成:两个变量(,side,面和,number,次数),,6,个,cases,。,但在卡方检验前要求用,number,加权。结果同。,补充:,卡方检验实例,实例:心脏病人猝死人数与日期的关系,收集,168,个观测数据。其中用,1,、,2,、,3,、,4,、,5,、,6,、,7,表示是星期几死的。而人数分别为,55,、,23,、,18,、,11,、,26,、,20,、,15,。推断心脏病人猝死人数与日期的关系是否为,2.8:1:1:1:1:1:1,。(变量,2,个:死亡日期和死亡人数,,Cases,7,个,),加权:,Data,Weight Cases,:,死亡人数,Analyze,Nonparametric Tests,Chi Square,Test Variable:,死亡日期,Expected Values,:,2.8:1:1:1:1:1:1,比较有用的结果:,sig,=.2560.5,,,不能拒绝零假设,认为心脏病人猝死人数与日期的关系为,2.8:1:1:1:1:1:1,。,12.,2,二项分布检验,Binomial test,二项分布:在现实生活中有很多的取值是,两类,的,如人群的男和女、产品的合格和不合格、学生的三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是,P,,,则另一类出现的概率就是,1-,P,。,这种分布称为二项分布。,实例,1,:掷一枚比赛用的挑边器,31,次,变量,tbh,,,1,为出现,A,面、,2,为出现,A,面,试问这挑边器是否均匀。数据,data12-03,(,31,个,cases,)。,Analyze,Nonparametric Tests,Binomial,Test Variable:,tbh,由于这是一个均匀分布检测,使用默认选择(,Test Proportion,:,0.5,);,比较有用的结果:两组个数和,sig,=1.000.5,,,不能拒绝零假设,认为挑边器是均匀。,实例,1,的数据可以组织成:两个变量(,side,面和,number,次数),,2,个,cases,。,但在二项分布检验前要求用,number,加权。结果同。,补充:二项分布检验实例,实例:为验证某批产品的一等品率是否达到,90,,现从该批产品中随机抽取,23,个样品进行检测,结果有,19,个一等品(,1,一等品,,0,非一等品)。(变量,2,个:一等品和个数,,Cases 2,个:,1 19,和,0 4,),加权:,Data,Weight Cases,:,个数,Analyze,Nonparametric Tests,Binomial,Test Variable:,一等品,Test Proportion,:,0.9,比较有用的结果:两组个数和,sig,=.1930.5,,,不能拒绝零假设,认为该批产品的一等品率达到了,90,。,12.3,游程检验,Runs test,单样本变量随机性检验是对某变量值,出现是否随机,进行检验。,实例,1,(同二项分布检验),:掷一枚比赛用的挑边器,31,次,变量,tbh,,,1,为出现,A,面、,2,为出现,A,面,试问这挑边器出现,AB,面是否随机。数据,data12-03,(,31,个,cases,)。,Analyze,Nonparametric Tests,Runs,Test Variable:,tbh,Cut Point,:,Custom,:,2,比较有用的结果:,总,case,数(,31,)、,游程,Run,数(,21,)、,sig,=.1420.5,,,不能拒绝零假设,,认为挑边器出现,AB,面是随机的。,12.,4,一个样本柯尔莫哥洛夫,-,斯米诺夫检验,1-,Sample,Kolmogorov,-Smirnov test,单样本,K,S,检验是利用样本数据推断总体是否服从某一理论分布,适用于探索连续型随机变量的分布形态(,判断定距变量的分布情况,):,Normal,正态分布、,Uniform,均匀分布、,Poisson,泊松分布、,Exponential,指数分布。,实例,:卢瑟福和盖革作了一个著名的实验,他们观察了长为,7.5,秒的时间间隔里到达某个计数器的由某块放射物资放出的,alfa,粒子质点数,共观察了,2608,次。数据,data12-05,(,1,个变量,zd,,,2608,个,cases,,,按,0,10,排序)。试问这种分布规律是否服从泊松分布,Analyze,Nonparametric Tests,1-,Sample K-S,Test Variable:,zd,Test Distribution,:,Poisson,比较有用的结果:,均值(,3.8673,)、,sig,=.8500.5,,,不能拒绝零假设,,认为服从泊松分布,。,12.5,两个独立样本检验,2,independent Samples Test,通过分析两个样本数据,推断它们的分布是否存在显著性差异。方法有四种:,Mann-Whitney U:,是通过对平均秩的研究来实现推断的,K,S Z,:,是通过对分布的研究来实现推断的,Moses extreme reactions,:,一个作为控制样本,另一个作为实验样本,Wald Wolfwitz,Runs:,是通过对游程的研究来实现推断的,实例,:甲乙两种安眠药服用后的效果。数据,data12-06,(,2,个变量:组别,zb,和延长时间,ycss,,,20,个,cases,)。试问这两种药物的疗效是否有显著性差异。,Analyze,Nonparametric Tests,2,independent Samples,Test Variable:,ycss,Grouping,:,zb,(,1,,,2,),Test type,:,四种均选,比较有用的结果:比较四个,sig,值,有三个,sig,.5,,,不能拒绝零假设认为疗效无显著性差异,。,12.6,多个独立样本检验,K independent Samples Test,通过分析多个样本数据,推断它们的分布是否存在显著性差异。方法有三种:,Median,:,是通过对中位数的研究来实现推断的,K,W,:,是通过对推广的平均秩的研究来实现推断的,J,T,:,与两个独立样本检验的,Mann-Whitney U,类似,实例,:某车间用四种不同的操作方法检测产品优等品率的实验数据。数据,data12-07,(,2,个变量:方法,ff,和优等品率,ydpl,,,21,个,cases,)。试问这四种不同的操作方法对产品优等品率是否有显著性差异。,Analyze,Nonparametric Tests,K independent Samples,Test Variable:,ydpl,Grouping,:,ff,(,1,,,4,),Test type,:,三种均选,比较有用的结果:比较三个,sig,值,,K-W,方法的,sig,.009.5,,,但不用,原因是观测量太少。,12.7,两个相关样本检验,2,related Samples Test,同一个被测试者,前后测两次,彼此相关。方法有四种。,实例,:某校,15,名男生的长跑锻炼后晨脉变化数据。数据,data12-08,(,2,个变量:锻炼前,dlq,和锻炼后,dlh,优,,21,个,cases,)。试问锻炼前后的晨脉有无显著性差异。,Analyze,Nonparametric Tests,2,related Samples,Test Pairs:,dlq,dlh,Test type,:,选一种或多种,比较有用的结果:看,sig,值,,sig,Nonparametric Tests,k related Samples,Test Variables:a b c,Test type,:,选一种或多种,比较有用的结果:看,sig,值,,sig,.05,,,不能拒绝正态分布,(Normal),零假设。,由于,sig,=.000.05,,,不能拒绝指数分布,(,Exponential),零假设,比较三种分布检验,认为是该数据服从指数分布,SPSS,软件使用说明,使用我们的,ksdata,.,sav,数据。,选项为,Analyze,Nonparametric Tests,1 Sample K-S,。,然后把变量(这里是,x,),选入,Variable List,。,再在下面,Test Distribution,选中零假设的分布(,Normal,、,Poisson,、,Uniform,和,Exponential,),作为零假设。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可。,关于随机性的游程检验(,run test,),游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由,0,和,1,组成的一个这种变量的样本(数据,run1.sav,):,0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0,其中相同的,0,(或相同的,1,)在一起称为一个游程(单独的,0,或,1,也算)。,这个数据中有,4,个,0,组成的游程和,3,个,1,组成的游程。一共是,R,=7,个游程。其中,0,的个数为,m,=15,,而,1,的个数为,n,=10,。,关于随机性的游程检验(,run test,),出现,0,和,1,的的这样一个过程可以看成是参数为某未知,p,的,Bernoulli,试验。但在给定了,m,和,n,之后,在,0,和,1,的出现是随机的零假设之下,,R,的条件分布就和这个参数无关了。根据初等概率论,,R,的分布可以写成(令,N=m+n,),关于随机性的游程检验(,run test,),于是就可以算出在零假设下有关,R,的概率,以及进行有关的检验了。利用上面公式可进行精确检验;也可以利用大样本的渐近分布和利用,Monte Carlo,方法进行检验。利用上面数据的结果是,:,关于随机性的游程检验(,run test,),当然,游程检验并不仅仅用于只取两个值的变量,它还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于,0,和,1,的个数)是否随机的问题。看下面例子。,例,(run2.sav):,从某装瓶机出来的,30,盒化妆品的重量如下(单位克),71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9,为了看该装瓶机是否工作正常,首先需要验证是否大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。,关于随机性的游程检验(,run test,),如果把小于中位数的记为,0,,否则记为,1,,上面数据变成下面的,0,1,序列,1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0,这就归为上面的问题。当然这里进行这种变换只是为了易于理解。实际计算时,用不着这种变换,计算机会自动处理这个问题的。,直接利用这个数据,通过,SPSS,,,得到下面游程检验结果的输出。,SPSS,软件使用说明,用,run2.sav,数据。,选项为,Analyze,Nonparametric Tests,Runs,。,然后把变量(这里是,length,),选入,Variable List,。,再在下面,Cut Point,选中位数(,Median,)。,当然,也可以选其他值,如均值(,Mean,),,众数(,Mode,),或任何你愿意的数目(放在,Custom,)。,注意在对前面的由,0,和,1,组成的序列(,run1.sav,进行随机性检验时,,要选均值,(,为什么?),。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可。,Wilcoxon,(Mann-Whitney),秩和检验,这里介绍常用的,Wilcoxon,(,或称,Mann-Whitney),秩和检验。它的原理很简单,,假定第一个样本有,m,个观测值,第二个有,n,个观测值。把两个样本混合之后把这,m,+,n,个观测值升幂排序,,记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为,W,X,而第二个样本秩的和为,W,Y,。,这两个值可以互相推算,称为,Wilcoxon,统计量。,该统计量的分布和两个总体分布无关。由此分布可以得到,p,-,值。,直观上看,如果,W,X,与,W,Y,之中有一个显著地大,则可以选择拒绝零假设。,该检验需要的唯一假定就是两个总体的分布有类似的形状(不一定对称)。,Wilcoxon,(Mann-Whitney),秩和检验,下面数据(,GDP.,sav,),是地区,1,的十个城市和地区,2,的,15,个城市的人均,GDP,(,元)。现在要想以此作为两个样本来检验两个地区的人均,GDP,的中位数,m,1,和,m,2,是否一样,即双尾检验,H,0,:m,1,=m,2,对,H,a,:m,1,m,2,。,由于地区,2,的人均,GDP,的中位数大于地区,1,的中位数,因此也可以做单尾检验,H,0,:m,1,=m,2,对,H,a,:m,1,m,2,。,地区,1,:,3223452638362781598232164710562823034618,地区,2,:,539139834076594147484600632545345526569970085403667855375257,由,SPSS,的输出可以得到下面结果:,Wilcoxon,(Mann-Whitney),秩和检验,该结果头两行,显示了,Mann-Whitney,和,Wilcoxon,统计量的值。另外和我们需要结果的相关部分为:对于双尾检验,H,0,:m,1,=m,2,对,H,a,:m,1,m,2,,,p,-,值为,0.016,(见“,Exact Sig.(2-tailed)”,),;,而对于单尾检验,H,0,:m,1,=m,2,对,H,a,:m,1,m,2,(,见“,Exact Sig.(1-tailed)”,),,,p,-,值为,0.008,。这两个结果是精确计算的。通常在样本量大的时候利用近似方法得到渐近分布的,p,-,值(见“,Asymp,.Sig.(2-tailed)”,),,它只给了双尾检验的近似,p,-,值,0.017,,和精确值差别不大。注意单尾检验的,p,-,值是双尾检验的,p,-,值的一半。这个例子的结果表明,可以拒绝原假设,即有理由认为地区,2,的人均,GDP,的中位数要高一些。,SPSS,软件使用说明,使用,GDP.,sav,数据。,选项为,Analyze,Nonparametric Tests,2 Independent Samples,。,把变量(,gdp,),选入,Test Variable,List,;,再把用,1,和,2,分类的变量,area,输入进,Grouping Variable,,在,Define Groups,输入,1,和,2,。,在,Test Type,选中,Mann,Whitney,。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,两样本分布的,Kolmogorov,-Smirnov,检验,假定有分别来自两个独立总体的两个样本。要想检验它们背后的总体分布相同的零假设,可以进行两独立样本的,Kolmogorov,-Smirnov,检验。原理完全和单样本情况一样。只不过把检验统计量中零假设的分布换成另一个样本的经验分布即可。假定两个样本的样本量分别为,n,1,和,n,2,,用,S,1,(X),和,S,2,(X),分别表示两个样本的累积经验分布函数。再记,D,j,S,1,(X,j,)-S,2,(,X,j,),。,近似正态分布的检验统计量为,计算结果,twonp,.,sav,:,两种破坏性试验的持续时间。根据这个数据,,n,1,=30,,,n,2,=25,。由,SPSS,输出,得到,SPSS,软件使用说明,使用,twonp,.,sav,数据。,选项为,Analyze,Nonparametric Tests,2 Independent Samples,。,把变量(,duration,),选入,Test Variable List,;,再把用,1,和,2,分类的变量,type,输入到,Grouping Variable,,在,Define Groups,输入,1,和,2,。,在,Test Type,选中,Kolmogorov,-Smirnov Z,。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,两样本,Wald,-,Wolfowitz,游程检验,Wald,-,Wolfowitz,游程检验(,Wald,-,Wolfowitz,runs test,)和,Kolmogorov,-Smirnov,检验都是看两个样本所代表的总体是否分布类似。但是所采取的方法不一样。,Wald,-,Wolfowitz,游程检验把两个样本混合之后,按照大小次序排列,一个样本的观测值在一起的为一个游程。和单样本的游程问题类似。可以由游程个数,R,看出两个样本在排序中是否随机出现。由,twonp,.,sav,数据,可以得到下面,SPSS,关于,Wald,-,Wolfowitz,游程检验的输出:,软件使用:数据和前面一样,只,在,Test Type,选,Wald,-,Wolfowitz,runs,。,Kruskal,-Wallis,关于多个样本的秩和检验,这个检验的目的是看多个总体的位置参数是否一样。,方法和,Wilcoxon,-Mann-Whitney,检验的思想类似。,假定有,k,个总体。先把从这个,k,个总体来的样本混合起来排序,记各个总体观测值的秩之和为,R,i,,,i,=1,k,。,显然如果这些,R,i,很不相同,就可以认为它们位置参数相同的零假设不妥(备选假设为各个位置参数不全相等)。,Kruskal,-Wallis,关于多个样本的秩和检验,注意这里所说的位置参数是在下面意义上的,q,i,;,由于它在分布函数,F,i,(x),中可以和变元,x,相加成为,F,(x+,q,i,),的样子,所以称,q,i,为位置参数。,形式上,假定这些样本有连续分布,F,1,F,k,,,零假设为,H,0,:,F,1,=,F,k,,,备选假设为,H,a,:,F,i,(x)=,F,(x+,q,i,),,,i,=1,k,,,这里,F,为某连续分布函数,而且这些参数,q,i,并不相等。,Kruskal,-Wallis,检验统计量为,Kruskal,-Wallis,关于多个样本的秩和检验,公式中,n,i,为第,i,个样本量,而,N,为各个样本量之和(总样本量)。,如果观测值中有大小一样的数值,这个公式会有稍微的变化。,这个统计量在位置参数相同的零假设下有渐近的自由度为,k-1,的,c,2,分布。,Kruskal,-Wallis,检验仅仅要求各个总体变量有相似形状的连续分布。,数据,house.,sav,:三,个区域房价的数据,为了调查三个地区的房价是否类似,在每个地区抽样,得到三个样本量分别为,20,、,30,、,25,的房价样本。利用,SPSS,软件,很容易得到下面的检验结果:,SPSS,软件使用说明,使用,house.,sav,数据。,选项为,Analyze,Nonparametric Tests,K Independent Samples,。,把变量(这里是,price,),选入,Test Variable,List,;,再把数据中用,1,、,2,、,3,来分类的变量,group,输入,Grouping Variable,,在,Define Groups,输入,1,、,2,、,3,。,在下面,Test Type,选中,Kruskal,-Wallis H,。,点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,Jonckheere,-,Terpstra,多样本的秩检验,这个检验处理的问题和,Kruskal,-Wallis,检验类似,零假设都是各个总体的位置参数相同,但这里的备选假设为各个总体的位置参数按升幂排列(如为降幂排列,可把总体编号颠倒顺序即为升幂排列)。,注意这里所说的位置参数和前面的,Kruskal,-Wallis,检验中的位置参数意义一样。,Jonckheere,-,Terpstra,检验先在每两个样本所有观测值对之间比较,计算第,i,个样本观测值中小于第,j,个样本观测值的对子数:,数据,house.,sav,:三,个区域房价的数据,很容易得到,SPSS,的,Jonckheere,-,Terpstra,检验结果输出:,SPSS,软件使用说明,使用,house.,sav,数据。,选项为,Analyze,Nonparametric Tests,K Independent Samples,。,把变量(这里是,price,),选入,Test Variable List,;,再把数据中用,1,、,2,、,3,来分类的变量,group,输入,Grouping Variable,,在,Define Groups,输入,1,、,2,、,3,。,在下面,Test Type,选中,Jonckheere,-,Terpstra,。,在点,Exact,时打开的对话框中可以选择精确,方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,Brown-Mood,中位数检验,在有数个独立样本的情况,希望知道它们的中位数是否相等。,零假设是,这些样本所代表的总体的中位数相等。,备选假设,是这些中位数不全相等。,假定有,k,个总体,,n,i,为第,i,个样本量;把所有样本量之和记为,N,。,先把从这个,k,个总体来的样本混合起来排序,找出它们的中位数。再计算每个总体中小于该中位数的观测值个数,O,1i,,,i,=1,k,,,和每个总体中大于该中位数的观测值个数,O,2i,,,i,=1,k,。,这样就形成了一个由元素,O,ij,组成的,2,k,表。其列总和为,n,i,,,i,=1,k,;,而两个行总和为各样本小于总中位数的观测值总和:,R,1,O,11,+,O,12,+,O,1k,及各样本大于总中位数的观测值总和,R,2,O,21,+,O,22,+,O,2k,。,这显然是一个列联表,可以用,Pearson,c,2,统计量,即,house.,sav,数据,这里,SPSS,软件使用说明,使用,house.,sav,数据。,选项为,Analyze,Nonparametric Tests,K Independent Samples,。,把变量(这里是,price,),选入,Test Variable List,;,再把数据中用,1,、,2,、,3,来分类的变量,group,输入,Grouping Variable,,在,Define Groups,输入,1,、,2,、,3,。,在下面,Test Type,选中,Median,。,在点,Exact,时打开的对话框中可以选择精确,方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,Friedman,秩和检验,前面讨论了两因子试验设计数据的方差分析,那里所用的,F,检验需要假定总体的分布为正态分布。,有一种非参数方差分析方法,称为,Friedman,(,两因子)秩和检验,或,Friedman,方差分析。它适用于两个因子的各种水平的组合都有一个观测值的情况。,Friedman,秩和检验,假定第一个因子有,k,个水平(称为处理,,treatment,),,第二个因子有,b,个水平(称为区组);因此一共有,k,b,kb,个观测值。,这里之所以称一个因子为处理,是因为这是我们想要看该因子各水平是否对试验结果有显著的不同(它的各个水平的观测值也就是本小节的多个相关样本)。而另一个因子称为区组,不同的区组也可能对结果有影响。下面是一个例子。,数据,fert,.,sav,这里有三种肥料作为第一个因子(肥料因子)的三个水平;而四种土壤为第二个因子(土壤因子)的四个水平。感兴趣于是否这三种肥料对于某作物的产量有区别。称肥料因子为处理,而土壤因子为区组。数据在下表中(表中数字为相应组合的产量,单位公斤)。,肥料种类,肥料,A,肥料,B,肥料,C,土壤类型,土壤,1,22,46,68,土壤,2,25,36,48,土壤,3,18,21,20,土壤,4,11,13,19,Friedman,秩和检验,Friedman,秩和检验是关于位置的,和,Kruskal,-Wallis,检验类似,形式上,假定这些样本有连续分布,F,1,F,k,,,零假设为,H,0,:,F,1,=,F,k,,,备选假设为,H,a,:,F,i,(x)=,F,(x+,q,i,),,,i,=1,k,,,这里,F,为某连续分布函数,而且这些参数,q,i,并不相等。,虽然这和以前的,Kruskal,-Wallis,检验一样,但是由于区组的影响,要首先在每一个区组中计算各个处理的秩;再把每一个处理在各区组中的秩相加,.,如果,R,ij,表示在,j,个区组中第,i,个处理的秩。则秩按照处理而求得的和为,Friedman,秩和检验,这样做的目的是在每个区组内比较处理。例如,同个年龄段中比较药品的疗效比不分年龄来比较疗效要合理;在同一个部位比较不同的材料要比混合起来比较要合理等等。这里要引进的,Friedman,统计量定义为,第一个式子表明,如果各个处理很不一样,和的平方就会很大,结果就显著。第二个公式是为了计算方便而导出的。它有近似的(有,k,-1,个自由度的),c,2,分布。,fert,.,sav,数据,SPSS,软件使用说明,使用,fert,.,sav,数据。,选项为,Analyze,Nonparametric Tests,K Related Samples,。,然后把变量(这里是,a,、,b,、,c,),选入,Test Variable List,。,在下面,Test Type,选中,Friedman,。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,Kendall,协同系数检验,在实践中,常需要按照某些特别的性质来多次对一些个体进行评估或排序;比如几个(,m,个)评估机构对一些(,n,个)学校进行排序。人们想要知道,这些机构的不同结果是否一致。如果很不一致,则该评估多少有些随机,意义不大。,换句话说,这里想要检验的,零假设,是:这些对于不同学校的排序是不相关的或者是随机的;而,备选假设,为:这些对不同学校的排序是正相关的或者是多少一致的。,Kendall,协同系数检验,一个机构对诸个体(学校)的秩(次序)的和为,1+2+,n,=,n,(,n,+1)/2,;,所有,m,个机构对所有个体评估的总秩为,mn,(,n,+1)/2,;,这样对每个个体的平均秩为,m,(,n,+1)/2,。,如果记每一个个体的,m,个秩(次序)的和为,R,i,(,i=1,n,),,那么,如果评估是随机的,这些,R,i,与平均秩的差别不会很大,反之差别会很大,也就是说下面的,个体的总秩与平均秩的偏差的平方和,S,很大。,S,定义为,Kendall,协同系数检验,这个和,Kendall,协同系数(,Kendalls Coefficient of Concordance,),是成比例的,,Kendall,协同系数,W,(,Kendalls W,),定义为,数据,school.,sav,下面是,4,个独立的环境研究单位对,15,个学校排序的结果每一行为一个评估机构对这些学校的排序。看上去不那么一致(也有完全一致的,):,数据,school.,sav,SPSS,的,Kendall,协同系数检验的输出,SPSS,软件使用说明,使用,school.,sav,数据。,选项为,Analyze,Nonparametric Tests,K Related Samples,。,然后把变量(这里是,s1,、,s2,、,、,s15,),选入,Test Variable List,。,在下面,Test Type,选中,Kendalls W,。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,关于二元响应的,Cochran,检验,前面讨论了两因子方差分析问题的,Friedman,秩和检验。,但是当观测值只取诸如,0,或,1,两个可能值时,由于有太多同样的数目(只有,0,和,1,),排序的意义就很成问题了。,这里要引进的,Cochran,检验就是用来解决这个问题的一个非参数检验。这里的零假设也是各个处理是相同的。先看一个例子,关于瓶装饮用水的调查(数据在,water.,sav,)。,20,名顾客对,4,种瓶装饮用水进行了认可(记为,1,)和不认可(记为,0,)的表态。,我们感兴趣的是这几种瓶装水在顾客眼中是否有区别。这里的零假设是这些瓶装水(作为处理)在(作为区组的)顾客眼中没有区别。,数据,water.,sav,下表是数据,每一行为,20,个顾客对某一饮料的,20,个观点(,0,或,1,)。最后一列,1,为认可总数,N,i,而最后一行为每个顾客给出的,4,个观点中认可数的总和,L,i,。,最后一行的最后的元素为总认可数,N,。,显然,如果,N,i,和这些,N,i,的均值的差距很大,那么这些处理就很不一样了。,Cochran,检验就是基于这个思想的。用,N,i,表示第,i,个处理所得到的“,1”,的个数,而,L,j,为第,j,个区组(例子中的顾客)所给的“,1”,的个数,“,1”,的总数记为,N,。,关于二元响应的,Cochran,检验,Cochran,检验统计量(,Cochrans Q,),为(假定有,k,个处理和,b,个区组),当,k,固定时,,Q,在,b,很大时有近似的自由度为,k,-1,的,c,2,分布。,数据,water.,sav,Cochran,检验的,SPSS,输出:,SPSS,软件使用说明,使用,water.,sav,数据。,选项为,Analyze,Nonparametric Tests,K Related Samples,。,然后把变量(这里是,c1,、,s2,、,c3,、,c4,),选入,Test Variable List,。,在下面,Test Type,选中,Cochrans Q,。,在点,Exact,时打开的对话框中可以选择精确方法(,Exact,),,Monte Carlo,抽样方法(,Monte Carlo,),或用于大样本的渐近方法(,Asymptotic only,)。,最后,OK,即可,
展开阅读全文