资源描述
添加标题,第三章 两样本位置检验,第一节,Brown-Mood,中位数检验,在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽油中哪一个污染更少,两种市场营销策略中哪种更有效,,两种药物中哪种更有效,传统上,人们假设总体是正态分布或近似的正态分布,然后利用两样本的,T,检验。但是关于总体是正态的假设并不一定合理。在小样本时,近似也不一定合适。本章的目标就是在对总体不作任何分布假设的前提下,解决两样本检验问题。,两样本位置检验,例,3.1(,数据:,salary.txt,salary.sav),我国两个地区一些,(,分别为,17,个和,15,个,),城镇职工的工资,(,元,),:,地区,1,:,6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244,地区,2,:,10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079,人们想要知道这二个地区城镇职工工资的中位数是否一样,这就是检验二个独立总体的位置参数是否相等的问题。,Brown-Mood,中位数检验,检验原理:在零假设成立时,中位数如果一样的话,它们共同的中位数,即这,(15+17=)32,个数的样本中位数,(,记为,M,XY,),。也就是说,在,X,1,X,2,X,17,或在,Y,1,Y,2,Y,15,的二个样本中,大于或小于混合后的中位数,M,XY,的样本点应该大致一样多。容易算得,M,XY,=11301,,在用两个样本和,M,XY,比较之后得到各个样本中大于和小于它的数目,(,见下表,),假设(,X,1,X,2,X,m,),X,,,(,Y,1,Y,2,Y,n,),Y,,地区,1,样本数据所代表的总体中位数为 ,而地区,2,的为,这里如果有和,M,XY,相同的观测值,可以去掉它,,也可以随机地把这些相等的值放到大于或小于,M,XY,的群中以使得检验略微保守一些。,就本例来说,二个样本的中位数不很相同,如何,做正式的检验呢?可以看出上表是一个,22,的列,联表,由初等概率可知,对于一般的,22,列联表,令,A,表示列联表中左上角取值,a,的,X,样本中大于,的变量,在,m,、,n,及,t,固定时,,A,的分布在零假设下为超几何分布,(,对于不超过,m,的,k),现在可以用上面,A,的分布,直接进行前面所提的单边检验 。在给定,m,n,和,t,的时候,如果,A,的值,a,太大或太小时就应该怀疑零假设。下表列出了,Brown-Mood,中位数检验的基本内容。,计算,检验基本内容,P-,值,检验统计量,对于水平 ,如果,p,-,值小于 ,那么拒绝零假设,,否则不能拒绝。,在,mn,时因,A,不对称,双边检验结果不那么理想。,例题,3.1,的解法,在例,3.1,中,,a=,6,,,b,=10,,,m,=17,,,n,=15,用备择假设 作单,边检验时,可以根据,R,软件超几何分布的语句,phyper(6,17,15,16),,,即,p,值,=,P,(,A,a,),等于,phyper(a,m,n,a+b),,得到,p,值为,P,(,A,a,)=,P,(,A,6)=,0.07780674,。根据这个,p,值,无法对常用的显著性水平,0.05,来拒绝零,假设。对于二个方差差不多相等的正态总体,该检验相对于,t,检验的,ARE,为,2/=0.637,显然,它和单样本情况的符号检验同属一类这检,验为一般列联表的,Fisher,精确检验在,22,表情况的特例。如果用,C,表,示上面表中的矩阵,那么,可以用,R,软件的函数,fisher.test(,C,alt=less),得到和,上面两样的,p,值。,可以看出,前面,22,表中,a,较大等价于,m,a,较,小,,b,较大等价于,n,b,较小,也就是说,根据形成,22,表,时的对称性,(,即行列可互换,行间及列间可互换,),,用,a,b,m,a,n,b,的任何一个数目都可以根据超几何分布语句,得到,p,值。,检验的大样本近似,在零假设下,在大样本情况时,可以使用检验统计量所服从超几何分布的正态近似进行检验,(,包括连续性的修正,),:,研究表明,该近似在,min(m,n)12,时相当精确。,另外,在双边检验时,对于大样本情况,可以用,Pearson,卡方检验统计量,来进行检验,它有近似的自由度为,1,的卡方分布。,另外如果,X,和,Y,+,有同样的分布,可求得,置信区间为,:,其中,c,和,c,满足:,
展开阅读全文