1、第三章第三章 两样本位置检验两样本位置检验第一节 Brown-Mood中位数检验在单样本位置问题中,人们想要检验的是总体的中心是否等于一个已知的值但在实际问题中,更受注意的往往是比较两个总体的位置参数;比如。两种训练方法中哪一种更出成绩,两种汽油中哪一个污染更少,两种市场营销策略中哪种更有效,两种药物中哪种更有效传统上,人们假设总体是正态分布或近似的正态分布,然后利用两样本的T检验。但是关于总体是正态的假设并不一定合理。在小样本时,近似也不一定合适。本章的目标就是在对总体不作任何分布假设的前提下,解决两样本检验问题。两样本位置检验例3.1(数据:salary.txt,salary.sav)我国
2、两个地区一些(分别为17个和15个)城镇职工的工资(元):地区1:6864 7304 7477 7779 7895 8348 8461 9553 9919 10073 10270 11581 13472 13600 13962 15019 17244 地区2:10276 10533 10633 10837 11209 11393 11864 12040 12642 12675 13199 13683 14049 14061 16079 人们想要知道这二个地区城镇职工工资的中位数是否一样,这就是检验二个独立总体的位置参数是否相等的问题。Brown-Mood中位数检验检验原理:在零假设成立时,中位
3、数如果一样的话,它们共同的中位数,即这(15+17=)32个数的样本中位数(记为MXY)。也就是说,在X1,X2,X17或在Y1,Y2,Y15 的二个样本中,大于或小于混合后的中位数MXY的样本点应该大致一样多。容易算得MXY=11301,在用两个样本和MXY比较之后得到各个样本中大于和小于它的数目(见下表)假设(X1,X2,Xm)X,(Y1,Y2,Yn)Y,地区1样本数据所代表的总体中位数为 ,而地区2的为这里如果有和MXY相同的观测值,可以去掉它,也可以随机地把这些相等的值放到大于或小于MXY的群中以使得检验略微保守一些。就本例来说,二个样本的中位数不很相同,如何做正式的检验呢?可以看出上
4、表是一个22的列联表,由初等概率可知,对于一般的22列联表令A表示列联表中左上角取值a的X 样本中大于的变量,在m、n及t固定时,A的分布在零假设下为超几何分布(对于不超过m的k)现在可以用上面A的分布,直接进行前面所提的单边检验 。在给定m,n和t的时候,如果A的值a太大或太小时就应该怀疑零假设。下表列出了Brown-Mood中位数检验的基本内容。计算计算检验基本内容检验基本内容P-值 检验统计量 对于水平 ,如果p-值小于 ,那么拒绝零假设,否则不能拒绝。在mn时因A不对称,双边检验结果不那么理想。例题例题3.1的解法的解法 在例3.1中,a=6,b=10,m=17,n=15用备择假设 作
5、单边检验时,可以根据R软件超几何分布的语句phyper(6,17,15,16),即p值=P(Aa)等于phyper(a,m,n,a+b),得到p值为P(Aa)=P(A6)=0.07780674。根据这个p值,无法对常用的显著性水平0.05来拒绝零假设。对于二个方差差不多相等的正态总体,该检验相对于t检验的ARE为2/=0.637显然,它和单样本情况的符号检验同属一类这检验为一般列联表的Fisher精确检验在22表情况的特例。如果用C表示上面表中的矩阵 那么,可以用R软件的函数fisher.test(C,alt=less)得到和上面两样的p值。可以看出,前面22表中a较大等价于ma较小,b较大等价于nb较小,也就是说,根据形成22表时的对称性(即行列可互换,行间及列间可互换),用a,b,ma,nb的任何一个数目都可以根据超几何分布语句得到p值。检验的大样本近似检验的大样本近似 在零假设下,在大样本情况时,可以使用检验统计量所服从超几何分布的正态近似进行检验(包括连续性的修正):研究表明,该近似在min(m,n)12时相当精确。另外,在双边检验时,对于大样本情况,可以用Pearson卡方检验统计量来进行检验,它有近似的自由度为1的卡方分布。另外如果X和Y+有同样的分布,可求得置信区间为:其中c和c满足: