收藏 分销(赏)

--Wilcoxon符号秩检验.ppt

上传人:快乐****生活 文档编号:1882836 上传时间:2024-05-11 格式:PPT 页数:33 大小:126.50KB
下载 相关 举报
--Wilcoxon符号秩检验.ppt_第1页
第1页 / 共33页
--Wilcoxon符号秩检验.ppt_第2页
第2页 / 共33页
--Wilcoxon符号秩检验.ppt_第3页
第3页 / 共33页
--Wilcoxon符号秩检验.ppt_第4页
第4页 / 共33页
--Wilcoxon符号秩检验.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

1、2.2 Wilcoxon符号秩检验符号秩检验 Wilcoxon符号秩检验(Wilcoxon signed-rank test)是非参数统计中符号检验法的改进,它不仅利用了观察值和原假设中心位置的差的正负,还利用了差的值的大小的信息。虽然是简单的非参数方法,但却体现了秩的基本思想。.n n例例 2.4 2.4 下面是下面是1010个欧洲城镇每人每年平均消费的个欧洲城镇每人每年平均消费的酒量(相当于纯酒精数)(单位:升)。数据已酒量(相当于纯酒精数)(单位:升)。数据已经按升幂排列。经按升幂排列。4.12 5.18 7.63 9.74 10.39 4.12 5.18 7.63 9.74 10.39

2、 11.92 12.32 12.89 13.54 14.45 11.92 12.32 12.89 13.54 14.45 人们普遍认为欧洲各国人均年消费酒量的中人们普遍认为欧洲各国人均年消费酒量的中 位数相当于纯酒精位数相当于纯酒精8 8升,也就是升,也就是meme0 0=8=8。由数据。由数据 算得的中位数为算得的中位数为11.1611.16。因此,我们的检验设为:。因此,我们的检验设为:H H0 0:meme8 8 ,H H1 1:me 8me 8.n n 先计算每个样本值和原假设中me0的值之差,即Xi8。n n 考虑这些差的绝对值并将绝对值从小到大排序,从而求出这些绝对值的秩。n n

3、再计算比8大的样本对应的绝对值的秩之和,如果这个和比较大,我们就拒绝原假设,接受备择假设。.n n问题一般提法:假定样本X1,X n来自分布连续对称的总体X,在此假定下总体X的中位数等于均值。问题主要是检验中位数,即原检验为H0:me=me0,相对于各种单双边的备择假设。.注:(1)与符号检验不同:Wilcoxon符号秩检验假设总体分布是对称的。(2)在总体分布对称的假设下,即设总体X的分布关于点对称,则X的均值和中位数相同,且均为。所以检验总体中位数可等价于检验总体对称中心。即检验的原假设 H0:M=M0 等价于 H0:=0(相对于各种单双边的备择假设)。.n n检验步骤:检验步骤:H H0

4、 0:0 0 (对应于各单双边备择假设)(对应于各单双边备择假设)Step 1.Step 1.计算计算 i=1,2,n i=1,2,n。记差为。记差为z z i.i.Step 2.Step 2.将差将差z z i.i.的绝对值,即的绝对值,即 ,按从小到按从小到大的顺序排列。由于总体服从连续型分布,不妨大的顺序排列。由于总体服从连续型分布,不妨假定样本互不相等,都不等于假定样本互不相等,都不等于0 0,且样本差的绝对,且样本差的绝对值也互不相等。所以可得到样本值也互不相等。所以可得到样本z z i.i.的绝对值的秩,的绝对值的秩,不妨记不妨记 的秩为的秩为R R i i。.Step 3.Ste

5、p 3.符号秩和检验统计量为符号秩和检验统计量为 其中其中 或者取检验统计量为或者取检验统计量为 其中其中主要取主要取WW为检验统计量。为检验统计量。.n nStep 4 设w表示由样本算出的W的值。(1)H0:0,H1:0 p值P(W w);(2)H0:0,H1:0 0。若若H H1 1成立,则总体成立,则总体X X的分布关于点的分布关于点 对称。对称。从而有,从而有,P(X0)P(X0)P(Xa)P(Xa)P(X 8下面来用Wilcoxon符号秩检验,等价于检验 H0:8 ,H1:8.n n检验步骤检验步骤 Step 1.Step 1.对于对于 i=1,2,n i=1,2,n,计算得到新的

6、样本,计算得到新的样本z zi i和和它们对应的秩如下:它们对应的秩如下:样本样本 x xi i4.124.12 5.185.18 7.637.63 9.749.7410.3910.3911.9211.9212.3212.3212.912.913.5413.5414.4514.45 z zi i的的符号符号 z zi i的绝的绝对值对值3.883.88 2.192.19 0.370.37 1.741.742.392.393.923.924.324.324.894.895.545.546.456.45 秩秩 5 5 3 3 1 1 2 2 4 4 6 6 7 7 8 8 9 9 10 10.n

7、n Step 2.计算W。W+=2+4+6+7+8+91046 利用W的分布,辅以统计软件,可计算出p值 0.032。n nStep 3.所以给定0.05时,此时可拒绝原假设,认为欧洲人均酒精年消费多于8升。.W的分布性质的分布性质 设独立同分布样本设独立同分布样本x x1 1,x,xn n来自连续对称总体来自连续对称总体X,XX,X分布的对称中心为分布的对称中心为。为方便讨论,不妨设原假。为方便讨论,不妨设原假设为设为 H H0 0:0 0,即总体分布关于原点即总体分布关于原点0 0对称的条件下,讨论对称的条件下,讨论W W的性质。的性质。注:注:W W与与W W有下列关系:有下列关系:W

8、W+W+W-=n(n=n(n1)/21)/2 .n n(关键)性质 2.1 令 则在总体的分布关于原点0对称时,W与S同分布。注:S是W当Rii时的特殊情况。研究W的分布可转为研究S的分布。.n n概率分布n n性质 2.2 在总体的分布关于原点0对称时,W的概率分布为 P(W+=d)=P(Sd)=t n(d)/2n,其中,d0,1,2,n(n+1)/2,tn(d)表示从1,2,n这n个数中任取若干个数(包括一个都不取),其和恰为d,共有多少种取法。.n n对称性n n性质 2.3 在总体的分布关于原点0对称时,W服从对称分布,对称中心为n(n+1)/4,即:对所有的d=0,1,2,n(n+1

9、)/4,有 P(W+=n(n+1)/4 d )P(W+=n(n+1)/4+d ),P(W+n(n+1)/4 d )P(W+n(n+1)/4+d )。.n n期望方差及渐近正态性期望方差及渐近正态性n n性质性质 2.4 2.4 在总体分布关于原点在总体分布关于原点0 0对称时,对称时,E(W E(W+)=n(n+1)/4)=n(n+1)/4,D D(WW+)=n(n+1)(2n+1)/24=n(n+1)(2n+1)/24。n n性质性质 2.5 2.5 若总体分布关于原点若总体分布关于原点0 0对称,则在样本容对称,则在样本容量量n n趋于无穷大时,趋于无穷大时,WW+有渐近正态性:有渐近正态

10、性:W W N N(n(n+1)/4n(n+1)/4,n(n+1)(2n+1)/24n(n+1)(2n+1)/24).n n有结的情况下,用平均秩法。有结的情况下,用平均秩法。n n性质性质2.6 2.6 在总体的分布关于原点在总体的分布关于原点0 0对称,有结秩取对称,有结秩取平均时,平均时,E(W E(W+)=n(n+1)/4)=n(n+1)/4,D D(WW+)=n(n+1)(2n+1)/24=n(n+1)(2n+1)/24其中其中g g表示结的个数,表示结的个数,表示第表示第i i个结的长度。个结的长度。n n有结时,有结时,WW的期望和方差实际上是条件期望和的期望和方差实际上是条件期

11、望和方差,它们是在样本数据中给定有方差,它们是在样本数据中给定有g g个结,且结的长个结,且结的长度分别给定为度分别给定为 时的条件期望和条件方差。时的条件期望和条件方差。.n n与符号检验的比较。续例 2.2 两个不同方向的假设检验。考虑下面的假设检验:H0:M=12.5,H1:M8 (H1)对这两个问题分别用Wilcoxon符号秩检验和符号检验方法。.n n符号检验结果符号检验结果 对于检验(对于检验(H1H1):):S S=3,S=3,S+=7,=7,检验统计量检验统计量K KS S3 3,p p值值0.1718750.171875,对,对 0.050.05,不能拒绝,不能拒绝H H0

12、0。对于检验(对于检验(H2H2):):S S=7,S=7,S+=3,=3,检验统计量检验统计量K KS S3 3,p p值值0.1718750.171875,对,对 0.050.05,不能拒绝,不能拒绝H H0 0。结果完全对称!说明符号检验只与符号有关!结果完全对称!说明符号检验只与符号有关!.n nWilcoxonWilcoxon符号秩检验结果符号秩检验结果 对于检验(对于检验(H1H1):):检验统计量检验统计量WW+=46=46,p p值值0.032230.03223,对,对 0.050.05,拒绝,拒绝H H0 0。对于检验(对于检验(H2H2):):检验统计量检验统计量WW111

13、1,p p值值0.052730.05273,对,对 0.050.05,不能拒绝,不能拒绝H H0 0。结果不对称!说明结果不对称!说明WilcoxonWilcoxon符号秩检验不仅与符号符号秩检验不仅与符号有关,还和数值大小有关!有关,还和数值大小有关!.Wilcoxon符号秩检验置信区间符号秩检验置信区间n nWalshWalsh平均平均 为利用更多的信息,可求每两个数的平均为利用更多的信息,可求每两个数的平均 (X (Xi iX Xj j)/2,i j)/2,i j,(一共有,(一共有 n(n+1)/2 n(n+1)/2 个)来扩个)来扩 大样本数目。这样的平均称为大样本数目。这样的平均称

14、为WalshWalsh平均平均。.n nWalshWalsh平均和平均和WW+的关系。的关系。在原假设成立的条件下,即在原假设成立的条件下,即 H H0 0:0 0成立,有成立,有 特别当原假设为特别当原假设为H H0 0:0 0成立,有成立,有 .n nHodgeHodgeLehmannLehmann估计量估计量 利用利用WalshWalsh平均可以得到对称中心平均可以得到对称中心的点估计,的点估计,即可由即可由WalshWalsh平均的中位数来估计对称中心,称之为平均的中位数来估计对称中心,称之为HodgeHodgeLehmannLehmann估计量。估计量。.n n0 0 的的置信区间。

15、置信区间。可利用可利用WalshWalsh平均得到平均得到0 0 的的100(1-)%100(1-)%置信置信区间。具体步骤:区间。具体步骤:(1)(1)先求出满足下面两式的整数先求出满足下面两式的整数k k,即,即k k使得使得 P(W P(W+k)/2k)/2,P(WP(W+n nk)/2k)/2,.(2)将求出的Walsh平均数,按升幂排列,记为W(1),W(N),N=n(n+1)/2,则0 0 的的100(100(1-)%1-)%置信区间为 W(k1),W(Nk)。.n n再看看例2.2的置信区间。求出其Walsh平均,共55个值。取=0.05,则求得k=9时,有 P(W+9)0.02

16、5,P(W+559)0.025,所以的95的置信区间为 W(10),W(46)8.02,12.73。.两配对数据比较问题两配对数据比较问题n n 两成对数据的比较问题可以转化成单样本问题,用符号检验或Wilcoxon符号秩检验做统计分析。方法是将两成对样本作差,观察它们的差值,将其视为新的样本,所以两配对样本实际上就是单一样本。.n n例例 2.3 2.3 给给1212组双胞胎做心理检验,以测量每个人组双胞胎做心理检验,以测量每个人的进取心。我们感兴趣的是对双胞胎进行比较,的进取心。我们感兴趣的是对双胞胎进行比较,看第一个出生的是否倾向于比另外一个更有进取看第一个出生的是否倾向于比另外一个更有

17、进取心。结果如下,高分显示更多的进取心。表中,心。结果如下,高分显示更多的进取心。表中,X Xi i表示第一个出生的得分,表示第一个出生的得分,Y Yi i表示第二个出生的得表示第二个出生的得分。分。D D i i表示两者差,即表示两者差,即D D i i Y Yi i X Xi i,i=1,2,12,i=1,2,12。R Ri i表示表示D D i i绝对值的秩。则绝对值的秩。则DD1 1,DD1212是独立同分是独立同分布的,且设总体为布的,且设总体为D D。问题是求问题是求DD的中位数的中位数MMDD的的9595置信区间。置信区间。.双胞胎组双胞胎组1 1 2 2 3 3 4 4 5 5

18、 6 6 7 7 8 8 9 9 10 101111 12 12 X Xi i868671717777 6868 9191 72 72 7777 91 917070 7171 88888787 Y Yi i888877777676 6464 9696 62 62 65 65 8888 62 62 80 80 81817272 D Di i符号符号|D|Di i|2 2 6 6 1 1 4 4 5 51010 12 12 3 3 8 8 9 9 7 71515 R Ri i 2 2 6 6 1 1 4 4 5 5 10 10 11 11 3 3 8 8 9 9 7 7 12 12.n n DDi

19、 i的的1212个值按顺序排列为:个值按顺序排列为:-15,-12,-10,-8,-7,-4,-3,-1,2,5,6,9 -15,-12,-10,-8,-7,-4,-3,-1,2,5,6,9n n取取 0.050.05,查表可得,查表可得k=14k=14。则。则M MD D的的9595的置信区的置信区间为间为 W W(15)(15),W,W(64)(64)。n n这这1515个最小的平均,由个最小的平均,由(-15-15)/2(-15-15)/2开始,是开始,是-15,-13.5,-12.5,-12,-11.5,-11,-11,-10,-10,-9.5,-9.5,-15,-13.5,-12.5,-12,-11.5,-11,-11,-10,-10,-9.5,-9.5,-9,9,-9,-8.5,-8-9,-8.5,-8所以,所以,W W(15)(15)8 8,即置信区间下界是,即置信区间下界是8 8。.n n15个最大的平均,从(9+9)/2开始,是 9,7.5,7,6,5.5,5.5,5,4,4,3.5,2.5,2,2,1.5,1所以,W(64)1,置信区间的上界是1。n n所以中位数95的置信区间是 8,1。.

展开阅读全文
相似文档                                   自信AI助手自信AI助手
猜你喜欢                                   自信AI导航自信AI导航
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服