资源描述
第十一章第十一章 基于秩次的假设检验方法基于秩次的假设检验方法第十一章第十一章 基于秩次的假设检验方法基于秩次的假设检验方法 t 检验、检验、方差分析等方差分析等正态分布正态分布均数(均数()的比较)的比较参参数数检检验验第十一章第十一章 基于秩次的假设检验方法基于秩次的假设检验方法 t 检验、检验、方差分析等方差分析等正态分布正态分布均数(均数()的比较)的比较参参数数检检验验若总体分布类型若总体分布类型若总体分布类型若总体分布类型未知或总体分布未知或总体分布未知或总体分布未知或总体分布类型已知但不满类型已知但不满类型已知但不满类型已知但不满足以上条件足以上条件足以上条件足以上条件?第十一章第十一章 基于秩次的假设检验方法基于秩次的假设检验方法 t 检验、检验、方差分析等方差分析等正态分布正态分布均数(均数()的比较)的比较参参数数检检验验若总体分布类型若总体分布类型若总体分布类型若总体分布类型未知或总体分布未知或总体分布未知或总体分布未知或总体分布类型已知但不满类型已知但不满类型已知但不满类型已知但不满足以上条件足以上条件足以上条件足以上条件非非参参数数检检验验?(1)参数检验参数检验 要求样本来自的总体分布类型已知,在此基础要求样本来自的总体分布类型已知,在此基础上对总体的参数进行检验。上对总体的参数进行检验。(2)非参数检验非参数检验 不依赖总体的分布类型,应用时也由于此种检不依赖总体的分布类型,应用时也由于此种检验方法不再是参数间的比较,所以称之为非参数检验方法不再是参数间的比较,所以称之为非参数检验。验。参数检验和非参数检验的特点及优缺点参数检验和非参数检验的特点及优缺点(3)非参数检验的优点非参数检验的优点 不受总体分布类型的限制,应用范围广;不受总体分布类型的限制,应用范围广;适用于各种类型的变量,对于一些未能精确测量适用于各种类型的变量,对于一些未能精确测量而只能以优劣等级、严重程度、次序先后表示的资料而只能以优劣等级、严重程度、次序先后表示的资料(如等级资料),或不满足参数检验条件的资料均可(如等级资料),或不满足参数检验条件的资料均可用非参数统计方法;用非参数统计方法;计算量相对较小,可节省计算时间。计算量相对较小,可节省计算时间。例例11-1 11-1 某研究者欲研究保健食品对小鼠的抗疲劳作用,将同种某研究者欲研究保健食品对小鼠的抗疲劳作用,将同种属的小鼠按性别和年龄相同、体重相近配成对子,共属的小鼠按性别和年龄相同、体重相近配成对子,共1414对,并将对,并将每对中的两只小鼠随机分到保健食品两个不同的剂量组,测量小每对中的两只小鼠随机分到保健食品两个不同的剂量组,测量小鼠负重游泳时间(鼠负重游泳时间(minmin,负重,负重5%5%体重),结果见表体重),结果见表11-111-1,试比较,试比较不同剂量组的小鼠负重游泳时间有无差别。不同剂量组的小鼠负重游泳时间有无差别。表11-1 不同剂量组小鼠负重游泳时间(min)初步分析初步分析初步分析初步分析:由表由表11-111-1第(第(4 4)栏可计算配对差值)栏可计算配对差值 d d,其均数,其均数为为 4.434.43,标准差为,标准差为 Sd4.184.18。对差值进行正态。对差值进行正态性检验,性检验,WW0.87180.8718,P P 0.0440.0440.0440.044,按,按 =0.050.05水准水准 ,认为差值不服从正态分布,不满足配对认为差值不服从正态分布,不满足配对 t t 检验的条件,检验的条件,该资料宜用该资料宜用WilcoxonWilcoxon符号秩检验。符号秩检验。建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:Md 0,即差值的总体中位数等于零即差值的总体中位数等于零 H1:Md 0,即差值的总体中位数不等于零即差值的总体中位数不等于零 =0.050.05 求差值求差值求差值求差值 编秩编秩编秩编秩 按差值的绝对值大小,从小到大依次按差值的绝对值大小,从小到大依次 编秩,再编秩,再根据差值的正、负号给秩次以正负号。根据差值的正、负号给秩次以正负号。求秩和求秩和求秩和求秩和 分别求出正、负秩和分别求出正、负秩和 T T+、T T_ _ 。小鼠小鼠对对号号中中剂剂量量组组高高剂剂量量组组差差差差值值值值 d d秩次秩次秩次秩次(1 1)(2 2)(3 3)(4 4)=(2 2)-(3 3)(5 5)1 114.0014.0015.2015.20-1.20-1.20-4-42 213.0013.005.505.507.507.508.58.53 315.0015.0014.0014.001.001.002.52.54 417.0017.006.506.5010.5010.5012125 513.0013.005.505.507.507.508.58.56 618.0018.0013.5013.504.504.505 57 717.5017.5010.0010.007.507.508.58.58 810.2010.2010.2010.200.000.009 910.0010.0010.0010.000.000.00101010.5010.509.509.501.001.002.52.5111113.8013.806.806.807.07.06 612123.033.033.483.48-0.45-0.45-1-1131315.2015.205.505.509.709.701111141416.5016.509.009.007.507.508.58.5小鼠小鼠对对号号中中剂剂量量组组高高剂剂量量组组差差差差值值值值 d d秩次秩次秩次秩次(1 1)(2 2)(3 3)(4 4)=(2 2)-(3 3)(5 5)1 114.0014.0015.2015.20-1.20-1.20-4-42 213.0013.005.505.507.507.508.58.53 315.0015.0014.0014.001.001.002.52.54 417.0017.006.506.5010.5010.5012125 513.0013.005.505.507.507.508.58.56 618.0018.0013.5013.504.504.505 57 717.5017.5010.0010.007.507.508.58.58 810.2010.2010.2010.200.000.009 910.0010.0010.0010.000.000.00101010.5010.509.509.501.001.002.52.5111113.8013.806.806.807.07.06 612123.033.033.483.48-0.45-0.45-1-1131315.2015.205.505.509.709.701111141416.5016.509.009.007.507.508.58.5T T+=73 =73 T T_ _=5=5 确定检验统计量确定检验统计量确定检验统计量确定检验统计量T T 任取正差值的秩和或负差值的秩和为统计量任取正差值的秩和或负差值的秩和为统计量T T。确定确定 P P 值,作出推断结论值,作出推断结论 (一)查表法(一)查表法(T 界值表界值表):5 ;若检验统计量 T T 在界值范围之外,则P 。本例本例 n n=12=12,T T=5=5,T T 界值表界值表(查附表查附表11)11),得,得P P 0.050.05,按,按=0.05=0.05检验水准拒绝检验水准拒绝 HH0 0 ,接受,接受HH1 1 ,可以认为该保健食品的,可以认为该保健食品的不同剂量对小鼠负重游泳时间的影响不同。不同剂量对小鼠负重游泳时间的影响不同。(二)(二)(二)(二)正正正正态近似法:态近似法:态近似法:态近似法:n n5050 符号秩检验的基本思想是:符号秩检验的基本思想是:符号秩检验的基本思想是:符号秩检验的基本思想是:如果如果如果如果 HH0 0 成立,由于抽样误差的存在,统计成立,由于抽样误差的存在,统计成立,由于抽样误差的存在,统计成立,由于抽样误差的存在,统计量量量量T T 与正、负秩和的均数与正、负秩和的均数与正、负秩和的均数与正、负秩和的均数n n(n+1n+1)/4/4 不一定相不一定相不一定相不一定相等,但差别不应太大。当等,但差别不应太大。当等,但差别不应太大。当等,但差别不应太大。当T T 与与与与n n(n+1n+1)/4/4 相差相差相差相差太大,超过了抽样误差可以解释的范围时,有太大,超过了抽样误差可以解释的范围时,有太大,超过了抽样误差可以解释的范围时,有太大,超过了抽样误差可以解释的范围时,有理由怀疑理由怀疑理由怀疑理由怀疑HH0 0 的正确性,从而拒绝的正确性,从而拒绝的正确性,从而拒绝的正确性,从而拒绝HH0 0 。第二节第二节 单样本资料的符号秩检验单样本资料的符号秩检验 由单样本数据推断总体的平均值与某一特定由单样本数据推断总体的平均值与某一特定由单样本数据推断总体的平均值与某一特定由单样本数据推断总体的平均值与某一特定数值(常为标准值数值(常为标准值数值(常为标准值数值(常为标准值 或大量观察的稳定值)是否相或大量观察的稳定值)是否相或大量观察的稳定值)是否相或大量观察的稳定值)是否相等,若资料满足参数检验条件,首选等,若资料满足参数检验条件,首选等,若资料满足参数检验条件,首选等,若资料满足参数检验条件,首选 t t 检验;若资检验;若资检验;若资检验;若资料不满足参数检验条件,此时可用料不满足参数检验条件,此时可用料不满足参数检验条件,此时可用料不满足参数检验条件,此时可用 Wilcoxon Wilcoxon符号符号符号符号秩检验方法。秩检验方法。秩检验方法。秩检验方法。例例11-2 11-2 已知某地正常人尿氟含量的中位数为已知某地正常人尿氟含量的中位数为2.15mmol/L2.15mmol/L,今在该地某厂随机抽取,今在该地某厂随机抽取1212名工人,测名工人,测得尿氟含量(得尿氟含量(mmol/Lmmol/L)结果见表)结果见表11-211-2。问该厂工人。问该厂工人的尿氟含量是否高于当地正常人?的尿氟含量是否高于当地正常人?表表11-2 12名工人尿氟含量(名工人尿氟含量(mmol/L)测定结果)测定结果 尿氟含量尿氟含量 X X2.152.152.102.102.202.202.122.122.422.422.522.522.622.622.722.722.992.993.193.193.373.374.574.57 初步分析:初步分析:初步分析:初步分析:由表由表11-211-2第第2 2栏可计算观察值与已知中位数栏可计算观察值与已知中位数MM0 0=2.15mmol/L =2.15mmol/L 的差值的差值 d d ,其均数为,其均数为 =0.5975 =0.5975,标准差为,标准差为 S Sd d0.7141 0.7141。对。对这些差值进行正态性检验,这些差值进行正态性检验,WW0.83800.8380,P P 0.030.030.030.03,按,按 =0.05 0.05 水准水准 ,认为差值不服从正态分布,因此不满足单样本,认为差值不服从正态分布,因此不满足单样本 t t 检验的条件,该资料宜用检验的条件,该资料宜用WilcoxonWilcoxon符号秩检验。符号秩检验。建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准 H0:Md 0,即差值的总体中位数等于零即差值的总体中位数等于零 H1:Md 0,即差值的总体中位数不等于零即差值的总体中位数不等于零 =0.050.05 求差值:求差值:求差值:求差值:编秩编秩编秩编秩 按差值的绝对值大小,从小到大依次按差值的绝对值大小,从小到大依次 编秩,再根据差值的编秩,再根据差值的正、负号给秩次以正负号。正、负号给秩次以正负号。表表11-2 12名工人尿氟含量(名工人尿氟含量(mmol/L)测定结果)测定结果 尿氟含量尿氟含量 X X差值差值 d d 秩次秩次2.152.150 02.102.10-0.05-0.05-2.5-2.52.202.200.050.052.52.52.122.12-0.03-0.03-1-12.422.420.270.274 42.522.520.370.375 52.622.620.470.476 62.722.720.570.57 7 72.992.990.840.84 8 83.193.191.041.04 9 93.373.371.221.22 10 104.574.572.422.42 11 11 求正、负秩和,并确定检验统计量求正、负秩和,并确定检验统计量求正、负秩和,并确定检验统计量求正、负秩和,并确定检验统计量T T 分别求出正、负秩和分别求出正、负秩和 T T+、T T_ _ 。任取正差值的秩和或负差值的秩和为统计量任取正差值的秩和或负差值的秩和为统计量 T T。确定确定确定确定 P P 值,作出推断结论值,作出推断结论值,作出推断结论值,作出推断结论 本例本例 n n =11=11,T T =3.5=3.5,查配对设计用,查配对设计用T T 界值表,得界值表,得P P 0.05 ;若检验统计量;若检验统计量 T T 值在所给范围外,则值在所给范围外,则 P P u u0.05/20.05/2 =1.96=1.96,故故 P P 5 5 或或 g g 3 3)本本例例经经计计算算HH =32.72=32.72,HHc c =32.818=32.818,查查 2 2界界值值表表,v v=2=2,2 20.05,0.05,2 2=5.99=5.99,HHc c 2 20.05,0.05,2 2,P P 2 20.05,0.05,2 2,P P 0.050.05,按按=0.05 0.05 的的检检验验水水准准,拒拒绝绝 H H0 0,接接受受H H1 1,可可以以认认为为不不同同类类患患者肺切除术针麻效果分布的差别有统计学意义者肺切除术针麻效果分布的差别有统计学意义。三、多重比较三、多重比较三、多重比较三、多重比较 多组间差别比较经多组间差别比较经H H 检验,若推断结论为检验,若推断结论为拒拒绝绝 H H0 0,接受,接受H H1 1时,此时只能得出各总体分布不全时,此时只能得出各总体分布不全相同的结论。若要对两两之间做是否相同的推断,相同的结论。若要对两两之间做是否相同的推断,还需要作组间的多重比较。还需要作组间的多重比较。例例11-7 11-7 对例对例11-511-5资料进行组间的多重比较。资料进行组间的多重比较。(1)(1)建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0:第:第 i i 组与第组与第 j j 组所代表的总体分布相等组所代表的总体分布相等 H H1 1 :第:第 i i 组与第组与第 j j 组所代表的总体分布不等组所代表的总体分布不等 =0.050.05(2)(2)计算统计量计算统计量计算统计量计算统计量 其其中中R Ri i和和R Rj j分分别别为为所所比比较较的的第第 i i 组组和和第第 j j 组组样样本本的的秩秩和和,和和 为其平均秩次,为其平均秩次,n n为所有组的例数之和为所有组的例数之和 。当有相同秩次时,用校正值:当有相同秩次时,用校正值:当有相同秩次时,用校正值:当有相同秩次时,用校正值:其中其中 本例计算结果见表本例计算结果见表11-711-7。表11-7 三组样本秩和的两两比较 对对比比组组(1 1)(2 2)(3 3)(4 4)A A菌菌组组与与B B菌菌组组1.60531.60535.27435.27430.30440.3044A A菌菌组组与与对对照照组组29.437529.43755.54345.54345.31045.3104B B菌菌组组与与对对照照组组27.832227.83225.82785.82784.77584.7758 (3)(3)确定确定确定确定P P 值并作出推断结论值并作出推断结论值并作出推断结论值并作出推断结论 利用利用 u u 界值表确定界值表确定 P P 值与调整后的检验水准值与调整后的检验水准 的大小关的大小关系,若系,若P P 0.0170.017A A菌菌组组与与对对照照组组29.437529.43755.54345.54345.31045.31040.0170.017B B菌菌组组与与对对照照组组27.832227.83225.82785.82784.77584.77580.0170.017第五节第五节 随机区组设计资料的秩和检验随机区组设计资料的秩和检验 随机区组设计所得计量资料若不满足方差分析随机区组设计所得计量资料若不满足方差分析的条件时,可用本节介绍的的条件时,可用本节介绍的FriedmanFriedman秩和检验。该秩和检验。该法因由法因由MFriedmanMFriedman提出,根据其检验统计量的符号提出,根据其检验统计量的符号又称又称MM 检验,目的是推断各处理组样本分别代表的检验,目的是推断各处理组样本分别代表的总体分布是否不同。总体分布是否不同。例例11-8 11-8 调查某城市七所医院一年内春、夏、秋、冬四个季节调查某城市七所医院一年内春、夏、秋、冬四个季节婴儿出生数,数据见表婴儿出生数,数据见表11-811-8,试比较七所医院不同季节的婴,试比较七所医院不同季节的婴儿出生数是否有差别?儿出生数是否有差别?表11-8 某城市七所医院四季婴儿出生资料(1)(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0:四个季节婴儿出生数的总体分布相同:四个季节婴儿出生数的总体分布相同 H H1 1 :四个季节婴儿出生数的总体分布不全相同:四个季节婴儿出生数的总体分布不全相同 =0.050.05(2)(2)编秩编秩编秩编秩 在在在在各各各各区区区区组组组组内内内内部部部部对对对对数数数数据据据据由由由由小小小小到到到到大大大大编编编编秩秩秩秩,遇遇遇遇相相相相同同同同数数数数值值值值取取取取平平平平均均均均秩秩秩秩次次次次。再将各处理组的秩次相加,得到各处理组秩和再将各处理组的秩次相加,得到各处理组秩和再将各处理组的秩次相加,得到各处理组秩和再将各处理组的秩次相加,得到各处理组秩和R Rj j 。(3)(3)计算统计量计算统计量计算统计量计算统计量M M 值值值值 其中其中 本例,本例,(4 4)确定)确定)确定)确定P P值并作出推断结论:值并作出推断结论:值并作出推断结论:值并作出推断结论:查表法(查表法(查表法(查表法(M M 界值表)界值表)界值表)界值表):(处理组数处理组数 g15 g15 且区组数且区组数 n n15)15)本本例例处处理理组组数数g=4g=4且且区区组组数数n=n=7 7,查查附附附附表表1414,MM 0.050.05,=9292,MM 0.050.05,按按 =0.050.05 的的检检验验水水准准,不不拒拒绝绝 HH0 0,尚不能认为不同季节婴儿出生数有差别。,尚不能认为不同季节婴儿出生数有差别。2 2 近似法:近似法:近似法:近似法:(处理组数处理组数 g g 15 15 或区组数或区组数 n n 1515)当有相同秩次时,需进行校正。当有相同秩次时,需进行校正。查查 2 2界值表做结论,其中界值表做结论,其中v v=g g-1-1。(5)(5)多重比较多重比较多重比较多重比较 随随随随机机机机化化化化区区区区组组组组设设设设计计计计资资资资料料料料经经经经 FriedmanFriedman检检检检验验验验,若若若若结结结结论论论论为为为为拒拒拒拒绝绝绝绝HH0 0 ,同同同同样样样样需需需需要要要要对对对对各各各各处处处处理理理理组组组组间间间间进进进进行行行行多多多多重重重重比比比比较较较较,与与与与完完完完全全全全随随随随机机机机设设设设计计计计秩秩秩秩和和和和检检检检验验验验的的的的多多多多重重重重比比比比较较较较类类类类似似似似,只只只只是是是是正正正正态态态态近近近近似似似似检检检检验验验验中中中中的的的的估估估估计方差的算法不同。其方法步骤如下:计方差的算法不同。其方法步骤如下:计方差的算法不同。其方法步骤如下:计方差的算法不同。其方法步骤如下:建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0:所比较两组的总体分布相同:所比较两组的总体分布相同 H H1 1 :所比较两组的总体分布不同:所比较两组的总体分布不同 =0.050.05计算检验统计量并确定值计算检验统计量并确定值计算检验统计量并确定值计算检验统计量并确定值 作出统计推断结论作出统计推断结论作出统计推断结论作出统计推断结论 将将将将某某某某两两两两组组组组比比比比较较较较所所所所得得得得P P 值值值值与与与与调调调调整整整整以以以以后后后后的的的的检检检检验验验验水水水水准准准准 进进进进行行行行比比比比较较较较,若若若若P P ,则拒绝则拒绝则拒绝则拒绝HH0 0 。检验水准的调整(检验水准的调整(BonferroniBonferroni法法),与完全随机设),与完全随机设计类似,为保证第一类错误的概率总共不超过计类似,为保证第一类错误的概率总共不超过 ,按公式(按公式(10-1210-12)调整每次比较的检验水准)调整每次比较的检验水准 ,即,即按两两比较的次数把原检验水准按两两比较的次数把原检验水准 调整为调整为 。n n非参数检验(秩和检验)相对于参数检验的非参数检验(秩和检验)相对于参数检验的优点和缺陷;优点和缺陷;n n实际应用中如何对参数检验和非参数检验方实际应用中如何对参数检验和非参数检验方法进行选择;法进行选择;n n不同设计类型资料秩和检验的基本过程;不同设计类型资料秩和检验的基本过程;n n等级资料的秩和检验(包括其编秩过程及与等级资料的秩和检验(包括其编秩过程及与行行 列表资料的区分)。列表资料的区分)。本章重点与难点:本章重点与难点:作业:作业:三、三、1.3.4.6.7.n n讨论分析:讨论分析:某医生为评价甲、乙两种药物对皮肤癣某医生为评价甲、乙两种药物对皮肤癣菌的杀菌作用,以咪康唑散为对照药物,将菌的杀菌作用,以咪康唑散为对照药物,将315315例浅例浅部真菌病患者随机分为甲乙两治疗组和对照组,分部真菌病患者随机分为甲乙两治疗组和对照组,分别为别为104104例、例、105105例和例和106106例。治疗例。治疗3 3周之后,结果见周之后,结果见表表11-911-9,试比较甲乙两种药物治疗浅部真菌的疗效如,试比较甲乙两种药物治疗浅部真菌的疗效如何?何?表11-9 某药物治疗某病人疗效结果 疗效疗效甲治疗组甲治疗组乙治疗组乙治疗组对照组对照组合计合计治愈治愈565640403838130130显效显效363650505656146146好转好转1010121211113333无效无效2 23 31 16 6合计合计104104105105106106315315 对于该资料研究者作了列联表对于该资料研究者作了列联表 2 2检验:检验:9.9979.997 v v6 6,0.10 0.10 P P 0.25 0.25,考虑到理论数小于,考虑到理论数小于5 5的格子的格子数太多,用数太多,用FisherFisher精确概率法得精确概率法得P P=0.107(=0.107(P P 0.05)0.05),即按即按=0.05=0.05水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1,不能认为甲乙,不能认为甲乙两药物与对照组的疗效不同。两药物与对照组的疗效不同。请讨论:请讨论:(1 1)该资料的分析方法是否合适?为什么?该资料的分析方法是否合适?为什么?该资料的分析方法是否合适?为什么?该资料的分析方法是否合适?为什么?(2 2)应该如何分析该资料?如果利用了新的分析方法,应该如何分析该资料?如果利用了新的分析方法,应该如何分析该资料?如果利用了新的分析方法,应该如何分析该资料?如果利用了新的分析方法,该方法在利用资料信息方面有何改善?该方法在利用资料信息方面有何改善?该方法在利用资料信息方面有何改善?该方法在利用资料信息方面有何改善?
展开阅读全文