1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,6 两样本定量资料的假设检验,王 玖,博 士,副教授,Tel:6913217 E-mail:mswj,滨州医学院卫生统计学教研室,6.1 两组独立样本的假设检验,用来比较两样本所来自的总体均数或总体分布是否相同。,当两样本均来自正态总体且方差齐性时,首选,t,检验,可以证明,用,t,检验比较两样本的总体均数是否相同的检验功效是最高的;,当两样本均来自正态总体但方差不齐时,可采用校正的,t,检验。,当两样本并非来自正态总体或总体分布不详时,可采用秩和检验,(,rank sum test),。,6.1.1 两独
2、立样本的,t,检验,例6-1 为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6-1。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?,解析,该例目的在于比较用新药治疗的人群和用常规药治疗的人群的血红蛋白平均增加量,(g/L),有无差异,其实质就是比较两个总体均数是否相同,即 是否成立。,在研究设计上,该例属于,完全随机设计,的两组独立样本。,从两个人群分别随机抽取一定数量的观察资料构成样本,测量某项指标后进行组间比较,属于,平行对照设计(成组设计),。,为了研究新生儿窒息患者与正常新生儿血浆中,S
3、OD,平均含量有无差异,某研究者收集了,10,名正常新生儿和,10,名新生儿窒息患者的血浆,测得,SOD,含量(,Nu,/mg,),请问新生儿窒息患者和正常新生儿血浆中,SOD,平均含量有无差异?,t,检验进行两样本均数比较的步骤,(1)建立检验假设,确定检验水准,:新药和常规药治疗贫血患者后血红蛋白平均增加量相同,即,:新药和常规药治疗贫血患者后血红蛋白平均增加量不同,即,(2)计算检验统计量,(3)查t界值表,得,P,50),样本均数近似地服从正态分布,故满足成组检验关于正态分布的要求;,但当样本例数较小时,需要对每组资料进行正态性检验。常用的正态性检验方法是,矩法,检验和,w检验,(Sh
4、apiro-Wilk W test),矩法检验比较保守,w检验比较灵敏。此外,还有,K,-,S,检验(Kolmogorov-Smirnov test)和,D,检验(,D,test)等。,正态性检验的无效假设为资料服从正态分布,备择假设为资料不服从正态分布,。,6.1.4,两组独立样本的秩和检验,例6-3 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白(g/L)含量,问肺炎患者与正常人平均血铁蛋白含量有无差别?,肺炎患者,31 68 237 174 457 492 199,515 599 238,正常人,177 172 34 47 132 54 47 52,4
5、7 294 68 43 277 44 43 95,正常人组,正态性的,W,检验结果,P,=0.010,参数统计-非参数统计,在统计推断方法中,凡是在已知总体分布的前提下对总体参数进行估计或检验的方法,称为,参数统计(parametric statistics),。,但在实际工作中,有时总体的分布不易确定,或分布不符合要求的条件,则需要应用一种不依赖于总体分布类型的统计推断方法,称为非参数统计(nonparametric statistics)。Wilcoxon秩和检验属于非参数检验中的一种,可以用于完全随机化设计两组独立样本的比较。,非参数统计的基本思想,在不知总体分布的情况下如何利用数据所包
6、含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。,在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,Wilcoxon秩和检验基本步骤,(1)建立检验假设,:肺炎患者与正常人的血铁蛋白总体分布相同,:肺炎患者与正常人的血铁蛋白总体分布不同,=0.05,(2)计算检验统计量,T,值,编秩将两组数据合起来由小到大统一编秩,即从小到大编号,最小的数据的秩为1,第二小的,数据的秩为2,依此类推。编秩时如遇有相同数据,且相同数据在不同组时,要取其平均秩次,(3)确定,P
7、值,作出统计推断结论,查表法,T,界值表(两样本比较的秩和检验用),先从左侧找到较小的样本量,本例较小的样本量为,n,1=10;再从表上方找两组例数的差,本例,,n,2-,n,1=6;在两者纵横交叉处即为,T,的界值。,将检验统计量,T1,值与,T,界值相比,若,T,值位于界值范围内,其,P,值大于相应的概率;若,T,值等于界值或在界值范围外,其,P,值等于或小于相应的概率。,正态近似法,相持较多时的校正,t,j,为第,j,(,j,=1,2)个相持所含的个体数,Wilcoxon秩和检验的基本思想,秩次在一定程度上反映了等级的高低;,秩和在一定程度上反映了等级的分布位置,这样,对观察值的分析就
8、转化为对秩次的分析。,当,H,0,为真时,两个样本来自相同的总体,对于样本量为,n,1,和,n,2,而言,每个数据的秩均有相同的机会取值为1,2,,n,1,n,2,,因此每个数据的秩次期望值为(n,1,+n,2,+1)/2。第一组的,n,1,个数据的秩和,T,1,应随机地出现在其期望值 n1(n,1,+n,2,+1)/2 附近。,H,0,为真时,第一组的秩和,T,1在其期望值n1(n1+n2+1)/2处呈对称分布,并且当样本量较大时,统计量秩和,T,1近似服从均数为n1(n1+n2+1)/2,方差为n1n2(n1+n2+1)/12的正态分布;,H,0,非真时,在大多数情况下统计量秩和,T,1将
9、远离其期望值,利用秩和,T,1借助Wilcoxon秩和检验的临界值表或近似正态分布的检验统计量实现假设检验,6.2 配对设计定量资料的检验,配对设计是将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性别等),再随机分配每对中的两个受试对象到不同的处理组。,其实施的主要形式有:将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组;同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别。,例6-4 为研究某种抗癌新药对小白鼠移植性肉瘤S180的抑瘤效果,将20只小白鼠按性别、体重、窝别配成对子。每对中随机抽取一只服用抗癌新药扶正消瘤汤,另一只作为阴性对照
10、服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效果,经过一定时间,测得小白鼠瘤重如表6-3所示。问小白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?,对子内部相减之后,得到的差值资料实际上是一个样本,因此配对设计资料的假设检验类似于单样本检验,即检验差值的均数或中位数是否等于零。,对于配对设计定量资料的统计分析,若差值服从正态分布,可采用配对 t 检验(paired,t,test);否则,采用配对资料的符号秩和检验(signed rank sum test)。,6.2.1.1,配对样本检验,首先计算出各对差值,d,的均数 ,当两种处理平均效应是相同的,则差值来自的总体均数 应该为0,故可
11、将配对设计资料的 t检验视为样本均数,所来自的未知总体均数与已知总体均数 0的比较。,小样本资料:,配对,t,检验的基本步骤,配对,t,检验的基本步骤,(3)确定,P,值,作出统计推断结论 查t界值表,得P0.20,在,=0.05水平上不能拒绝,H,0,。所以尚不能认为两法测定结果不同。,6.2.2,配对资料的符号秩和检验,例6-5 留取15名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法测得尿汞平均含量有无差别?,解析 本研究属于配对设计的定量资料,首先判断是否符合配对设计,t,检验的,适用条件,,即差值是否来自正态分布。通过对差值进行正态性
12、检验,发现差值不是来自正态总体(,W,检验:,P,=0.010),所以用配对资料的符号秩和检验(Wilcoxon matched-samples signed rank sum test)进行统计分析,。,配对资料的符号秩和检验的基本思想,如果两种检测方法的平均效应相同,这些配对数值之差应服从于以0为中心的对称分布,也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与负秩和在理论上应是相等的(都等于,n,(,n,+1)/4,,n,为有效对子数),对于样本的正秩和与负秩和之间的差异是一些随机因素造成的抽样误差、这些差异一般不会太大。如果差别太大,超出了规定的范围,就拒绝,H,0,,
13、接受,H,1,,认为差值的总体中位数不等于0。,6.2.2.1,配对符号秩和检验步骤,(1)建立假设,确定检验水准,H,0:两种方法测得的尿汞含量差值的总体中位数为零,即 =0,H,1:两种方法测得的尿汞含量差值的总体中位数不等于零,即 0,=0.05,(2)计算检验统计量,T,值,求差值 见表6-5的第(4)列。,编秩 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,编秩时如遇差值为0,则舍去不计。,求秩和 分别求出正、负秩次之和,正秩和以,T,+表示,负秩和以,T,-表示,取两者中较小的秩和为统计量,T,(3)确定,P,值,作出统计学结论
14、查表法,查,T,界值表(配对比较的符号秩和检验用),若检验统计量,T,值在上、下界值范围内,其,P,值大于表上方相应概率水平;若,T,值在上、下界值上或范围外,则,P,值等于或小于相应的概率水平。,正态近似法,若,n,25,超出,T,界值表的范围,可用正态近似法作检验。若,H,0为真,则秩和检验统计量,T,近似服从。,相持较多时(不包括差值为0者),6.3 两组Poisson分布资料的比较,医学研究中常涉及到对两个Poisson分布总体均数的比较,当每个样本的观察值之和都大于20时,Poisson分布近似正态分布,可考虑应用,Z,检验对其总体均数进行推断。,6.3.1 观察单位相等时两个独立
15、样本的,Z,检验,例6-6 两种培养液配方各在3个平皿中制成固体培养基,各放入1 ml含幽门螺杆菌充分混匀的胃液。培养72小时后清点幽门螺杆菌菌落数如下,问两种培养基菌落数差别有无统计学意义?,甲 14,21,16,乙 12,10,8,当两个Poisson分布的参数相等时,统计量,近似服从标准正态分布。,观察单位不等时两个独立样本的,Z,检验,例6-7 用同位素方法独立地测量两份标本的放射性,标本的制备方法相同,但测量时间不同,第一份标本测量了10分钟,测得质点数为1500,第二份标本测量了20分钟,测得质点数为2400。问如果在相同时间长度内测量,两份标本发放质点的总体均数是否相等?,6.4
16、 结果报告,统计描述,:,包括样本含量和统计描述指标;,统计推断,:,包括采用的统计方法、检验统计量、单侧还是双侧检验、检验水准、确切的,P,值和置信区间。,在=0.10检验水准下,新药组和常规药物组血红蛋白增加量均服从正态分布(W检验:,P,1=0.466,,P,20.482)且两总体方差齐(,F,1.345,,P,=0.261);采用两独立样本的,t,检验:,t,=4.137,=18,,P,=0.001。结果表明:在=0.05(双侧)检验水准下,可以认为两药疗效不同,新药治疗的患者血红蛋白平均增加量高于常规药治疗的患者。的95%置信区间(3.829,11.731)也表明新药治疗的患者血红蛋
17、白平均增加量高。,The data of two samples were adequately normally distributed(Shapiro-Wilk test:,P,1=0.466;,P,20.482)and the two population variances were equal at the significant level 0.10(,F,1.345;,P,=0.261),so two independent samples,t,test was used(,t,=4.137;df=18;,P,=0.001).The results indicated a sta
18、tistically significant difference between effects of two drugs at two-tailed significant level 0.05 and the average increase of concentration of Hb was higher in patients taking the new drug,which could also be observed from the 95%confidence interval of the difference of two population means(3.829,11.731).,两样本定量资料的假设检验,






