1、Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,*,Xue Fuzhong,School of public health,Shandong University,假设检验的基本原理与,t,检验,假设检验的基本原理与,t,检验,假设检验的基本原理与,t,检验,假设检验的基本原理,假设检验,(hypothesis test),亦称显著性检验,(significance test),,是统计推断的两个重要内容之一。假
2、设检验的方法很多,如,t,检验、,u,检验、方差分析、检验、秩和检验、,;应用时,需根据研究目的、设计方法、资料类型及其分布特征等选用。,二十世纪二、三十年代,Neyman,和,Pearson,建立了统计假设检验问题的数学模型。,假设检验的基本原理与,t,检验,假设检验的基本原理,假设检验的基本原理与,t,检验,假设检验的基本原理,假设检验的基本原理与,t,检验,假设检验的基本原理,假设检验是利用小概率反证法思想,从问题的对立面,(,H,0,),出发间接判断要解决的问题,(,H,1,),是否成立。然后在,H,0,成立的条件下计算检验统计量,最后获得,P,值来判断。,问题实质上都是希望通过样本统
3、计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验,(hypothesis test),。,假设检验的基本原理与,t,检验,假设检验的基本原理,例,根据大量调查,已知健康成年男子脉搏的均数为,72,次,/,分钟,某医生在一山区随机测量了,25,名健康成年男子脉搏数,求得其均数为,74.2,次,/,分钟,标准差为,6.5,次,/,分钟,能否认为该山区成年男子的脉搏数与一般健康成年男子的脉搏数不同?,1.,建立检验假设,确定检验水准,一种是,无效假设(,null hypothesis,),,符号为,H,0,;,一种是,备择假设(,alter
4、native hypothesis,),符号为,H,1,。,H,0,:,H,1,:,假设检验的基本原理与,t,检验,假设检验的基本原理,假设检验的基本原理与,t,检验,假设检验的基本原理,检验水准亦称显著性水准(,significance level,),符号为 ,是判断拒绝或不拒绝 的水准,也是允许犯,型错误的概率,通常用 。必要时,可用,0.01,或,0.10,或,0.20,。,假设检验的基本原理与,t,检验,假设检验的基本原理,2.,选定检验方法和计算统计量,根据研究设计的类型和统计推断的目的要求选用不同的检验方法。如完全随机设计中,两样本均数的比较可用,t,检验,样本含量较大时(,n,
5、100,),可用,u,检验。不同的统计检验方法,可得到不同的统计量,如,t,值和,u,值。各检验方法都有其应用条件。选择时,须根据研究目的、设计类型、资料类型及其分布特征等选用适当的统计检验方法,并计算出相应的检验统计量。例如,本例为样本均数与总体均数比较,样本是随机抽取的,变量值为数值变量资料,样本含量较小,且总体标准差未知,因而选用单样本 检验。,假设检验的基本原理与,t,检验,假设检验的基本原理,2.,选定检验方法和计算统计量,X,N,(72,2,),假设检验的基本原理与,t,检验,假设检验的基本原理,2.,选定检验方法和计算统计量,假设检验的基本原理与,t,检验,假设检验的基本原理,2
6、确定,P,值,作出结论,假设检验的基本原理与,t,检验,假设检验的基本原理,P,值是指在,H,0,所规定的总体中作随机抽样,获得等于及大于(或小于)现有统计量,t,值的概率。,3.,确定概率,P,值作出结论,假设检验的基本原理与,t,检验,假设检验的基本原理,3.,确定概率,P,值作出结论,当,P,时,,表示在,H,0,成立的条件下,出现等于及大于现有统计量的,概率是小概率,,根据小概率事件原理,现有样本信息不支持,H,0,,因而拒绝,H,0,,结论为按所取检验水准拒绝,H,0,,接受,H,1,,即差异有统计学意义,如例,3.3,可认为两总体脉搏均数有差别;,当,P,时,,表示在,H,0,
7、成立的条件下,出现等于及大于现有统计量的概率,不是小概率,,现有样本信息还不能拒绝,H,0,,结论为按所取检验水准不拒绝,H,0,,即差异无统计意义,如例,3.3,尚不能认为两总体脉搏均数有差别。,本例:,结论为按所取检验水准不拒绝,H,0,,即差异无统计意义,尚不能认为两总体脉搏均数有差别。,假设检验的基本原理与,t,检验,假设检验的基本原理,3.,确定概率,P,值作出结论,当,P,时,,表示在,H,0,成立的条件下,出现等于及大于现有统计量的,概率是小概率,,根据小概率事件原理,现有样本信息不支持,H,0,,因而拒绝,H,0,,结论为按所取检验水准拒绝,H,0,,接受,H,1,,即差异有统
8、计学意义,如例,3.3,可认为两总体脉搏均数有差别;,当,P,时,,表示在,H,0,成立的条件下,出现等于及大于现有统计量的概率,不是小概率,,现有样本信息还不能拒绝,H,0,,结论为按所取检验水准不拒绝,H,0,,即差异无统计意义,如例,3.3,尚不能认为两总体脉搏均数有差别。,样本均数与总体均数的比较,小样本,t,检验法:,目的:推断样本所代表的未知总体均数,与已知总体均数,0,是否相等。,t,检验的,适用条件,:样本来自正态总体或近似正态总体;,若不符合条件可考虑用非参数方法(秩和检验法),假设检验的基本原理与,t,检验,样本均数与总体均数的比较:,小样本,t,检验法:,例经产科大量调查
9、得知某市婴儿体重均数为3.,30kg,,今随机测得,35,名难产儿平均出生体重为3.,42kg,,标准差为0.4,0kg。,问该市难产儿出生体重与一般婴儿是否不同?,假设检验的基本原理与,t,检验,样本均数与总体均数的比较:,小样本,t,检验法:,假设检验的基本原理与,t,检验,样本均数与总体均数的比较:,大样本,u,检验法:,国外统计书籍及统计软件亦称为单样本,u,检验(,one sample,u,-test,)。,样本均数与总体均数比较的,u,检验适用于:,总体标准差,已知的情况;,样本含量较大时,比如,n,100,时。对于后者,是因为,n,较大,,也较大,则,t,分布很接近,u,分布的缘
10、故。,假设检验的基本原理与,t,检验,样本均数与总体均数的比较:,大样本,u,检验法:,假设检验的基本原理与,t,检验,样本均数与总体均数的比较:,SAS,运行结果:,假设检验的基本原理与,t,检验,例题:已知某水样中碳酸钙的真值为,20.7mg/L.,现用某法重复测定该水样,11,次,测得碳酸钙的含量分别为,20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00,。问用该法测得的碳酸钙含量的均知与真值差异有无统计学意义?,data,a;input x;y=x-,20.7,;cards;,20.99 20.41 20.
11、10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00,run;,proc,univariate,data=a normal;,var y;,run,;,SAS code,样本均数与总体均数的比较:,SAS,运行结果:,假设检验的基本原理与,t,检验,SAS output,样本均数与总体均数的比较:,SAS,运行结果:,假设检验的基本原理与,t,检验,SAS output,样本均数与总体均数的比较:,SAS,运行结果:,假设检验的基本原理与,t,检验,SAS output,配对,t,检验:,所谓配对样本(,paired sample,)是指两个样本
12、中的观察对象由于存在某种联系或具有某些相近的重要特征而结成对子(,matching,),每对中的两个个体随机分配接受两种不同的处理。,医学研究中常见的配对样本:,配成对子的两个个体分别给予两种不同的处理(如把同窝、同性别和体重相近的动物配成一对;把同性别、同病情和年龄相近的病人配成一对等);,同一个体同时分别接受两种不同处理(如同一动物的左右两侧神经、同一份标本分成两部分);,同一个体自身前后的比较(如高血压患者治疗前后的舒张压比较、肝炎患者治疗前后的转氨酶比较等)。,假设检验的基本原理与,t,检验,配对,t,检验:,对于配对样本数据,应该首先计算出各对差值的均数。当两种处理结果无差别或某种处
13、理不起作用时,理论上差值的总体均数应该为,0,,故可将配对样本资料的假设检验视为样本均数与总体均数,=0,的比较,所用方法为配对,t,检验(,paired,t,-test,),适用条件,:,要求差值的总体分布为正态分布,即差数来自正态分布总体。,不符合条件时,可考虑用非参数检验(配对符号秩和检验法),假设检验的基本原理与,t,检验,配对,t,检验:,例,4.3,将,20,只按体重、月龄及性别配对的大白鼠随机分入甲、乙,2,组,甲组给正常饲料,乙组饲料缺乏维生素,E,。,10,天后测定大白鼠肝脏的维生素,A,含量(,IU/g,),结果如下。问,2,组大白鼠肝脏维生素,A,含量是否有差别?,假设检
14、验的基本原理与,t,检验,配对,t,检验:,假设检验的基本原理与,t,检验,配对,t,检验:,例,4.4,有,12,名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重,(kg),,数据如表,4-2,所示。试判断此减肥药是否有效。,假设检验的基本原理与,t,检验,配对,t,检验:,假设检验的基本原理与,t,检验,配对,t,检验:,假设检验的基本原理与,t,检验,SAS,运行结果,例题:为研究女性服用某种避孕药后是否影响其血清总胆固醇含量,将,20,名女性按年龄配成,10,对。每对随机抽取,1,人服用该药,另,1,人服用安慰剂。经一段时间后,测定血清总胆固醇含量如下。问该药是否影响女性
15、血清总胆固醇含量?,SAS code,配对,t,检验:,假设检验的基本原理与,t,检验,SAS,运行结果,SAS output,配对,t,检验:,假设检验的基本原理与,t,检验,SAS,运行结果,SAS output,完全随机设计的两组数值变量资料比较:,小样本,t,检验法:,完全随机设计,(completely random design),:把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。目的,:,比较两总体均数是否相同。,适用条件:,两样本均数均来自正态分布总体;,两总体方差相等(方差齐),若有一条以上不符合:,采用适当的变量变换方法,使
16、其达到上述条件;,若变量变换后仍不满足条件,则用非参数检验法(秩和检验)。,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,小样本,t,检验法:,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,小样本,t,检验法:,例,4.6,将,20,份钩端螺旋体患者的血清随机分为,2,组,分别用标准株和水生株做凝溶试验,结果见表,4-3,。试比较两法测得的血清抗体平均效价有无差别。,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,小样本,t,检验法:,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,正态性检验:,正态性
17、检验(,normality test,)方法:,统计指标:偏度系数、峰度系数;,W,值、,D,值等,统计图:,P,P,图、,Q,Q,图、直方图、茎叶图、箱图等,正态性检验是推断资料是否服从正态分布,或样本是否来自正态分布总体的方法。医学统计学中,许多统计方法仅适用于正态分布或近似正态分布资料。例如,用均数和标准差描述数值变量资料的分布特征,以及,t,、,u,检验和方差分析时,均要求样本资料服从正态分布。因此,选定统计方法时,先要用正态性检验(,test of normality,)推断资料是否服从正态分布。,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,正态性检验:,假
18、设检验的基本原理与,t,检验,P-P,图,完全随机设计的两组数值变量资料比较:,正态性检验:,假设检验的基本原理与,t,检验,P-P,图,完全随机设计的两组数值变量资料比较:,正态性检验,矩法(,即分别对总体分布的偏度与峰度进行检验,):,假设检验的基本原理与,t,检验,P-P,图,完全随机设计的两组数值变量资料比较:,正态性检验,矩法(,即分别对总体分布的偏度与峰度进行检验,):,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,正态性检验,矩法(,即分别对总体分布的偏度与峰度进行检验,):,假设检验的基本原理与,t,检验,检验水准取大些!,完全随机设计的两组数值变量资料
19、比较:,两独立样本方差的齐性检验:,两独立小样本均数的,t,检验,除要求两组数据均应服从正态分布外,还要求两组数据相应的两总体方差相等,即方差齐性(,homoscedasticity,)。但即使两总体方差相等,两个样本方差也会有抽样误差,两个样本方差不等是否能用抽样误差解释?可进行方差齐性检验。,注意,:,方差齐性检验本为双侧检验,但由于公式规定以较大的方差作分子,,F,值必然大于,1,,故附表,3,单侧,0.025,的界值,实对应双侧检验,P,=0.05,;,当样本含量较大时(,如,n,1,和,n,2,均大于,50,),可不必作方差齐性检验。,假设检验的基本原理与,t,检验,根据专业知识确定
20、单、双侧检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,根据专业知识确定单、双侧检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,例,某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。,深层水:,n,1,=8,样本均数,=1.781(,mg,/,L,),S,1,=1.899(,mg,/,L,),表层水:,n,2,=10,样本均数,=0.247(,mg,/,L,),S,2,=0.210(,mg,/,L,),确
21、定,P,值 作出推断结论 本例,1,8-1=7,,,2,10-1=9,,查附表,3,,,F,界值表(方差齐性检验用),,得,F,0.05,7,9,=4.20,本例,F,80.97 F,0.05,7,9,=4.20;,故,P,0.05,按,=0.05,水准,拒绝,H,0,接受,H,1,,,结论:,故可认为两总体方差不齐。,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,两独立样本方差的齐性检验:,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,t,检验:,近似,t,检验有,3,种方法可供选择,包括,Cochran&Cox,法、,Satterthwait
22、e,法和,Welch,法。其中,1,、,2,两种方法较为常用。,Cochran&Cox,法是对临界值校正,而,Satterthwaite,法和,Welch,法则是对自由度校正。,Satterthwaite,法是目前计算机软件中普遍使用的方法。,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,两大样本均数的,u,检验,(,two-sample-test for independent samples,),:,在两个样本均数比较时,若两组样本含量都很大,可用,u,检验,其计算公式为:,例,4.8,某医师欲比较某地工人和农民全血胆碱脂酶活力,检测工人,143,名,均数,3.52
23、mol/L,,标准差为,0.49mol/L,;检测农民,156,名,均数,3.36mol/L,,标准差为,0.53mol/L,。问该地工人与农民全血胆碱脂酶活力有无差别?,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,两大样本均数的,u,检验,(,two-sample-test for independent samples,),:,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,SAS,运行结果,假设检验的基本原理与,t,检验,例题:某克山病区测得急性克山病患者,11,名和该地健康人的血磷值如下,问两组血磷值差异是否有统计学意义?,急性克山病患者
24、4.73 6.40 2.60 3.24 6.53 5.18 5.58 3.73 4.43 5.78 3.37,健康人:,2.34 2.50 1.98 1.67 1.98 3.60 2.33 3.73 4.57 4.82 5.78 4.17 4.14,完全随机设计的两组数值变量资料比较:,SAS,output,假设检验的基本原理与,t,检验,Group=1,Group=2,完全随机设计的两组数值变量资料比较:,SAS,output,假设检验的基本原理与,t,检验,完全随机设计的两组数值变量资料比较:,SAS,output,假设检验的基本原理与,t,检验,型错误和,型错误:,假设检验的基本原理
25、与,t,检验,假设检验中作出的推断结论可能发生两种错误,:,拒绝了实际上是成立的,H,0,,这叫,型错误,(typeerror),或第一类错误,也称为,错误。(,1,)即可信度(,confidence level):,重复抽样时,样本区间包含总体参数(,m,)的百分数。,不拒绝实际上是不成立的,H,0,,这叫,型错误,(typeerror),或第二类错误,也称为,错误。(,1,)即把握度(,power of a test):,两总体确有差别,被检出有差别的能力。,型错误和,型错误:,假设检验的基本原理与,t,检验,型错误和,型错误:,假设检验的基本原理与,t,检验,型错误和,型错误:,假设检验
26、的基本原理与,t,检验,型错误和,型错误:,假设检验的基本原理与,t,检验,型错误和,型错误:,假设检验的基本原理与,t,检验,假设检验中作出的推断结论可能发生两种错误的控制,型错误和,型错误:,假设检验的基本原理与,t,检验,假定做了 次检验,通常称为“族检验(,family of tests,)”,在每一次检验 (第一类错误)不变的情况下,,K,次检验的联合假阳性率将远远大于 。假阳性率(,false discovery rate,,,FDR,)是在特定检验水准 下,有“统计学意义”的结果中,为真的比例。,多次重复检验造成的假阳性,每人的命中率,0.95,,而失误率为,0.05,,则多人的
27、联合失误率会远远大于,0.05,。,假设检验的基本原理与,t,检验,多次重复检验造成的假阳性,假设检验的基本原理与,t,检验,单侧检验与双侧检验,:,假设检验的基本原理与,t,检验,单侧检验与双侧检验,:,假设检验的基本原理与,t,检验,假设检验时应注意的事项:,假设检验的基本原理与,t,检验,1,要有严密的抽样研究设计 这是假设检验的前提。样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性,即对比组间除处理因素,(,如新药和常规药,),外,非处理因素,(,如年龄、性别、病程、病情轻重等,),应尽可能相同。,2,正确选用检验方法 应根据研究目的、设计类型、资料类型及其分布特征等
28、选用适当的假设检验方法。如完全随机设计的两数值变量资料比较时,若,n,小且方差齐,则选用两样本,t,检验;若方差不齐,则选用,t,检验或成组设计的两样本比较的秩和检验;若,n,1,、,n,2,均大于,50,,则选用两样本,u,检验。,假设检验时应注意的事项:,假设检验的基本原理与,t,检验,3,、对差别有无统计学意义的判断不能绝对化 假设检验的推断结论是概率性的,假设检验的结论是根据概率推断的,所以不是绝对正确的:,当,p,不能拒绝,H0,不能接受,H1,,按不能接受,H1,下结论,也可能犯错误,,没有拒绝实际上不成立的,H0,这类称为,II,类错误(,“,存伪,”,的错误),其概率大小用,表
29、示,值一般不能确切的知道(存伪是指两总体均数不相等)。,(,3,),做统计结论时要留有余地,不宜用,“,肯定,”,,,“,一定,”,,,“,必定,”,等词,而且最好列出检验统计量的值,写出,P,值的确切范围,以便读者与同类研究进行比较。,假设检验时应注意的事项:,假设检验的基本原理与,t,检验,(4),正确理解,“,显著性,”,的含义,:,以往,习惯上把称为差异有显著性。此,“,显著性,”,易被理解为二者差异大,或被理解为所分析的指标具有,“,显著效果,”,或,“,显著价值,”,。例如,用某降压药后舒张压平均下降,2mmHg,,经,t,检验可能得到,p,0.05,,由此得出的,“,用药前后的差异有显著性,”,的统计学结论,并不意味此药在临床上有,“,显著疗效,”,。事实上,2mmHg,的差值并无实际意义(有临床意义的差值应,mmHg,)。为了避免对显著性含义的错误理解,目前在医学统计学中已用,“,差别有统计学意义,”,和,“,差别无统计学意义,”,分别表示 和 。因此,在假设检验的推断结论中,既要有统计结论,又要依据专业知识做出专业结论。,假设检验时应注意的事项:,假设检验的基本原理与,t,检验,假设检验时应注意的事项:,假设检验的基本原理与,t,检验,Thank you!,






