1、第二章:第二章:T T检验检验第第第第五五五五组:组:组:组:主要内容 假设检验的基本原理,错误,步骤 单样本t检验 独立样本t检验 配对样本的t检验假设检验 所谓所谓假设检验假设检验,就是事先对总体参数或,就是事先对总体参数或总体分布形式作出一个假设,然后利用总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。从而决定是否接受或否定原假设。1、假设检验采用的逻辑推理方法是反证法、假设检验采用的逻辑推理方法是反证法 为了检某假设是否成立,先假定它正
2、确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设;判断结果合理与否,是基于“小概率事件不易发生”这一原理的 即在一次抽样中,小概率事件不可能发生。如果在原假设下发生了小概率事件,则认为原假设是不合理的;反之,小概率事件没有发生,则认为原假设是合理的。2、假设检验是基于样本资料来推断总体、假设检验是基于样本资料来推断总体特征的,而这种推断是在一定概率置信特征的,而这种推断是在一定概率置信度下进行的,而非严格的逻辑证明。度下进行的,而非严格的逻辑证明。因此,置信度大小的不同,有可能做出不同的判断。三、假设检验中的两类错误三、假设检验中的两类错误 由于假设检验是根据有限
3、的样本信息来推断总体特征,由样本的随机性可能致使判断出错。(一)第一类错误 当原假设为真时,而拒绝原假设所犯的错误,称为第I类错误或拒真错误。易知犯第I类错误的概率就是显著性水平 P拒绝H0|H0为真=(二)第二类错误(二)第二类错误 当原假设为假时,而接受原假设所犯的错误,当原假设为假时,而接受原假设所犯的错误,称称为第为第II类错误类错误或取伪错误取伪错误。犯第II类错误的概率常用 表示 P接受接受H0|H0不正确不正确=H H0 0:无罪无罪无罪无罪陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪无罪无罪正确正确错误错误有罪有罪错误错误正确正确H0 检验检验决策决策实际情况实
4、际情况H0为真为真H0为假为假未拒绝未拒绝H0正确决策正确决策(1 )第第类错误类错误()拒绝拒绝H0第第类错误类错误()正确决策正确决策(1-(1-)假设检验就好像假设检验就好像假设检验就好像假设检验就好像一场审判过程一场审判过程一场审判过程一场审判过程统计检验过程统计检验过程统计检验过程统计检验过程原假设 H0结论真实错误拒绝H0第I 类错误 正确 1-接受H0正确 1-第II类错误1、犯第一类错误与犯第二类错误的概率存在此消彼长的关系;2、若要同时减少若要同时减少 与与 ,须增大样本容量,须增大样本容量n。3、通常的作法是通常的作法是,取显著性水平较小,即控制犯第一,取显著性水平较小,即
5、控制犯第一类错误的概率在较小的范围内;类错误的概率在较小的范围内;4、在犯第二类错误的概率不好控制时,将在犯第二类错误的概率不好控制时,将“接受原假接受原假设设”更倾向于说成更倾向于说成“不拒绝原假设不拒绝原假设”。注意:注意:假设检验的步骤(1)建立检验假设和确定检验水准(2)选定检验方法和计算检验统计量(3)确定P值和做出推断结论(1)建立检验假设和确定检验水准在均数的比较中,检验假设是针对总体特征而言,包括相互对立的两个方面,即两种假设:原假设为正待检验的假设:H0;备择假设为可供选择的假设:H1 一般地,假设有三种形式:(1 1)双侧检验)双侧检验:H0:0;H1:0 (2 2)左侧检
6、验)左侧检验:H0:0;H1:0 或 H0:0;H1:0 或 H0:0 双侧检验和单侧检验在进行t 检验时,如果其目的在于检验两个总体均数是否相等,即为双侧检验。例如检验某种新降压药与常用降压药效力是否相同?就是说,新药效力可能比旧药好,也可能比旧药差,或者力相同,都有可能。如果我们已知新药效力不可能低于旧药效力,例如磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用磺胺药,这时,无效假设为H0,备择假设为H1:u1u2,统计上成为单侧检验。(2)选择显著性水平当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。用表示。=0.05(即5%)或=0.01(
7、即1%)ho,h1和 的确定,以及单侧检验或双侧检验的选择,都应结合研究设计,在未获得样本结果之前决定,而不受样本结果的影响。(3)确定P值和做出推断结论P值是指由ho成立时的检验统计量出现在由样本计算出来的检验统计量的末端或更末端处的概率值。当P 时,结论为按所取检验水准拒绝ho,接受h1,这样做出结论的理由是:在ho成立的条件下,出现等于及大于现有检验统计量值的概率P,是小概率事件,这在一次抽样中是不大可能发生的,即现有样本信息不支持ho因而拒绝它;如P,即样本信息支持ho,就没有理由拒绝它,此时只好接受它。t 检验t检验亦称student t 检验。t检验的用途:样本均数与总体均数的比较
8、,即单样本t检验 来自于同一总体彼此独立的两个不同样本,比较不同类别的显著性差异,即独立样本t检验 两样本均数的比较,即配对样本t检验t检验的应用条件:当样本数较小时,要求样本取自正态总体;做两样本均数比较时,还要求两样本的总体方差相等(1)已知一个总体均数u;(2)可得到一个样本均数及该样本标准差;(3)样本来自正态或近似正态总体。T检验计算方式 样本均数与总体均数的比较的t 检验,即单样本t 检验。比较的目的是推断样本所代表的未知总体均数与已知的总体均数uo有无差别。首先对所估计的总体提出一个假设,如:假设这个总体的平均数 等于某个值uo,然后通过样本去推断这个假设是否可以接受,如果可以接
9、受,样本很可能来自这个总体;否则很可能不是来自这个总体.单样本的单样本的T T检验检验【例【例1】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?10个零件尺寸的长度个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3H0:=12 检验统计量检验统计量检验统计量检验统计量:
10、H1:12 =0.05df=10-1=9临界值临界值(c):决策:不拒绝决策:不拒绝ho 结论:结论:该供货商提供零件符合要求该供货商提供零件符合要求 t t0 02.2622.262-2.262-2.2620.0250.025拒绝拒绝 H0 H0拒绝拒绝 H0 H00.0250.025独立样本的独立样本的T T检验检验要求要求要求要求:a.a.被比较的两组样本彼此独立被比较的两组样本彼此独立,没有配没有配对关系对关系 b.b.两组样本均来自两组样本均来自正态总体正态总体 c.c.均值均值是对于检验有意义的描述统计量是对于检验有意义的描述统计量两组样本方差相等和不等时使用的计算两组样本方差相等
11、和不等时使用的计算t t值值的公式不同。因此应该先对方差进行齐次性的公式不同。因此应该先对方差进行齐次性检验。检验。SPSSSPSS的输出,在给出方差齐和不齐两的输出,在给出方差齐和不齐两种计算结果的种计算结果的t t值,和值,和t t检验的显著性概率的检验的显著性概率的同时,还给出对方差齐次性检验的同时,还给出对方差齐次性检验的F F值和值和F F检检验的显著性概率。验的显著性概率。用户需要根据用户需要根据F F检验的结果自己判断选择检验的结果自己判断选择t t检验输出中的哪个结果,得出最后结论。检验输出中的哪个结果,得出最后结论。进行方差齐次检验使用进行方差齐次检验使用F F检验。对应的零
12、检验。对应的零假设是假设是:两组样本方差相等。概率两组样本方差相等。概率p0.05 p -比较均值比较均值-独立样本独立样本T T检验(检验(T T)检验变量检验变量:要求平均值的变量:要求平均值的变量分组变量(只能分成分组变量(只能分成两组两组):1 1,2 2结果中比较有用的值:方差齐次性检验结果中比较有用的值:方差齐次性检验F F的的SigSig和和方差相等或不相等的方差相等或不相等的SigSig(Sig Sig为显著性概率值)为显著性概率值)例例例例2:2:2:2:下表为某银行中的男女职工中下表为某银行中的男女职工中下表为某银行中的男女职工中下表为某银行中的男女职工中3 3 3 3月份
13、的工资表,试分析出月份的工资表,试分析出月份的工资表,试分析出月份的工资表,试分析出该该该该银行男女雇员的平均工资是否有显著性差异银行男女雇员的平均工资是否有显著性差异。(置信区间。(置信区间百分比为百分比为95%95%)雇员编号雇员编号性别性别工资工资101男5300102男5600103女5550104男4000105女4600106女4300107男5100108女5900109女5200110男4100111女4600112男4700分析:根据上表建立数据集如下:分析:根据上表建立数据集如下:独立样本独立样本独立样本独立样本T T T T检验检验检验检验对话框对话框对话框对话框及设置:
14、及设置:及设置:及设置:输出结果:输出结果:P P P P值值值值=0.=0.=0.=0.7127127127120.00.00.00.05 5 5 5,应接受原假设,即可以认为,应接受原假设,即可以认为,应接受原假设,即可以认为,应接受原假设,即可以认为该该该该银行银行银行银行男女男女男女男女雇员的工资雇员的工资雇员的工资雇员的工资不存在显著差异。不存在显著差异。不存在显著差异。不存在显著差异。在在SPSS中,中,P值被定义值被定义为所对应为所对应t值分布一侧面值分布一侧面积的双倍。因为双侧检验积的双倍。因为双侧检验时,可直接比较时,可直接比较P值与值与值值的大小;若为单侧检验,的大小;若为
15、单侧检验,则需比较则需比较P值与值与2值的大值的大小。小。配对样本的t 检验配对设计是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对因素是影响实验效应的主要非处理因素。-例如,在动物实验中,常将窝别、性别相同,体重相近的两个动物配成对子;-人群试验中,常将性别相同、年龄相近的两个人配成对子,这样可提高各处理组间的均衡性。配对样本分三种情况:配成对子的同对受试对象分别给予两种不同的处理,其目的是推断两种处理的效果有无差别;同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别;同一受试对象处理前后的比较,其目的是推断某种处理有无作用。用于检验两配对总
16、体的均值是否具有显著性差异用于检验两配对总体的均值是否具有显著性差异(其前其前提是两样本具有配对关系,且其来自的总体均服从正提是两样本具有配对关系,且其来自的总体均服从正态分布态分布)实质是检验每对测量值差值变量的均值与零之间差异实质是检验每对测量值差值变量的均值与零之间差异的显著性,若差异不显著,则说明配对变量均值之间的显著性,若差异不显著,则说明配对变量均值之间的差异不显著;的差异不显著;公式:对于配对样本数据,应该首先计算出各对差值的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值的总体均数应该为0,故可将配对样本资料的假设检验视为样本均数与总体均数=0的比较,所用方法为配对t
17、检验为差值d的标准差。操作:操作:菜单:菜单:分析分析-比较均值比较均值-配对样本配对样本T T检验(检验(P P)注:成对变量(注:成对变量(V V):设置配对变量设置配对变量例例310101010个高血压患者在施以体育疗法前后测定舒个高血压患者在施以体育疗法前后测定舒个高血压患者在施以体育疗法前后测定舒个高血压患者在施以体育疗法前后测定舒张压,要求判断体育疗法对降低血压是否有张压,要求判断体育疗法对降低血压是否有张压,要求判断体育疗法对降低血压是否有张压,要求判断体育疗法对降低血压是否有效,数据编号效,数据编号效,数据编号效,数据编号为为为为3 3 3 3。患者编号患者编号患者编号患者编号
18、疗法前疗法前疗法前疗法前疗法后疗法后疗法后疗法后 1 12 23 34 45 56 67 78 89 91010112112113113134134110110125 125 117117108 108 120 120 118 118 1381381041049696103 103 909010810811911992929090102102121121配对样本配对样本t t检验实例检验实例:分析:根据述信息建立数据集如下:分析:根据述信息建立数据集如下:配对样本配对样本配对样本配对样本T T T T检验检验检验检验对话框对话框对话框对话框和设置:和设置:和设置:和设置:指定配对变量指定配对变
19、量指定配对变量指定配对变量输出结果:输出结果:P P P P值值值值=0.000=0.000=0.000=0.0000.050.050.050.05,应拒绝原假设,表明体育疗法,应拒绝原假设,表明体育疗法,应拒绝原假设,表明体育疗法,应拒绝原假设,表明体育疗法对降低血压有效。对降低血压有效。对降低血压有效。对降低血压有效。配对样本配对样本t检验与独立样本检验与独立样本t检验的区别检验的区别:1.独立独立样样本本过过程用于程用于检验检验两个独立两个独立样样本是否来自本是否来自具有相同均具有相同均值值的的总总体。配体。配对样对样本用于本用于检验检验两个相两个相关的关的样样本是否来自具有相同均本是否
20、来自具有相同均值值的正的正态总态总体。体。2.独立独立样样本是指不同本是指不同样样本平均数的比本平均数的比较较,而配,而配对样对样本往往是本往往是对对相同相同样样本二次平均数的本二次平均数的检验检验。启示:启示:假设检验注意事项假设检验注意事项35二、假设检验应注意的问题1.要有严密的研究设计 这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近(控制变量)。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。362.不同的资料应选用不同检验方法 应根据分析目
21、的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。373.正确理解“显著性”一词的含义 差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。384.结论不能绝对化 因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。
22、395.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。40 6.置信区间与假设检验各自不同的作用,要结合使用。一方面一方面,置信置信区间区间亦可回答亦可回答假设检验假设检验的问题,的问题,算算得的得的置信置信区间若包含了区间若包含了H H0 0,则按,则按 水准,不拒绝水准,不拒绝H H0 0;若;若不包含不
23、包含H H0 0,则按,则按 水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1。另一方面另一方面,置信置信区间不但能回答差别有无统计学区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。差别有无实际的专业意义。41 虽然虽然置信区间置信区间亦可回答亦可回答假设检验假设检验的的问题问题,并能提供更多的信息,并能提供更多的信息,但并不意但并不意味着置信区间能够完全代替假设检验。味着置信区间能够完全代替假设检验。置信区间只能在预先规定的概率置信区间只能在预先规定的概率()的前提下进行计算,而假设检验能够获的前提下进行计算,而假设检验能够获得一较为得一较为确切的概率确切的概率P值值。42