1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第四章,t,-,检验,百分率资料的假设检验,小样本均数的假设检验,统计假设检验的基本原理,统计假设检验又称为显著性检验,是生物统计学的核心内容,是统计推断的主要组成部分,第一节 统计假设检验的基本原理,统计推断(,statistical inference,)就是通过样本特征(统计量)来推断相应总体特征(参数)的方法,参数估计(,parametric estimate,),通过样本统计量估计总体参数的方法,点估计(,point estimate,),区间估计(,interval estimate,),直接用
2、样本统计量的数值估计出相应总体参数具体值的方法,在一定的概率保证下(一般为,95%,或,99%,),根据样本统计量的分布,计算出总体参数出现的数值范围或区间,用该区间来估计总体参数的方法,参数估计是对总体参数的,定量分析,统计假设检验(,hypothesis test,),根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本观测值和统计量的分布,通过一定的计算,再作出在一定概率意义上应当接受哪种假设的方法,统计假设检验的假设是对总体提出的,最后检验的结论只有两种:要比较的总体参数间要么存在显著差异,要么不存在显著差异,统计假设检验是对总体参数的,定性分析,1.,统计假设检
3、验的意义,以两个平均数之间差异的显著性检验,t-,检验为例,现随机挑选,10,名中国美女和,10,名韩国美女,请世界选美大赛评委和观众进行评分,试比较哪个国家美女更美?,9.99,9.85,9.99,9.95,9.98,9.97,9.95,9.95,中国美女的平均得分,9.98,韩国美女的平均得分,9.91,两个国家美女的平均得分并不相等,其差值(表面效应)为:,根据两个样本平均数的差值,0.07,,是否可以给两个样本所在总体的总体平均数下这样的结论:,中国美女总体的平均得分高于韩国美女总体的平均得分,中国美女比韩国美女漂亮,如果从经典数学的角度来看,答案应该是肯定,如果从生物统计学的角度来看
4、在未经过统计假设检验以前,只能说“不一定”,事实上,仅仅凭借样本平均数之差不等于,0,就得出其所属的总体平均数不相等是不可靠的,实际上,进行试验研究的目的并不在于了解样本的结果,而是要通过样本了解总体,通过样本来推断总体,从而对总体给出一个全面的结论,在统计学中,一般用样本平均数 、,作为统计假设检验的对象,、,以样本平均数差数的大小来对样本所在的总体平均数,1,与,2,是否相同作出统计推断,以样本平均数作为检验对象的依据:,离均差平方和为最小,说明样本平均数与样本中各个观测值之间相差最小,因此,平均数是一个样本资料的最好代表值,样本平均数是总体平均数的无偏估计值,根据中心极限定理,样本平均
5、数服从或逼近正态分布,实际上,每个观测值(数据)都只是试验的表面效应,而表面效应一般由两部分组成:,试验的处理效应,试验的随机误差,样本中每一观测值,x,i,可以被分解成两部分:,处理效应:,用总体平均数,表示,误差效应:,用随机误差,表示,样本平均数为:,总体平均数,样本平均数的差数也可分解成,2,部分:,误差平均数,表面,效应,处理效应,抽样误差,2.,统计假设检验的步骤,统计假设检验的基本原理和思路:,首先根据具体试验目的提出一个假设,然后在假定该假设成立(或正确)的前提下进行试验,并取得数据,接着对这些资料进行统计分析,获得该假设成立的概率,最后根据所获得的概率值的大小来判断假设是否成
6、立,如果所得概率较大,就表明我们没有足够的理由来否定所作假设,即必须接受这一假设,如果所得概率较小,就表明这一假设不大可能成立,应予否定,从而接受其对立假设,例,4-1,:通过以往的大规模调查,已知某地成年黑白花奶牛产奶量为,52.3,,标准差为,5.38,,现测得,10,头黑白花奶牛产奶量分别为,53.6,,,55.3,,,46.4,,,57.2,,,46.0,,,43.2,,,48.1,,,51.1,,,49.9,,,44.5,;,=49.53,。试问这批黑白花奶牛是否来自于某地黑白花奶牛总体?,(,1,),对所研究的总体提出假设,研究某一随机样本所在的总体(用,表示)和一已知总体(用,0
7、表示)是否为同一总体,也就是研究这一随机样本是否来自于已知总体,假设:,两个总体为同一个总体(即两个总体的总体平均数相等),无效假设(,null hypothesis,),用,H,0,表示,即,H,0,:,=,0,无效假设的含义:,无效假设就是假设两总体的平均数相等,即,H,0,:,假设样本平均数,与已知总体平均数,由,抽样误差,引起的,并不是两总体之间的真实差异,两总体之间的差异是由抽样误差所引起的,为了在无效假设被否定后有可以被接受的假设,因此应在设立无效假设的同时设立一个后备假设,备择假设(,alternative hypothesis,),用,H,A,表示,即,H,A,:,备择假设的
8、统计学意义:,样本所在总体与已知总体不是同一个总体,即两总体的平均数不等,即:,两总体之间的差异,是真实差异,而不是由抽样误差引起的,统计假设检验中完整的假设是:,两总体之间的差异是真实差异,(,2,),在假定无效假设成立的前提下,研究样本平均数的抽样分布,计算样本平均数出现的概率,样本平均数与总体平均数间有一个实际存在的差值:,这个差值就是表面效应,可能是抽样误差,也可能是真实差异,因此需要借助概率原理来进行判断,第一种方法:计算差值,-2.77,出现的概率,在无效假设成立的前提下,样本所在的总体与已知总体为同一个总体,因此样本所在总体的总体平均数和方差已知,即:,由于总体方差已知,根据标准
9、正态分布就可以计算出差值,-2.77,出现的概率,0.10.11,第二种方法:计算样本平均数的接受区间,根据标准化公式计算样本平均数的接受区间:,接受区间,否定区间,接受区间和否定区间是有一定的概率保证的,保证概率为,1-,,常用的保证概率为,95%,和,99%,;,为显著水平,常用的显著水平有,0.05,和,0.01,倘若样本平均数落在接受区间内,就接受,H,0,,反之,倘若样本平均数落在接受区间之外,就否定,H,0,,接受,H,A,作为,0.05,显著水平上接受或否定无效假设的两个临界值,作为,0.01,显著水平上接受或否定无效假设的两个临界值,95%,的接受区间为:,99%,的接受区间为
10、3,),根据“小概率事件实际不可能性原理”接受或否定无效假设,小概率事件实际不可能性原理是指在一次试验中,概率很小的事件是不可能出现的,在统计学中,当样本平均数与总体平均数差值出现的概率小于,5%,时,就认为这种差异由抽样误差引起的概率较小,而是两总体间的真实性差异,从而否定无效假设,差值,-2.77,出现的概率为,0.10.11,,大于,0.05,,概率较大;说明样本平均数与已知总体的总体平均数之间的差异是抽样误差的概率较大,而不大可能是真实差异,接受无效假设,也就是说这批黑白花奶牛是来自于某地黑白花奶牛总体。,总结:统计假设检验的步骤,(,1,)提出假设,(,2,)计算样本平均数抽
11、样分布的,t,值或,u,值,(,3,)查附表,根据小概率原理作出接受或者否定无效假设的推断,并结合专业知识作出合理的、科学的解释,例,4-2,:,1995,年,已知某地,20,岁应征男青年的平均身高为,168.5cm,。,2005,年在当地,20,岁应征男青年中随机抽取,85,人,平均身高为,171.2cm,,标准差为,5.3cm,,问,2005,年当地,20,岁应征男青年的身高与,1995,年的是否相同,?,解:,(,1,)提出假设,H,0,:,=168.5,H,A,:,168.5,与,1995,年相比,,2005,年当地,20,岁应征男青年的身高没有变化,与,1995,年相比,,2005,
12、年当地,20,岁应征男青年的身高有变化,(,2,)计算,u,值,(,3,)查表,作出推断,u,0.05,=1.96,,,u,0.01,=2.58,|,u,|=4.70,2.58=,u,0.01,,,P,0.01,根据“小概率事件原理”可以认为无效假设不成立,因此否定无效假设,接受备择假设,样本不是来自于已知总体,即,2005,年当地,20,岁应征男青年的身高有变化,比,1995,年增高了,在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,用来确定否定或接受无效假设的概率标准称为显著水平,记作,若,|,u,|,u,0.05,P,0.05,,,说明表面效应属于试验误差的可能
13、性大,不能否定无效假设,,两个总体平均数间,差异不显著,若,u,0.05,|,u,|,u,0.01,P,0.05,,,说明表面效应属于试验误差的概率,P,在,0.01-0.05,之间,表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设,两个总体平均数间,差异显著,标记,*,若,|,u,|,u,0.01,P,0.01,,,说明表面效应属于试验误差的概率,P,不超过,0.01,,表面效应属于试验误差的可能性更小,应否定无效假设,接受备择假设,两个总体平均数间,差异极显著,标记,*,课堂练习:太湖猪母猪成年体重为,75,,现从太湖猪产区随机抽得,60,个个体,平均成年体重为,70.8,,
14、S=11.32,,问该样本群就成年体重这一性状来看,是否与总体符合?,3.,一尾检验和两尾检验,所研究样本的样本平均数,有可能大于已知总体的总体平均数,也有可能小于已知总体的总体平均数,即计算所得的,u,值可能会落在标准正态分布左边否定区,也有可能会落在右边否定区,既考虑左边否定区又考虑右边否定区即考虑分布曲线两尾的检验称为两尾检验(,two-tailed test,),在很多情况下,事先并不知道所抽样本的样本平均数是不是肯定大于总体平均数或肯定小于总体平均数,因此,备择假设,H,A,:,0,中,有两种可能性存在,既包括,0,,又包括,0,两尾检验是生物统计学中最常用的方法,应用范围极其广泛
15、有些时候,试验目的是明确的,即所抽样本的样本平均数只可能大于总体平均数,0,,或只可能小于总体平均数,0,在这种情况下,无效假设否定后的备择假设只有一种情况:要么,0,,要么,0,只有一个否定区(一尾)的假设检验称为一尾检验(,one-tailed test,),两尾检验的假设:,H,0,:,=,0,,,H,A,:,0,一尾检验的假设:,H,0,:,0,,,H,A,:,0,在样本容量和显著水平相同的情况下,一尾检验的效率高于两尾检验,一尾检验比两尾检验更容易否定无效假设,若对同一资料进行两尾检验和一尾检验,那么在,水平上一尾检验显著,只相当于两尾检验在,2,水平上显著。所以,同一资料两尾检验
16、与一尾检验所得的结论不一定相同,两尾检验显著,一尾检验一定显著,一尾检验显著,两尾检验未必显著,4.,假设检验的两类错误,在假设检验中,接受或者否定无效假设的依据是“,小概率事件实际不可能性原理,”,因此所得出的结论(不论是接受还是否定无效假设)都没有,100%,的把握,只是在一定的概率范围内认为这种结论是正确的,4.1,第一类错误,如果无效假设,H,0,成立,即,H,0,:,=,0,为真,但:,检验结果发现“差异显著”而否定了它(此时,只有,95%,的把握,要冒,5%,下错结论的风险),检验结果发现“差异极显著”而否定了它(此时,只有,99%,的把握,要冒,1%,下错结论的风险),这一类错误
17、称为,型错误或,型错误,型错误的实质就是把非真实差异(抽样误差)错判为真实差异,即:,H,0,:,=,0,为真,却接受了,H,A,:,0,弃真,H,0,正确被否定,犯,型错误的概率不会超过显著水平,(,5%,、,1%,),4.2,第二类错误,如果无效假设,H,0,不成立,即,H,0,:,=,0,为假,但:,检验结果发现“差异不显著”而接受了它,同时放弃了正确的备择假设,在统计学中所谓的“差异不显著”就是指没有充分的理由去否定无效假设,但也没有充分的理由去接受备择假设,但生物统计学实行的是“非此即彼”的原则,因此,既然“差异不显著”就必须接受无效假设。,这一类错误称为,型错误或,型错误,型错误的实质就是把真实差异错判为非真实差异,即虽然,H,0,:,=,0,是假的,但通过检验却接受了,存伪,H,0,错误被接受,“差异不显著”不是指没有差异,它存在,2,种可能:一是两总体间的确没有差异,平均数间的差异纯属抽样误差;二是两总体间有差异,但由于实验误差大而掩盖了这一差异。,统计推断的基本特点就是“,有很大的可靠性,但也有一定的错误率,”,两类错误与假设的关系,客 观 实 际,接 受,H,0,否 定,H,0,无效假设,H,0,成立,推断正确(,1-,),型错误(,)“弃真”,无效假设,H,0,不成立,型错误(,)“存伪”,推断正确(,1-,),






