资源描述
書式設定,書式設定,第,2,第,3,第,4,第,5,#,假设检验,假设检验是在两种互相对立的行动之间,通过对样本的试验,在一定的保证条件下进行决策的统计分析方法。,假设检验在统计方法中的地位,统计方法,描述统计,推断统计,参数估计,假设检验,例子,:,1.,康涅狄格州高速公路巡警对超速驾驶者实施严厉制裁后高速公路交通事故死亡人数下降。,怀俄明州杰克逊谷地公共卫生工程队的垃圾处理量是平均每周,247,吨。,传统上,假设检验都是以否定句的形式表示。,以否定句的形式表述的假设为,原假设,(假设什么也未发生),(一)假设检验的意义和程序,1.,设立假设。,2.,作检验统计量。,3.,确定显著性水平,及相应的,t,值。,4.,确定拒绝域。,5.,作出决策。,(二)假设检验的内容,1.,双侧检验,2.,单侧检验,(一)假设检验的意义,假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。,(二)假设检验的步骤,1,.,问题的提出:对问题详加调查研究之后,根据试验或观察数据来选择一个适宜的概率模型,2,.,假设的设立:陈述假设,即提出一个零假设和一个备择假设3,.,确定检验统计量:识别被检验的统计量及其分布,4,.,确定显著性水平,5,.,作出判断:计算被检验的实际统计量之值,用实际统计量之值与临界值比较,以确定接受或拒绝,1.,什么是假设检验,假设检验,是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。,统计假设有参数假设、总体分布假设、相互关系假设(,两个变量是否独立,两个分布是否相同,)等。,参数假设,是,对总体参数的一种看法。总体参数包括总体均值、总体比例、总体方差等。分析之前必需陈述。,我认为该企业生产的零件的平均长度为4厘米!,参数假设检验,参数假设检验,是通过样本信息对关于总体参数的某种假设合理与否进行检验的过程。即先对未知的总体参数的取值提出某种假设,然后抽取样本,利用样本信息去检验这个假设是否成立。如果成立就接受这个假设,如果不成立就放弃这个假设。,下面主要讨论参数假设检验的问题。,参数假设检验举例,:,例,1,:根据1989年的统计资料,某地女性新生儿的平均体重 为,3190克,。为判断该地1990年的女性新生儿体重与1989年相比有无显著差异,从该地1990年的女性新生儿中随机抽取30人,测得其平均体重为,3210克,。,从样本数据看,1990年女新生儿体重比1989年略高,但这种差异可能是由于抽样的随机性带来的,也许这两年新生儿的体重并没有显著差异。究竟是否存在显著差异?可以先假设这两年新生儿的体重没有显著差异,然后利用样本信息检验这个假设能否成立。,这是一个关于总体均值的假设检验问题。,例,2,:某种大量生产的袋装食品,按规定每袋重量不得少于250克,现从一批该种食品中任意抽取50袋,发现有6袋重量低于250克。若规定食品不符合标准的比例达到5就不得出厂,问该批食品能否出厂。可以先假设该批食品的不合格率不超过5,然后用样本不合格率来检验假设是否正确。,这是一个关于总体比例的假设检验问题。,2.,假设检验的基本思想,假设检验所依据的基本原理是小概率原理。,什么是小概率?,概率是01之间的一个数,因此小概率就是接近0的一个数,著名的英国统计家,Ronald Fisher,把20分之1作为标准,也就是0.05,从此0.05或比0.05小的概率都被认为是小概率,Fisher,没有任何深奥的理由解释他为什么选择0.05,只是说他忽然想起来的,什么是小概率原理?,小概率原理,发生概率很小的随机事件(小概率事件)在一次实验中几乎是不可能发生的。,根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。,检验中使用的小概率是检验前人为指定的。,下面我们用一例说明这个原则,.,小概率事件在一次试验中基本上不会发生,.,这里有两个盒子,各装有,100,个球,.,一盒中的白球和红球数,99,个红球,一个白球,99,个,另一盒中的白球和红球数,99,个,白球,一个,红球,99,个,小概率事件在一次试验中基本上不会发生,.,现从两盒中随机取出一个盒子,问这个盒子里是白球,99,个还是红球,99,个?,小概率事件在一次试验中基本上不会发生,.,我们不妨先假设:,这个盒子里有,99,个白球,.,现在我们从中随机摸出一个球,发现是,此时你如何判断这个假设是否成立呢?,假设其中真有,99,个白球,摸出红球的概率只有,1/100,,这是小概率事件,.,这个例子中所使用的推理方法,可以称为,小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设,.,带概率性质的反证法,不妨称为概率反证法,.,小概率事件在一次试验中基本上不会发生,.,它不同于一般的反证法,概率反证法的逻辑是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设,.,一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设,.,在假设检验中,我们称这个小概率为,显著性水平,(Level of significance),,用,表示,.,常取,简而言之,我们确定拒绝原假设时究竟需要多大的把握性,取决于我们所涉及问题的重要性。,的选择要根据实际情况而定,.,社会学家惯用,0.05,的概率作为拒绝原假设的依据。,但对许多管理问题而言,,0.05,的概率所隐藏的风险可能太大。,如,120,急救中心可以确认,一个员工在任意一天不能够处理所有可能求援电话的概率是,0.05,,这就意味着每隔,20,天就有一天,或每,3,星期就有一次无法对病人进行援助,这个场合中,,0.05,的水平包含风险太大,,0.001,的水平,或说,3,年失败一次的风险,可能更容易被接受。,对于警察局,一辆警车的出警概率为,0.05,是可以接受的。,但对于消防队而言,必须确保自己的消防水管失灵的概率不超过,0.0001,。,的选择要根据实际情况而定,.,假设检验的基本思想,.因此我们拒绝假设,=50,.如果这是总体的真实均值,样本均值,m,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值.,20,假设检验的两个特点:,第一,,,假设检验采用逻辑上的反证法,,即为了检验一个假设是否成立,首先假设它是真的,然后对样本进行观察,如果发现出现了不合理现象,则可以认为假设是不合理的,拒绝假设。否则可以认为假设是合理的,接受假设。,第二,,,假设检验采用的反证法带有概率性质,。所谓假设的不合理不是绝对的,而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件,并没有统一的界定标准,而是必须根据具体问题而定。,假设检验的两个特点:,如果一旦判断失误,错误地拒绝原假设会造成巨大损失,那么拒绝原假设的概率就应定的小一些;如果一旦判断失误,错误地接受原假设会造成巨大损失,那么拒绝原假设的概率就应定的大一些。,小概率通常用 表示,又称为检验的显著性水平。,通常取,0.05,或,0.01,,即把概率不超过0.05或0.01的事件当作小概率事件。,3.,假设的设立:原假设和备择假设,假设检验中,我们称作为检验对象的待检验假设为,原假设或零假设,用,H,0,表示,。原假设的对立假设称为,备择假设或备选假设,用,H,1,表示,。,例如,设,0,为总体均值,的某一确定值。,例,1.,对于总体均值,是否,等于,某一确定值,0,的原假设可以表示为:,H,0,:,0,(,如,H,0,:3190,克),其对应的 备择假设则表示为:,H,1,:,0,(如,H,1,:3190,克),原假设和备择假设,例,2.,对于总体均值,是否,小于,某一确定值,0,的原假设可以表示为:,H,0,:,0,(,如,H,0,:5,),其对应的备择假设则表示为:,H,1,:,0,(如,H,1,:5,),注意:原假设总是有等号:,=,或,或,4.,假设检验:双侧检验和单侧检验,根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。,若原假设是总体参数等于某一数值,,如,H,0,:,0,,即备择假设,H,1,:,0,,那么只要,0,和,0,二者中有一个成立,就可以否定原假设。,这种假设检验称为双侧检验,。,4.,假设检验:双侧检验和单侧检验(续),若原假设是总体参数大于等于或小于等于某一数值,,如,H,0,:,0,(即,H,1,:,0,),;或,H,0,:,0,(即,H,1,:,0,),那么对于前者当,0,时,对于后者当,0,时,可以否定原假设。,这种假设检验称为单侧检验,。,可以分为左侧检验和右侧检验,。,双侧检验与单侧检验,(假设的形式),假设,研究的问题(总体均值检验),双侧检验,左侧检验,右侧检验,H,0,m,=,m,0,m,m,0,m,m,0,H,1,m,m,0,m,m,0,5.,假设检验中的拒绝域和接受域,在规定了检验的显著性水平,后,根据容量为,n,的样本,按照统计量的理论概率分布规律,可以确定据以判断拒绝和接受原假设的检验统计量的,临界值,。,临界值,将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。,对于正态总体,总体均值的假设检验可有如下图示:,正态总体,总体均值假设检验图示:(1)双侧检验,设,H,0,:,0,,,H,1,:,0,,有两个临界值,两个拒绝域,每个拒绝域的面积为,/2。,也称双尾检验,。,双侧检验示意图,0,双侧检验示意图,(显著性水平与拒绝域),抽样分布,H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,接受域,1-,置信水平,双侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,接受域,抽样分布,1-,置信水平,观察到的样本统计量,双侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,接受域,抽样分布,1-,置信水平,观察到的样本统计量,双侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,接受域,抽样分布,1-,置信水平,观察到的样本统计量,(2)单侧检验,有一个临界值,一个拒绝域,拒绝域的面积为,。,分为左侧检验和右侧检验两种情况。,单侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,a,样本统计量,拒绝域,接受域,抽样分布,1-,置信水平,1,)左侧检验,设,H,0,:,0,,,H,1,:,0,;,临界值和拒绝域均在左侧,。,也称下限检验,。,0,左侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,a,样本统计量,拒绝域,接受域,抽样分布,1-,置信水平,观察到的样本统计量,左侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,a,样本统计量,拒绝域,接受域,抽样分布,1-,置信水平,观察到的样本统计量,2,)右侧检验,设,H,0,:,0,,,H,1,:,0,;临界值和拒绝域均在右侧,。,也称上限检验,。,0,右侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,a,样本统计量,拒绝域,接受域,抽样分布,1-,置信水平,观察到的样本统计量,右侧检验示意图,(显著性水平与拒绝域),H,0,值,临界值,a,样本统计量,接受域,抽样分布,1-,置信水平,拒绝域,观察到的样本统计量,6.,假设检验的两类错误,根据假设检验做出判断无非下述四种情况:,原假设真实,并接受原假设,判断正确,原假设不真实,且拒绝原假设,判断正确,原假设真实,但拒绝原假设,判断错误,原假设不真实,却接受原假设,判断错误,6.,假设检验,的两类错误,假设检验是依据样本提供的信息进行判断,有犯错误的可能。所犯错误有两种类型:,第一类错误,是原假设,H,0,为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用,表示,,也称作,错误(,error),或弃真错误。,第二类错误,是原假设,H,0,不为真时,检验结果把它当成真而接受了。犯这种错误的概率用,表示,,也称作,错误(,error),或取伪错误。,假设检验的两类错误,正确决策和犯错误的概率可以归纳为下表:,假设检验中各种可能结果的概率,接受,H,0,拒绝,H,0,,接受,H,1,H,0,为真,1-,(正确决策),(弃真错误),H,0,为伪,(取伪错误),1-,(正确决策),假设检验两类错误关系的图示,以单侧上限检验为例,设,H,0,:,0,,,H,1,:,0,弃真错误区,取伪错误区,从上图可以看出,如果临界值沿水平方向右移,,将变小而,变大,即若减小,错误,就会增大犯,错误的机会;如果临界值沿水平方向左移,,将变大而,变小,即若减小,错误,也会增大犯,错误的机会。,图(,a),0,H,0,为真,图(,b),1,0,H,0,为伪,错误和,错误的关系,你不能同时减少两类错误!,和的关系就像翘翘板,,小,就大,,大,就小,在样本容量,n,一定的情况下,假设检验不能同时做到犯,和,两类错误的概率都很小。若减小,错误,就会增大犯,错误的机会;若减小,错误,也会增大犯,错误的机会。要使,和,同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检验需要慎重考虑对两类错误进行控制的问题。,7.,假设检验中的,P,值,(P-value),P,值是用于确定是否拒绝原假设的另一重要工具,是现代统计检验中常用的检验统计量。,传统的统计量检验方法是事先确定检验的显著性水平,明确拒绝域,检验时只要检验统计量的值落入拒绝域就拒绝原假设。但只给出检验结论可靠性(或犯弃真错误)的大致范围,无法给出某一样本观测结果与原假设不一致程度的精确度量。,P,值是当原假设为真时,得到特定样本观测结果及更极端结果的概率,其具体取值可以用计算机统计软件计算出来。,如果,P,值很小,说明这种样本观测结果出现的可能性很小,有理由拒绝原假设。,P,值越小,拒绝原假设的理由就越充分。,影响,P,值的因素:,样本数据与原假设值之间的差异,样本量的大小,被假设参数的总体分布,利用,P,值进行假设检验的准则:,将,P,值与事先,确定的检验显著性水平,进行比较,若,P,值小于,,,说明小概率事件发生,则拒绝原假设;若,P,值大于,,,说明小概率事件没有发生,则不能拒绝原假设。,双侧检验的,P,值图示,/,2,/,2,样本统计量,拒绝,拒绝,H,0,值,临界值,计算出的统计量值,计算出的统计量值,临界值,1/2,P,值,1/2,P,值,抽样分布图,左侧检验的,P,值图示,H,0,值,临界值,a,样本统计量,拒绝域,抽样分布图,1-,置信水平,计算出的统计量值,P,值,右侧检验的,P,值图示,H,0,值,临界值,a,拒绝域,抽样分布图,1-,置信水平,计算出的统计量值,P,值,样本统计量,8.,假设检验的步骤,1.,问题的提出,2.,根据研究需要提出原假设,H,0,和备择假设,H,1,3.,确定适当的检验统计量,4.,确定显著性水平,和临界值及拒绝域,5.,作出拒绝或接受原假设的决策,8.,假设检验的步骤(续,1,),(一)根据研究需要提出原假设,H,0,和备择假设,H,1,应该注意:,对任一假设检验问题,其所有可能结果均应包括在所提出的两个对立假设中,原假设与对立假设总有一个、也只能有一个成立。,原假设一定要有等号:,或,或,。,原假设不是随意提出的,应该本着,“,不轻易拒绝原假设,”,的原则。,双侧检验,原假设与备择假设的确定,双侧检验属于,决策中的假设检验,。即不论是拒绝,H,0,还是接受,H,0,,,都必需采取相应的行动措施。,例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格。待检验问题是该企业生产的零件平均长度是10厘米吗?(属于决策中的假设)则建立的原假设与备择假设应为,H,0,:,=,10 H,1,:,10,单侧检验,原假设与备择假设的确定,应区别不同情况采取不同的建立假设方法。,对于,检验某项研究是否达到了预期效果,一般是将研究的预期效果(希望、想要证明的假设)作为备择假设,H,1,,将认为研究结果无效作为原假设,H,0,。,先确立备择假设,H,1,。,因为只有当检验结果与原假设有明显差别时才能拒绝原假设而接受备择假设,原假设不会轻易被拒绝,就使得希望得到的结论不会轻易被接受,从而减少结论错误。,单侧检验,原假设与备择假设的确定,例,1,,有研究预计,采用新技术生产后将会使某产品的使用寿命明显延长到1500小时以上。则建立的原假设与备择假设应为:,H,0,:,1500 H,1,:,1500,例,2,,有研究预计,改进生产工艺后会使某产品的废品率降低到2%以下。则建立的原假设与备择假设应为:,H,0,:,2%H,1,:,2%,单侧检验原假设与备择假设的确定,对于,检验某项声明的有效性,一般可将所作的声明作为原假设。将对该声明的质疑作为备择假设。先确立原假设,H,0,。,因为除非有证据表明“声明”无效,否则就应认为该“声明”是有效的。,例,1,,某灯泡制造商声称,该企业生产的灯泡平均使用寿命在1000小时以上。通常除非样本能提供证据表明使用寿命在1000小时以下,否则就应认为厂商的声称是正确的。建立的原假设与备择假设应为:,H,0,:,1000 H,1,:,1000,单侧检验原假设与备择假设的确定,对于上述问题还可以结合不同背景建立假设。同样的问题背景不同可以采用不同的原假设。,例如,一商店经常从某工厂购进某种商品,该商品质量指标为,,,值愈大商品质量愈好。商店提出的进货条件是按批验收,只有通过假设“,0,”,检验的批次才能接受。有两种可能情况:,如果根据过去较长时间购货记录,商店相信该厂产品质量好,于是同意把原假设定为,0,,,而且选择较低的检验显著性水平。这对工厂是有利的,使得达到质量标准的产品以很小的概率被拒收。虽然这会使商店面临接受不合标准产品的风险,但历史记录显示出现这种情况的可能性很小,而且商店也可因此获得较好的货源。,如果过去一段时期的记录表明,该厂产品质量并不理想,商店则会坚持以,0,为原假设,并选定较小的检验显著性水平。这对商店是有利的,不会轻易地拒绝原假设,有 1,的可能把劣质产品拒之门外。,确定适当的检验统计量,假设检验根据检验内容和条件不同需要采用不同的检验统计量。,在一个正态总体的参数检验中,,,Z,统计量和,t,统计量常用于均值和比例的检验,,2,统计量用于方差的检验。选择统计量需考虑的因素有被检验的参数类型、总体方差是否已知、用于检验的样本量大小等。,Z,检验,(单尾和双尾),t,检验,(单尾和双尾),Z,检验,(单尾和双尾),2,检验,(单尾和双尾),均值,一个总体,比例,方差,确定适当的检验统计量,假设检验根据检验内容和条件不同需要采用不同的检验统计量。,在一个正态总体的参数检验中,,,Z,统计量和,t,统计量常用于均值和比例的检验,,2,统计量用于方差的检验。选择统计量需考虑的因素有被检验的参数类型、总体方差是否已知、用于检验的样本量大小等。,Z,检验,(单尾和双尾),t,检验,(单尾和双尾),Z,检验,(单尾和双尾),2,检验,(单尾和双尾),均值,一个总体,比例,方差,8.,总体均值的假设检验,检验统计量的确定,总体,标准差,是否已知?,样本容量,n,否,是,z,检验,t,检验,小,用样本标准差,S,代替,z,检验,大,几种主要类型的假设检验实例,1.,总体方差,2,已知时均值的检验(归纳),假定条件,总体服从正态分布,若总体不服从正态分布,可用正态分布来近似(要求,n,30),使用,Z,统计量,1.1,总体方差,2,已知时均值的双侧检验,某机床厂加工一种零件,根据经验知道,以前加工零件的椭圆度近似服从正态分布,其总体均值为,0,=0.081,mm,,总体标准差为=0.025。今换一种新机床进行加工,抽取,n,=200,个零件进行检验,得到的椭圆度均值为0.076,mm。,试问新机床加工零件的椭圆度均值与以前有无显著差异?(,0.05),属于决策中的假设!,解:,已知:,0,=0.081,mm,,=,0.025,,n,=200,,提出假设:,假定椭圆度与以前无显著差异,H,0,:,=0.081,H,1,:,0.081,=0.05,双侧检验,/2,=0.025,查表得临界值,:,Z,0.025,=1.96,Z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,决策:,Z,值落入拒绝域,在,=0.05的水平上拒绝,H,0,结论:,有证据表明新机床加工的零件的椭圆度与以前有显著差异,得两个拒绝域:,(-,-1.96)和(1.96,),计算检验统计量值:,总体方差,2,已知均值的检验,(,P,值的计算与应用,),第,1,步:进入,Excel,表格界面,选择“插入”下拉菜单,第,2,步:选择“函数”点击,第,3,步:在函数分类中点击“统计”,在函数名的菜单下选择字符“,NORMSDIST,”,然后确定,第,4,步:将,Z,的绝对值,2.83,录入,得到的函数值为,0.9976726,。表示标准正态分布曲线下,Z,值,2.83,左侧的面积为,0.9976726,。,双侧检验计算,P,值:,2(1,0.9976726)=0.0046548,P,值远小于,=0.05,,故拒绝,H,0,1.2,总体方差,2,已知时均值的单侧检验(归纳),左侧:,H,0,:,0,H,1,:,0,统计量值必须显著地大于,0,才能拒绝,H,0,,小于,0,的值满足,H,0,,,不能拒绝,H,0,Z,0,拒绝,H,0,1.2,总体方差,2,已知时均值的单侧检验(左检验举例),某批发商欲从生产厂家购,进一批灯泡,根据合同规,定,灯泡的使用寿命平均,不能低于1000小时。已知,灯泡使用寿命服从正态分,布,标准差为20小时。在,总体中随机抽取100只灯,泡,测得样本均值为960,小时。批发商是否应该购,买这批灯泡?(,0.05),属于检验声明的,有效性!,解:,已知:,0,=1000小时,,,=,20,,n,=100,,提出假设:,假定使用寿命平均不低于1000小时,H,0,:,1000,H,1,:,1020,=0.05,右检验临界值为正,得临界值,:,Z,0.05,=1.645,计算检验统计量值:,Z,值落入拒绝域,在,=0.05的显著性水平上拒绝,H,0,,,接受,H,1,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,Z,0,拒绝域,0.05,1.645,得拒绝域:,(1.645,),2.1,总体方差,2,未知时均值的双侧检验,某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?,属于决策中的假设!,解:,已知:,0,=1000克,,s,=24,,,n,=9,,提出假设:,假定每包产品的重量与标准重量无显著差异,H,0,:,=1000,H,1,:,1000,=0.05,双侧检验,/2,=0.025,df=9-1=8,得临界值,:,t,0.025,(8)=2.306,计算检验统计量值:,t,值落入接受域,在,=0.05的显著性水平上接受,H,0,有证据表明这天自动包装机工作正常,决策:,结论:,t,0,2.306,-2.306,0.025,拒绝,H,0,拒绝,H,0,0.025,得两个拒绝域:,(-,-2.306)和(2.306,),总体方差,2,未知小样本均值的检验,(,P,值的计算与应用,),第,1,步:进入,Excel,表格界面,选择“插入”下拉菜单,第,2,步:选择“函数”点击,第,3,步:在函数分类中点击“统计”,在函数名的菜,单中选择,字符“,TDIST,”,,然后确定,第,4,步:在弹出的对话框录入:,在,X,栏中录入计算出的,t,的绝对值,1.75,在自由度,(Deg-freedom),栏中录入,8,在,Tails,栏中录入,2,,表明是双侧检验,(,单测检验则在该栏内录入,1),显示计算结果,P,值为,0.118232783,P,值大于/2=0.025,故接受,H,0,2.2,总体方差,2,未知时均值的单侧检验,一个汽车轮胎制造商声称,某一等级的轮胎的平均,寿命在一定的汽车重量和正常行驶条件下大于,40000公里,对一个由20个轮胎组成的随机样本作,了试验,测得平均值为41000公里,标准差为5000,公里。已知轮胎寿命的公里数服从正态分布,我们,能否根据这些数据作出结论,该制造商的产品同他,所说的标准相符?(=0.05),属于检验声明有效性的假设!,解:,已知:,0,=40000公里,,s,=500,0,,n,=20,,提出假设:,假定平均寿命不低于40000公里,H,0,:,40,000,H,1,:,40000,=0.05,左检验临界值为负,df=20-1=19,得临界值,:,-t,0.05,(19)=-1.7291,计算检验统计量值:,t,值落入接受域,在,=0.05的显著性水平上接受,H,0,结论:,有证据表明轮胎使用寿命显著地大于40000公里,可以认为该制造商的声称是可信的。,决策:,-1.7291,t,0,拒绝域,0.05,得拒绝域:,(-,-1.7291),3.,总体均值与样本均值间差异的检验,例如,一个由50名学生组成的样本其平均身高为174.94,cm,,标准差为6.42,cm,,假设样本是抽自平均身高为172.50,cm,的总体,这样样本的值与总体均值间的,误差为:,属于抽样误差,?,假定显著性水平为,0.05,。,解:1陈述假设:,2识别检验统计量并计算,3规定显著性水平:,,,则拒绝零假设。,4双侧检验如果,这就是说,在,0.05,显著性水平下,由平均身高,174.94,cm,的,50,个学生所抽成的样本,不是抽自平均身高为,172.50,cm,的总体。也就是所观察到的两者的误差,不是抽样误差。,5,因为,,,所以应拒绝零假设。,4.,用置信区间进行检验,一种袋装食品每包的标,准重量应为,1000,克。现,从生产的一批产品中随,机抽取,16,袋,测得其平,均重量为,991,克。已知这,种产品重量服从标准差,为,50,克的正态分布。试,确定这批产品的包装重,量是否合格?,(=0.05),双侧检验,解:,提出假设:,H,0,:,=,1000,H,1,:,1000,已知:,n,=16,,,=50,,,=0.05,双侧检验,/2,=0.025,临界值,:,Z,0.025,=1.96,置信区间为,决策,:,结论,:,在置信区间内,不拒绝,H,0,可以认为这批产品的包装重量合格,Z,0,1.96,-,1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,习题,1:,有科学家提出,如果人们在早餐中食用高纤维的谷物,那么平均而言,与早餐没有食用谷物的人群相比,食用谷物者在午餐中摄取的热量,(,大卡,),将会减少,.,为了验证这个假设,随机抽取了,35,人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者,(,总体,1),一类为非经常谷类食用者,(,总体,2).,然后测定每人午餐的大卡摄取量,.,经过一段时间的实验,得到如下结果,.,试检验该假设,.,35,人大卡摄取量,总体,1,568,681,636,607,555,496,540,539,519,562,589,646,596,617,584,总体,2,650,569,622,630,596,637,628,706,617,624,563,580,711,480,688,723,651,669,709,632,解,:,所以拒绝 ,可以认为,经常的谷类食用者摄取的热量少于不经常食用者,.,t-,检验:双样本异方差假设,.xls,规定,查表得 ,由于,两个总体均值之差的检验,用,Excel,进行检验,第,1,步:选择,【,工具,】,下拉菜单,并选择,【,数据分析,】,选项,第,2,步:选择,【t,检验,双样本异方差假设,】,第,3,步:当出现对话框后,在,【,变量,1,的区域,】,方框内输入数据,A1:A15,在,【,变量,2,的区域,】,方框内输入数据,B1:B20,在,【,假设平均差,】,的方框内输入,“,0,”,在,【,】,框内键入,“,0.05,”,在,【,输出选项,】,中选择输出区域,选择,【,确定,】,表:,两个总体均值之差的检验,习题,2,一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使肥胖者平均体重减轻,8.5kg,以上,.,为了验证该宣称是否可信,调查人员随机抽取了,10,名参加者,得到他们的体重记录如表,1.,在 的水平下,调查结果是否支持该俱乐部的声称?,表,1,训练前后的体重记录 单位:,kg,表,2:,差值样本构造表单位:,kg,解,:,根据表,2,的差值,求得,所以拒绝 ,可以认为该俱乐部的宣称成立,.,t-,检验:成对双样本均值分析,.xls,规定 ,查表得 ,由于,从而,案例,:,圣经里真有密码吗?,1994,年,8,月,魏茨滕、芮普斯及罗森博格在期刊,Statistical Science,中发表了一篇名为,圣经创世记里的等距字母序列,的论文(以下简称魏文)。,“,Equidistant Letter Sequences in the Book of Genesis,”,Statistical Science,429-438,等距字母序列,(ELS),早期的,ELS,S,TSFGLOHAK,E,ROLTOEIOP,N,OUAHEIVLS,D,OTNKEHALO,M,PHKEROFHA,R,TRNYPMNAL,E,ONDDJGALF,等距字母序列,(ELS),(,续,),“创世纪”第三十一章第二十八节为例子,And hast not suffered me to kiss my sons and my daughters?,Thou hast now done foolishly in so doing.,(,又不容我与外孙和女儿告别,你所行的真是愚昧!,),我们先把空格和标点符号去掉,合并成字符串:,AndhastnotsufferedmetokissmysonsandmydaughtersThouhastnowdonefoolishlyinsodoing,物理学家托马斯,(David Thomas),以英王钦定版,(King James Version),等距字母序列,(ELS),(,续,),Andhastnotsufferedmetokissmysonsandmydaughte,r,sTh,o,uha,s,tno,w,don,e,foo,l,ish,l,yinsodoing,ROSWELL,从”,daughters”,的,r,开始,跳过三个字母,AndhastnotsufferedmetokissmysonsandmydaughtersTho,u,hastnowdone,f,oolishlyins,o,doing,UFO,提出假设,思考题:,魏茨滕、芮普斯及罗森博格应该如何设置他们的假设?,H,O,:,三十二位教士的名字与他们出生死亡日期的 排列是偶然的,H,1,:三十二位教士的名字与他们出生死亡日期的排列并不是偶然的,魏文的,拉比,(Rabbi),实验 (,A,)选取样本,将希伯来文的创世纪排成无空隙的一长串,L=78,064,字,G=g1gL,从,Encyclopaedia of Great Men in Israel(9,世纪至,18,世纪末,),选出,32,位,Rabbi,定义,:xi=,名字;,yi=,出生、死亡日期,取整数,d(skip),及等距字母序列,(ELS),gn,gn+d,.,gn+(k-1)d,1n,n+(k-1)d L,如果有多对相同,取距离最短的那对,这样的配对如此靠近纯属运气吗,?,魏文的,拉比,(Rabbi),实验 (,B,)定义距离,设置检验统计量,对一个二维度的字符串,(xi,yi),定义一个距离,c(x,i,y,i,),,目的在于将资料定量化,魏文找到了一个距离,但是公式复杂、抽象,用一个类似的例子来说明,假设现在有,8,对夫妇共,16,个人,我们姑且用数学上的数对符号(,X1,Y1,),(,X2,Y2,),(,X3,Y3,),,-,(,X8,Y8,)来称呼他们,亦即,,X1,和,Y1,是夫妇,,X2,和,Y2,是夫妇,以此类推,排成两排吃饭。其中第一排坐先生,第二排坐太太,且假定先生的位置依次坐下,而太太们的作为可以改变。假设他们的排列次序(,P1,)如下,我们就可以定义这个特定排列,P1,的距离为:,D,(,P1,),|1-7|+|2-4|+|3-2|+|4-8|+|5-6|+|6-3|+|7-5|+|8-1|=26,1,2,3,4,5,6,7,8,X1,X2,X3,X4,X5,X6,X7,X8,Y7,Y4,Y2,Y8,Y6,Y3,Y5,Y1,固定,共有,8!=40320,种方法,距离的可能值为:,0,2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,共有,17,种,,这些距离值在,8!,中出现的次数分别为,1,7,33,115,327,765,1523,2553,3696,4852,5708,5892,5452,4212,2844,764,576,。,所以可以算出得到某一距离值的频率,例如距离值为,2,的频率是,7/40320=0.000173611,,距离值为,32,的频率是,576/40320=0.0142857,。也可以画出其分布图。,分布图,魏文中拉比实验的距离试验(,1,),魏文一共选择了,32,位拉比,那么其排列方式就有,32!,种,,32,!,10,30,。如果用世界上最快的计算机,(,每秒万亿次,),来计算,需要年,不可能完成,如何办?,拉比实验的距离试验(,2,),利用统计学的抽样。利用电脑通过“简单随机抽样”方式进行,分别抽取,2,万,,10,万,,100,万个样本。将样本中的距离值用条形图的方式表示出来。就得到后面的三个图,【,图,1】,样本数为,2,万个的条形图,图中,1%,的位置为距离值,252,,,5%,的位置为距离值,278,,,50%,的位置为距离值,342,,,95%,的位置为距离值,404,,,99%,的位置为距离值,428,,,99.95%,的位置为距离值,452,1%,5%,99.95%,【,图,2】,样本数为,10,万个的长条图,图中,1%,的位置为距离值,252,,,5%,的位置为距离值,278,,,50%,的位置为距离值,342,,,95%,的位置为距离值,402,,,99%,的位置为距离值,426,,,99.95%,的位置为距离值,454,。,【,图,3】,样本数为,100,万个的长条图,图中,1%,的位置为距离值,252,,,5%,的位置为距离值,278,,,50%,的位置为距离值,342,,,95%,的位置为距离值,402,,,99%,的位置为距离值,426,,,99.95%,的位置为距离值,454,。,从,【,图,1】,至,【,图,3】,可以看出,95%,以上的距离小于,402,,,99%,以上的距离小于,426,,而距离超过,454,的机率不会大于,0.0005,。,魏茨滕等人的文章中说明,若以他们所定义的距离去计算那三十二位犹太教士,有关名
展开阅读全文