ImageVerifierCode 换一换
格式:PPTX , 页数:139 ,大小:1.04MB ,
资源ID:10966299      下载积分:22 金币
快捷注册下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/10966299.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请

   平台协调中心        【在线客服】        免费申请共赢上传

权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:0574-28810668;投诉电话:18658249818。

注意事项

本文((本科)第7章假设检验.pptx)为本站上传会员【精***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

(本科)第7章假设检验.pptx

1、单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,(本科)第7章假设检验ppt课件,统计学,(第二版),谢谢,!,第,七,章,假设检验,假设检验的基本原理,总体参数假设检验,非参数检验,(本科)第7章假设检验ppt课件,第一节,假设检验的基本原理,假设检验的基本原理,假设检验的规则与两类错误,检验功效,(本科)第7章假设检验ppt课件,一、假设检验的基本原理,假设检验是统计推断的另一项重要组成部分,是参数估计的延续,是对参数估计在统计上的验证与补充。它首先对考察总体的分布形式或总体的某些未知参数事先做出某些假设,然后根据检验对象构造合适的检验统计量并经过数

2、理统计分析,确定在假设下,该检验统计量的抽样分布;在给定的显著性水平下,从抽样分布中得出鉴别对原先假设的拒绝域和接受域的临界值;之后由所抽取的样本资料计算样本统计量,并将样本统计量与临界统计量进行比较,从而对所提出的原假设做出统计判断:是接受还是拒绝原假设。也就是从样本中所蕴含的信息来对总体情况进行判断。,(本科)第7章假设检验ppt课件,假设检验所遵循的推断依据是统计中的“小概率原理”:小概率事件在一次试验中几乎是不会发生的。举个例子来说,在,10000,件的产品中,如果只有,1,件是次品,那么可以得知,在一次试验中随机抽取,1,件产品,它为次品的概率就为,0.01,,此概率是非常小的。或者

3、是说,在一次随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中随机抽取,1,件,恰好是次品,那么,我们就有理由怀疑该批产品的次品率不是很小,否则就不会那么容易地抽到次品。因此,有足够的理由否认该批产品的次品率很低的假设。,(本科)第7章假设检验ppt课件,通常概率要多大才能算得上是小概率呢?假设检验中把这个小概率称为显著性水平,,其取值的大小与我们能否做出正确判断有着相当大的关系。然而,,的取值并没有固定的标准,只能根据实际需要来确定。一般地,,取,0.05,(,5,),对于一些比较严格的情况,例如在一些高精密质量检验的假设检验中,它可以取,0.01,或者更小。,越小,所做出的拒

4、绝原假设的判断的说服力就越强。当然,不管,有多么地小,也不能代表小概率事件没有发生的可能,这也正是假设检验与数学上“反证法”的不同之处。所以,对于拒绝或者接受,都只是统计意义上的,并不是完全意义上的。这一点在学习假设检验过程中是容易被疏忽的。,(本科)第7章假设检验ppt课件,事先建立假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体没有发生变化的基础之上的,也就是总体参数没有显著变化。备选假设是原假设的对立,是在否认原假设之后所要接受的内容,通常这是我们真正感兴趣的一个判断。例如在上面的例子中,如果想确认次品率是否为,0.01,,我们可以分别建立原假设

5、和备选假设为:,H,0,:,0,=0.01%,,,H,1,:,0,0.01%,;如果我们想确认次品率是否大于(小于),0.01,,那么对应的备选假设为:,H,1,:,0,0.01%(,或,0,0.01%),,原假设与前面相同。由此可见,备选假设与原假设的建立不是随意的,而是要根据研究的需要来确定的。,(本科)第7章假设检验ppt课件,应当指出,在假设检验中,相对而言,当原假设被拒绝时,我们能够以较大的把握肯定备选假设的成立;而当原假设不能被拒绝时,我们并不能断定原假设确实成立。例如,当给定的,为,0.01,时,如果检验统计量的取值落入其发生概率不超过,0.04,但又大于,0.01,的区域时,我

6、们不能拒绝原假设。但事实上,在原假设成立的前提下,其发生的概率最多只有,0.04,,因此难以断定原假设成立。如果将显著水平定为,0.05,则原假设就会被拒绝。,(本科)第7章假设检验ppt课件,假设检验按照所检验内容的不同,可以分为参数检验和非参数检验。对已知总体分布的某个未知参数进行的检验,称为参数检验;对总体的分布形式进行的检验,则称为非参数检验。本章将分别对这两类检验进行介绍。,(本科)第7章假设检验ppt课件,二、假设检验的规则与两类错误,(一)假设检验的规则,综合上面假设检验的原理分析,给出假设检验的步骤:,1,根据实际应用问题确定合适的原假设,H,0,和备选假设,H,1,;,2,确

7、定检验统计量,通过数理统计分析确定该统计量的抽样分布;,3,给定检验的显著性水平,,在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;,4,从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。,(本科)第7章假设检验ppt课件,上面步骤中,对检验统计量抽样分布的确认属于高深的概率数理统计的研究内容,本处我们不作探讨。,从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正就是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端

8、可以将检验分为单侧检验和双侧检验。单侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于上述的情况,我们可以通过服从检验统计量的分布图来形象表示:,(本科)第7章假设检验ppt课件,图,7-1,双侧检验与单侧检验,图中的阴影部分为拒绝域,对应的分别是双侧、左单侧、右单侧检验。,(本科)第7章假设检验ppt课件,实际应用中,是采用双侧检验还是单侧检验?单侧检验中,是采用左单侧还是右单侧呢?例如,某公司采取了新的销售方案,我们想检验新方案下销售收入是否与实施前的有差异,即是否等同于原来的销售收入水平,对该情况的检验就是双侧检验。如果我们想检验新方案下的销售收入水平是否有所

9、提高,此时检验就转化为单侧检验了,而且是右侧检验。同理,如果想检验收入水平是否低于实施前的收入水平,就要采用单侧检验中的左侧检验。也就是说,选用双侧、左侧或右侧检验时,要结合备选假设来考虑。又如,前面提到的次品率的例子中,如果备选假设为,H,1,:,0,0.01%,,就是双侧检验;如果备选假设为,H,1,:,0,)0.01%,,就是属于左(右)单侧检验。,(本科)第7章假设检验ppt课件,在检验规则中,我们经常碰到两种重要的检验方法:,z,检验与,t,检验。,1,z,检验。又称为正态分布检验,该检验认为所检验的统计量服从正态分布。例如,从正态分布总体中抽取一个样本,则样本均值,服从正态分布,;

10、从一般非正态分布总体中抽样,当样本容量,n,很大时,样本均值,近似地服从正态分布,,其中,,,为总体标准差。因为统计量,N(0,1),,,所以,我们可以利用标准正态分布来进行检验。根据给定的显著性水平,从标准正态分布的临界表中查得临界值,,将,z,统计量的取值与临界值比较来判断能否拒绝原假设。,(本科)第7章假设检验ppt课件,2,t,检验。在检验中,当总体的标准差,未知时,需要用样本标准差,来代替,从而构成统计量,。同样,从,t,分布的临界表中查得临界值,,并将样本统计量的,值与其比较做出判断。,(本科)第7章假设检验ppt课件,(二),p,值检验,在上面的检验步骤中,判断最后是接受原假设还

11、是拒绝原假设依据是,计算的样本统计量的数值与检验统计量的临界值的大小比较。此外,我们也可以根据计算的概率值,p,来判断能否拒绝原假设,这就是,p,值检验。现在在众多流行的统计计量软件中(如,SAS,,,SPSS,,,EXCEL,等),最后的结果表中都给出了,p,值。,(本科)第7章假设检验ppt课件,p,值检验的原理:建立原假设后,在假定原假设成立的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算出的检验统计量的数值的概率,这便是,p,值;而后将此,p,值与事先给出的显著性水平,进行比较,如果,p,值小于,,也就是说,原假设

12、对应的为小概率事件,根据上述的“小概率原理”,我们就可以否定原假设,而接受对应的备选假设。如果,p,值大于,,我们不就能否定原假设。,(本科)第7章假设检验ppt课件,例如,对应上面的,检验中,如果是双侧检验,根据上面的说明,可以计算,,,若,p,,那么我们就可以否认原假设,反之不能否定原假设。,p,值检验与前面介绍的方法得出的结论是一致的。,(本科)第7章假设检验ppt课件,(三)两类错误,在假设检验中,对假设的检验判断是依据样本实际资料所计算的统计量的值与临界值的比较来做出的。由于样本的随机性、样本信息的分散性等原因,这种合理的“以偏概全”式的假设检验,总是无法让我们百分百的肯定所做出结论

13、的正确性。也就是说,我们有可能会做出错误的判断,这种风险是客观存在的。,例如,实际上依据真实总体情况,我们应该接受原假设,H,0,,但根据样本信息,却做出拒绝,H,0,的错误结论,称这种错误为“弃真”错误;此外,我们也可能犯这样的错误:实际的总体情况是应该拒绝原假设,而我们却接受了它,称此为“纳伪”错误。,(本科)第7章假设检验ppt课件,对于上述的两类错误,我们都希望能尽量减少其发生的概率。因此需要对它们的概率进行简要分析。在假设中,我们给出了显著性水平,(概率值),在“小概率事件是几乎不会发生的”原理上,如果样本资料的信息与总体信息之间的差异出现的概率小于等于,,那么可以认为在一次试验中该

14、事件不会发生(发生的可能性,很小),从而我们就拒绝了原假设。这就是说,有,的可能性发生原假设是真实的却被拒绝的情况。所以显著性水平,就是我们犯“弃真”错误的可能性大小。,越小,则犯“弃真”错误的可能性就越小。因而,可以根据实际需要对显著性水平,加以控制,一般取,=0.05,(或者,=0.1,),这就保证犯“弃真”错误的可能性不超过,5,(或者,1,)。如果要求更加严格,,可取更小的数值。,(本科)第7章假设检验ppt课件,通常记,为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变的情况下,减少犯“弃真”错误的可能性(,),势必增大犯“纳伪”错误的可能性(,),也就是说,,的大

15、小和显著性水平,的大小成相反方向变化。,(本科)第7章假设检验ppt课件,两类错误发生的概率,的相对关系可由下面的图形来表示:,图,7-2,两类错误,从图,7-2,中,我们也可以看出,当真实分布与待判别分布越远离时,在,一定下,,将越小;也就是说,当差别比较明显时,我们犯错误的可能性会更小,反之亦然。,真实,假设,(本科)第7章假设检验ppt课件,表,7-1,假设检验两类错误,接,受,拒,绝,原假设为真,正确的,结论,(1-,),“弃真”,错误,(,),原假设为假,“纳伪”错误,(,),正确的,结论,(1-,),(本科)第7章假设检验ppt课件,三、检验功效,由于,为犯“纳伪”错误的可能性大小

16、或者说,表示出现接受不真实的原假设的结论的概率,那么,1-,就是指出现拒绝不真实的原假设的概率。若,1-,的数值越接近于,1,,表明不真实的原假设几乎都能够被拒绝。诚然,如果,1-,的数值接近于,0,,表明犯“纳伪”错误的可能性很大。因此,,1-,可以用来表明所做假设检验工作好坏的一个指标,我们称之为检验功效。它的数值表明我们做出正确决策的概率为,1-,。,一个好的检验法则总是希望犯两类错误的可能性,与,都很小,但是这在一般场合下是很难实现的。要使得,小,必然导致,大,若要使,小,必导致,增大。,(本科)第7章假设检验ppt课件,在实际检验中,一般首先控制犯“弃真”错误的概率,也就是事先给出

17、的显著性水平,的数值尽量地小,在其它条件不变的情况下,增加犯“纳伪”错误的可能性,即,增大,从而使得检验功效(,1-,)减弱。在此情况下,如何增强检验功效?解决的唯一办法只有增大样本容量,这样既能保证满足取得较小的,,又能取得较小的,值,一举两得。然而实际上样本容量的取得是有限制的,只能根据实际来确定。,(本科)第7章假设检验ppt课件,第二节,总体参数假设检验,总体均值的假设检验,两个总体均值之差的检验,总体成数的假设检验,总体均值的假设检验,两个正态总体方差比的检验,(本科)第7章假设检验ppt课件,总体参数假设检验就是检验已知分布形式(本节主要考虑正态分布)的总体的某些参数(例如均值或者

18、方差)是否与事先所做的假设存在显著性差异,又称为显著性检验。主要包括对总体均值和总体方差的假设检验。本节分各种情况对这两方面的检验进行介绍。,(本科)第7章假设检验ppt课件,一、总体均值的假设检验,总体均值的假设检验就是检验由样本信息所推断的当前总体均值是否与事先假设的总体均值存在显著性差异。,设样本,X,1,X,2,X,n,来自于正态总体,N(,2,),,样本均值为,,样本的标准差为,s,2,,对于均值,的检验问题。,(本科)第7章假设检验ppt课件,(一)总体方差,2,已知,对于双侧检验,建立的假设为:,H,0,:,=,0,,,H,1,:,0,其中,为一个给定已知的常数。,对于左(右)单

19、侧检验来说,建立的假设为:,H,0,:,=,0,,,H,1,:,),0,可以利用上面介绍过的,z,检验法,构造检验统计量,(,7.1,),在原假设成立的条件下,该统计量的分布为:,z,N(0,1),。,(本科)第7章假设检验ppt课件,从而在给定的显著性水平,下,我们可从标准正态分布表中查得临界值,(对应于左、右单侧检验的临界值分别为,-z,1-,和,z,1-,)。,根据样本资料及假设,计算出样本统计量的值,z,。这样,我们便可以得出原假设的拒绝域为:,(对双侧检验而言),zz,1-,(对于右单侧检验而言),当,z,值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。,(本科)第7章假设

20、检验ppt课件,(二)总体方差,2,未知,总体方差,2,未知时对于均值,的假设检验,类似上面方差,2,已知时的做法。,对于双侧检验,建立的假设为:,H,0,:,=,0,,,H,1,:,0,对于左(右)单侧检验来说,建立的假设为:,H,0,:,=,0,,,H,1,:,),0,只是在构造检验统计量时,不是利用,z,检验法。而是在原假设成立的条件下,利用,t,检验法,构造检验统计量,t(n-1),(,7.2,),(本科)第7章假设检验ppt课件,其中,为样本标准差。,t,统计量就是用样本标准差,s,来代替,z,统计量中未知的总体标准差,。,对于临界值,在,t,分布表中查得临界值,(双侧检验)、,-t

21、1-,(n-1),(左单侧检验)、,t,1-,(n-1),(右单侧检验)。,(本科)第7章假设检验ppt课件,根据样本资料及假设,计算出样本统计量的值,t,。这样,可以得出对原假设的拒绝域为:样本统计量的值,t,满足,(双侧检验),tt,1-,(n-1),(右单侧检验),当,t,值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。,(本科)第7章假设检验ppt课件,这里应该注意的是,在实际中不能够确定总体是否满足正态分布,但是样本容量,n,很大。根据中心极限定理,该总体分布近似服从正态分布,对该总体均值的检验可以依据上面的总体方差未知的程序来进行。对于小样本情况,我们也是根据上面的,t,检验来进

22、行。,(本科)第7章假设检验ppt课件,【,例,7-1,】,为了考察某种类型的电子元件的使用寿命情况,假定该电子元件使用寿命的分布为正态分布。而且根据历史记录得知该分布的参数为:平均使用寿命,为,100,(小时),标准差,=10,(小时)。现在随机抽取,100,个该类型的元件,测得平均寿命为,102,(小时),给定显著性水平,=0.05,,问该类型的电子元件的使用寿命是否有明显的提高。,(本科)第7章假设检验ppt课件,解:此题为单侧检验,且是右单侧检验。,以,表示元件的平均使用寿命(小时),则,(,1,)建立假设,H,0,:,=100,,即平均使用寿命无明显变化;,H,1,:,100,,即使

23、用寿命有明显提高。,(,2,)确定检验统计量及其分布,N(0,1),(本科)第7章假设检验ppt课件,(,3,)确定临界值,右单侧检验的临界值为,z,。由于给定的显著性水平,=0.05,,那么双侧概率水平为,2,0.05,0.1,,则,F(z,)=1-0.1=0.9,,查正态分布表得到,z,=1.645,即为临界值。,(本科)第7章假设检验ppt课件,(,4,)计算样本统计量并判断,根据样本资料,计算样本统计量:,由于计算的样本统计量,z,1.645,,所以拒绝原假设,H,0,,可以认为该类型的电子元件的使用寿命确实有所提高。,(本科)第7章假设检验ppt课件,【,例,7-2,】,在上例中,如

24、果抽出的,100,个样本元件,测得其平均使用寿命为,98,(小时),其余条件相同,试问该类型元件的使用寿命是否有显著性下降。,(本科)第7章假设检验ppt课件,解:此例为左单侧检验问题。,(,1,)建立的假设检验为,H,0,:,=100,,无明显变化,;,H,1,:,100,,有显著性下降。,(,2,)确定检验统计量及其分布,在原假设成立下,检验统计量为:,N(0,1),(本科)第7章假设检验ppt课件,(,3,)确定临界值,此时左侧临界值为,-z,,根据上面的结果,得到临界值为,-,z,=-1.645,(,4,)计算样本统计量并做出判断:,样本统计量为:,由于,-,z,500,(,2,)确定

25、临界值,由于是属于单侧检验,所以只有一个临界值;,N=10,,,=0.01,,查表得到该临界值为,t,(,)=t,0.01,(9)=2.821,(本科)第7章假设检验ppt课件,(,3,)计算样本统计量,跟上例的计算一样,此处略,得到样本统计量,t=0.335,(,4,)判断,由于实际的样本统计量,t=0.335,临界值,t,0.01,(9)=2.821,,所以不能拒绝原假设,可以认为该类生产没有显著地高于标准。该结论与上例的结论相符。,(本科)第7章假设检验ppt课件,二、两个总体均值之差的检验,两个总体均值之差的检验,就是对两个不同总体的均值之间的差异性是否显著所进行的检验。为了分析的简化

26、与方便,我们假定,x,是取自于均值为,x,、方差为,的正态总体,X,的一个样本,,y,是取自于均值为,y,、方差,为,的正态总体,Y,的一个样本,样本容量分别为,,且假定此两样本相互独立。,、,、,、,为对应的样本均值与样本方差,显著性水平为,。下面我们分总体方差已知和未知两种情况,来分析总体均值的差异显著性检验。,(本科)第7章假设检验ppt课件,(一)两总体方差,已知,双侧检验,原假设为,H,0,:,x,=,y,,备选假设为,H,1,:,x,y,根据上面的假定和抽样分布理论,我们可以得到:,N(0,1),(,7.3,),所以在原假设成立下,构造的检验统计量为:,N(0,1),(,7.4,)

27、本科)第7章假设检验ppt课件,在显著性水平,下,我们查标准正态分布表得到临界值,。将样本资料代入所构造的检验统计量,得到样本统计量,z,。若,,则拒绝原假设;反之,则不能拒绝原假设。,(本科)第7章假设检验ppt课件,左单侧检验,原假设为,H,0,:,x,=,y,,备选假设为,H,1,:,x,y,此时可从标准正态分布表查得的临界值为,z,1-,。检验的拒绝域为:,z-z,1-,。,(本科)第7章假设检验ppt课件,右单侧检验,原假设为,H,0,:,x,=,y,,备选假设变为,H,1,:,x,z,1-,。,(本科)第7章假设检验ppt课件,(二)两总体方差,未知但相等,在两方差未知但相等的

28、情况下,我们根据抽样分布理论知:,t,(n,1,+n,2,-2),(,7.5,),对于双、单侧检验,原假设都是相同的,均为,H,0,:,x,=,y,。只是在双侧检验时,备选假设,H,1,:,x,y,;在左单侧检验时,备选假设为,H,1,:,x,y,。,(本科)第7章假设检验ppt课件,在原假设成立的情况下,根据上面的公式,我们可以构造如下的检验统计量:,t(n,1,+n,2,-2),(,7.6,),可以根据样本资料的数据,计算样本检验统计量的数值。,(本科)第7章假设检验ppt课件,对于双侧检验,可以从,t,分布表中查得临界值,,此时原假设的拒绝域为:,。反之就不能拒绝原假设。,对于左、右单侧

29、检验,从,分布表中查得临界值,t,1-,(n,1,+n,2,-2),;左单侧检验拒绝原假设的范围是:,t-t,1-,(n,1,+n,2,-2),。右单侧检验拒绝原假设的范围为:,t5,。如果,nP,i,5,,则将,nP,i,5,的样本合并。,(,5,)构造并计算统计量:当原假设为真时,样本实际频数,f,i,应该与理论频数,nP,i,接近,即,不应太大。根据,K,皮尔逊的研究,可以构造如下的检验统计量,(,7.12,),其中,k,为待估计的参数个数。其余符号含义与上述同。,(本科)第7章假设检验ppt课件,(,6,)计算临界值:在给定显著性水平,下,查,2,分布表得到临界值,。,这样就得到拒绝原

30、假设的值域:,(,7,)进行判断:如果计算的样本统计量,2,确实大于,,那么就可以拒绝原假设,否则不能拒绝原假设。,(本科)第7章假设检验ppt课件,【例,7-10,】欲检验某个骰子是否均匀,可以通过检验各个点数的出现是否是随机的。我们随机投出骰子,102,次,将得到的点数记录下来;出现各个点数的次数见表,7-3,。,表,7-3,骰子出现各种点数的次数,点,数,1,2,3,4,5,6,合计,出现的次数,19,16,20,15,14,18,102,(本科)第7章假设检验ppt课件,解:记各个点数出现的次数为,X,,其分布未知,依据题意我们可以对其分布建立假设,即,H,0,:,X,服从均匀分布,也

31、即,X,的分布满足,;,H,1,:,X,不服从均匀分布。,在原假设下,各个点数出现的期望频数均为,(次)。根据(,7.16,)式可以得到:,(本科)第7章假设检验ppt课件,查表得到临界值为,,,因而,我们不能拒绝原假设,可以认为该骰子是均匀的。,(本科)第7章假设检验ppt课件,(二)独立性检验,顾名思义,该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。这里的变量主要是指定类、定序资料。为了分析变量之间的关联性,需要将资料整理成列联表的形式。,列联表是多行多列纵横交错所形成的一个表体。我们以例子说明列联表的形式以及如何将独立性检验化为列联表并进行

32、检验分析的程序。,(本科)第7章假设检验ppt课件,【例,7-11,】抽样调查某地区,500,名待业人员,这些人员中文化程度为高中及以上的有,104,人(男,44,人),初中的有,96,人(男,36,人),小学及以下的有,300,人(男,140,人)。问此调查结果能否说明待业人员中的文化程度与性别是相互独立的。,(本科)第7章假设检验ppt课件,解:根据调查结果,我们可将数据整理成列联表,见表,7-4,。,表,7-4,待业人员文化程度与性别列联表,高中及以上,初中,小学及以下,合计,比重,男,44,(,46,),36,(,42,),140,(,132,),220,0.440,女,60,(,58

33、60,(,54,),160,(,168,),280,0.560,合计,104,96,300,500,比重,0.208,0.192,0.600,1,文化程度,性别,(本科)第7章假设检验ppt课件,列联表中,括号内的数值为该处的期望值,其计算方法为:该格子所对应的行合计与列合计的乘积,再除以总合计。例如,性别为男且文化程度为高中及以上所对应的期望值为,,,其它各个格子对应的期望值也如此计算得到。,在得出对应的期望值后,就可以应用,2,检验。,(本科)第7章假设检验ppt课件,从,2,分布表可查到临界值为,,其中的自由度为,。比较可得到样本,2,值小于临界值,所以我们不能否定原假设,也就是待

34、业人员中的文化程度与性别不显著。,(本科)第7章假设检验ppt课件,三、符号检验,符号检验是非参数检验中最简单又最常用的方法之一,它既适用于单样本,又适用于配对样本。,(本科)第7章假设检验ppt课件,(一)单样本的符号检验,在单样本的情况下,符号检验适用于检验总体中位数是否在某一指定的位置。反映一个总体分布位置的参数主要有均值和中位数。均值反映的是分布数列的重心位置,而中位数则是反映分布数列中上下两边次数相等的中央位置,也就是说在数列中,有一半的数值在此中位数之上,而另一半在中位数之下。当分布为对称时,中位数上下两边的数值的位置是一致的,当分布不对称时,两者就有差异。在偏斜度较大时,检验中位

35、数往往比检验均值更有实际意义。因为均值对离群值的敏感性较大,而中位数相对而言敏感性较小,从而更能客观地反映样本数据的分布情况。中位数检验的基本原理是,假设总体中位数的真值,,然后在实际抽取的容量为,n,的样本中,将每个观测值,x,i,均减去,A,,并只记录其差值的符号,即为,(,7.17,),(本科)第7章假设检验ppt课件,若,,就略去不计。接着分别计算“,+,”的个数(用,表示)和“”的个数(用,表示)。,理论上,当中位数,为真时,得到的正负号个数应该接近相等,即,。若从样本中得到的,和,相差较远,那么就有理由拒绝,。该检验中所用的判别标准是由二项分布临界值提供的,在大样本下,可由正态分布

36、来逼近。下面用例子来说明检验的具体过程。,(本科)第7章假设检验ppt课件,【例,7-12,】从大学某系男女新生中,随机抽取,20,名,测得体重数据如下(公斤):,给定显著性水平,=0.1,,用符号检验判定中位数是否与,有显著性差异。,表,7-5,某大学新生体重数据表,53,60,47,61,57,45,55,51,58,48,48,64,53,58,51,56,49,60,62,52,(本科)第7章假设检验ppt课件,解:(,1,)建立假设,,,(,2,)将各个数据均减去原假设所设定的中位数,55,,并把各个正负号记录下来。如果数据与中位数一致,则略去。得到:,n,+,=9,n,-,=10,

37、因此,n=,n,+,+n,-,=19,(,3,)计算临界值:由于是双侧检验,检验水平为,=0.05,,查二项分布临界值表,当,n=18,时,临界值为,13,。,(本科)第7章假设检验ppt课件,(,4,)进行判断:由于,,所以不能拒绝原假设,即可以认为总体体重的中位数为,55,(公斤),。,(本科)第7章假设检验ppt课件,(二)配对样本的符号检验,上面的检验是针对单个总体的情况,实际中,有可能要同时对两个总体的分布进行比较。,假定,X,、,Y,分别为从总体,F,1,(X),、,F,2,(X),中抽取的样本,它们的样本容量均为,,且两个样本的观测值是一一对应的。,建立的假设为,H,0,:,

38、F,1,(X)=F,2,(Y),,,H,1,:,F,1,(X)F,2,(Y),。,在原假设成立的条件下,样本中,X,i,大于相对应的,Y,i,的个数应该与,X,i,小于相对应的,Y,i,的个数大致相等,这些个数满足二项分布。因而,可以利用此特征来进行检验,或者是说,利用此特征来设立检验的统计量。,(本科)第7章假设检验ppt课件,设配对样本,X,i,、,Y,i,序列中,,X,i,Y,i,的个数为,r,+,X,i,Y,i,的个数为,r,-,,,不考虑,X,i,=Y,i,的个数,所以有,r,+,+r,-,n,。,取,r=max(r,+,,,r,-,),在显著性水平,下,有,pr,r(,)=,。,临

39、界值,r(,),是根据二项分布的原理来求得的,也可以从临界值表查得。如果,r,r(,),,我们就拒绝原假设,否则就不能拒绝原假设。,(本科)第7章假设检验ppt课件,【例,7-13,】假定在某项比赛中,某两位裁判,(A,B),分别对该项赛事中的,10,位选手的在场上的综合表现做出评分,分数为,0-10,分,数据如下:,试用符号检验法检验这两位裁判裁定的成绩是否有显著性差异。,(,=0.05),表,7-6,两裁判的裁定分数表,1,2,3,4,5,6,7,8,9,10,裁判,8.2,9.0,8.8,9.3,7.9,9.1,8.6,8.8,8.4,9.0,裁判,7.9,8.8,8.6,9.4,8.4

40、9.0,8.9,8.7,8.0,9.3,差值的符号,+,+,+,-,-,+,-,+,+,-,(本科)第7章假设检验ppt课件,解:首先提出假设,H,0,:,两位裁判的判定成绩无显著性差异,,H,1,:两,位裁判的判定成绩有显著性差异。,根据上面所述的方法,将两位裁判的判定成绩之间差值的符号列在表,7-6,的最后一行。从而有,r,+,=6,,,r,-,=4,,,r=max(r,+,r,-,)=6,在,=0.05,,,n=10,时,从二项分布表或者是符号检验表中可以查得临界值,,由于,,所以不能拒绝原假设,即不能认为两位裁判的裁定成绩有显著性差异。,(本科)第7章假设检验ppt课件,(三)非配对

41、样本的符号检验,与上面介绍的配对样本的情况类似,不同的只是从所考察的两总体中分别抽取的样本的容量不一定相等。假定两样本,X,,,Y,的容量分别为,n,1,,,n,2,。此时原假设仍为,H,0,:,F,1,(X)=F,2,(Y),。,(本科)第7章假设检验ppt课件,对于该检验,可以将资料转化成列联表的形式,并利用上面介绍的,2,检验来进行分析。具体的方法为:,将所抽取的两组样本资料混和在一起,将此(,n,1,+n,2,)个观测值按照递增或递减的顺序进行排序,求得中位数,M,e,。分别将两样本中大于或小于中位数,M,e,的个数(频数)以列联表的形式列出。这样我们就可利用前面的,2,检验。此处不重

42、述,仅以例子说明。,(本科)第7章假设检验ppt课件,【例,7-14,】有某商品销售人员甲、乙每月的销售额数据,如表所示(单位:元),只是两组数据并不成对出现,甲有,10,个样本值,而乙只有,8,个样本值。现要求用符号检验法对这两位销售人员的销售额的分布是否一致进行检验。,(,=0.05),表,7-7,商品销售人员月销售数据,1,2,3,4,5,6,7,8,9,10,甲,2563,2600,2230,1986,3000,2800,3130,2023,1869,1896,乙,1999,2980,3404,2567,2479,2581,3022,1880,(本科)第7章假设检验ppt课件,解:由于

43、两组销售额分布形式无法得知,不能用上节所介绍的参数检验方法,只能用非参数检验方法来进行检验。,依据题意,建立假设:,H,0,:,两组销售额的分布一致,H,1,:两,组销售额的分布有显著性差异,将两组数据合在一起,求得中位数,M,e,=2565,,从而将每组销售额分为大于和小于中位数两部分,得到列联表(见表,7-8,),(本科)第7章假设检验ppt课件,表,7-8,转化的列联表,大于中位数,小于中位数,合计,甲,4,6,10,乙,5,3,8,合计,9,9,18,(本科)第7章假设检验ppt课件,根据,2,的计算公式得到:,查表得到临界值,。,,所以不能拒绝原假设,两组销售额分布没有显著性差异。,

44、本科)第7章假设检验ppt课件,四、秩和检验,秩和检验是一种用样本秩代替样本值的检验方法,用该法可以检验两个总体的分布函数是否相等的问题。,所谓秩,就是样本观测值在序列中的排序号。具体的检验步骤为:,1,建立假设,H,0,:,F,1,(X)=F,2,(X),,,H,1,:,F,1,(X)F,2,(X),2,从这两个总体,中,X,、,Y,分别抽取样本容量为,n,1,、,n,2,的两个样本,,n,1,+n,2,=n,。不失一般性,我们假定,n,1,n,2,。将两组样本混合,并将所有的样本单位值按小到大排序,每个样本单位对应的序号称为该样本单位的秩。对于相同数值的样本单位,它们具有相同的秩,且都等

45、于它们的次序平均值。,(本科)第7章假设检验ppt课件,3,计算取自总体,X,的样本的秩和,T,,即将该样本的所有样本单位的秩加总。,T,取可能的最小值是当,X,的样本单位都排在,Y,的样本单位的前面时,即,。,T,取可能的最大值是在当,X,的样本单位都排在,Y,的样本单位的后面时,此时有,。如果两个总体的分布没有显著性差异,则,T,值不会太大或太小,而是靠近最大值和最小值的中间,即为,。因此,可以将,T,作为秩和检验的统计量。当,T,的实际值超过临界值时,就可以拒绝两总体的分布没有显著性差异的原假设。,(本科)第7章假设检验ppt课件,这里应该注意,由于,T,的分布与,n,1,、,n,2,的

46、大小有关,所以临界值的确定可以分为小样本和大样本两类。对于小样本(,n,1,、,n,2,都未超过,10,),临界值的数值可以通过查秩和检验值表求得上、下限。对于大样本(,n,1,、,n,2,都超过,10,),此时变量,T,近似服从正态分布,该分布的均值,、标准差,T,分别为:,(,7.18,),(,7.19,),(本科)第7章假设检验ppt课件,此时,可以将,T,标准化为,z,统计量,(,7.20,),然后通过查找正态分布表来确定临界值。,(本科)第7章假设检验ppt课件,【例,7-15,】设(,25,23,22,23,21,23,19,20,)和(,28,26,24,25,23,20,18,

47、21,15,)为两个简单随机样本,试用秩和检验法判断这两组数据是否来自于同一总体。,(本科)第7章假设检验ppt课件,解:依据所述步骤有:,(,1,)建立假设:,H,0,:两组数据来自同一总体,,H,1,:两组数据来自不同总体。,(,2,)将两组数据混和并按照由小到大的顺序排序,得到各组对应于每个数值的排序号分别为:(,14,9,8,9,6,9,3,4,)和,(17,16,13,14,9,4,2,6,1),,其中如果有多个数值是一致的,我们取其序号的平均值。,(本科)第7章假设检验ppt课件,(,3,)由题知,n,1,=8,,,n,2,=9,,所以取第一组数据的秩和为统计量,即有检验统计量,T

48、14+9+8+4=62,。,(,4,)判断。由于两组样本容量都小于,10,,所以我们可以从秩和检验值表查得上、下限的临界值。临界值为,。由于检验统计量介于两个临界值之间,所以不能拒绝原假设,即可以认为两组样本是来自于同一总体的。,(本科)第7章假设检验ppt课件,五、游程检验,游程检验用来检验样本是否随机地取自于总体。如果样本所具有的某个特征的分布越无序,越无规律性,就越能说明样本的随机性。我们通过游程的概念,来表征这种分布的特征,并根据对游程的分析来加以判断。,所谓游程,是指依时间或其他顺序排列的有序数列中,具有相同的事件或符号的连续部分。对应地,同类游程出现的次数,则称为该类的游程数,通

49、俗的讲,就是连成一片的事件或字符的片数。不同类游程数的总和,称为总游程数,记为,R,。,(本科)第7章假设检验ppt课件,【例,7-16,】设有一序列为,1 1 1 1 2 2 2 2 2 1 1 2 2 1 1 1 1 1 1 1 2 1,。在序列中,共出现了两类的字符:“,1,”、“,2,”。那么就有对应于“,1,”的游程和对应于“,2,”的游程。我们将序列中具有同一字符的画下划线,即有:,1 1 1,2 2 2 2 2,1 1,2 2,1 1 1 1 1 1 1,2,1,。可以看出对应于“,1,”游程的个数为,4,,对应于“,2,”游程的个数为,3,,总的游程数,R=3+4=7,个。,(

50、本科)第7章假设检验ppt课件,该例子中,根据序列字符的各种可能排列次序可知:当序列为,1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2,时,总游程数,R,取得可能的最小值,2,;当序列为,1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 1 1 1 1 1,时,总游程数,R,取得可能的最大值,17,(,2,8+1=17,)。,R,取最大值或最小值时,序列具有规律性。然而,当,R,取,2,至,17,之间的数值时,序列就比较“紊乱”了,规律性就较弱。因此,我们就可以将,R,作为检验样本随机性的统计量。,(本科)第7章假设检验ppt课件,根据

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服