第6章假设检验.ppt_咨信网zixin.com.cn

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,6-,*,2008,年,8,月,统计学,STATISTICS,(,第三版,),作者贾俊平,统计学,统,计,学,(,第三版,),2008,2008,年,8,月,正如一个法庭宣告某一判决,为“无罪,(not guilty)”,而不为“清白,(innocent)”,，统计检验的结论也应,为“不拒绝”而不为“接受”。,Jan,Kmenta,统计名言,2008,年,8,月,第,6,章假设检验,6.1,假设检验的基本问题,6.2,一个总体参数的检验,6.3,两个总体参数的检验,2008,年,8,月,学习目标,假设检验的基本思想和原理,假设检验的步骤,一个总体参数的检验,两个总体参数的检验,P,值的计算与应用,用,Excel,进行检验,2008,年,8,月,正常人的平均体温是,37,o,C,吗？,当问起健康的成年人体温是多少时，多数人的回答是,37,o,C,，这似乎已经成了一种共识。下面是一个研究人员测量的,50,个健康成年人的体温数据,37.1,36.9,36.9,37.1,36.4,36.9,36.6,36.2,36.7,36.9,37.6,36.7,37.3,36.9,36.4,36.1,37.1,36.6,36.5,36.7,37.1,36.2,36.3,37.5,36.9,37.0,36.7,36.9,37.0,37.1,36.6,37.2,36.4,36.6,37.3,36.1,37.1,37.0,36.6,36.9,36.7,37.2,36.3,37.1,36.7,36.8,37.0,37.0,36.1,37.0,2008,年,8,月,正常人的平均体温是,37,o,C,吗？,根据样本数据计算的平均值是,36.8,o,C,，标准差为,0.36,o,C,根据参数估计方法得到的健康成年人平均体温的,95%,的置信区间为,(36.7,，,36.9),。研究人员发现这个区间内并没有包括,37,o,C,因此提出“,不应该再把,37,o,C,作为正常人体温的一个有任何特定意义的概念,”,我们应该放弃“正常人的平均体温是,37,o,C”,这个共识吗？本章的内容就将提供一套标准统计程序来检验这样的观点,2008,年,8,月,6.1,假设检验的基本原理,6.1.1,怎样提出假设？,6.1.2,怎样做出决策？,6.1.3,怎样表述决策结果？,第,6,章假设检验,2008,年,8,月,6.1.1,怎样提出假设？,6.1,假设检验的基本原理,2008,年,8,月,什么是假设,?,(,hypothesis,),在参数检验中，,对总体参数的具体数值所作的陈述,就一个总体而言，总体参数包括,总体均值,、,比例,、,方差,等,分析,之前,必需陈述,2008,年,8,月,什么是假设检验,?,(,hypothesis test,),先对总体的参数,(,或分布形式,),提出某种假设，然后利用样本信息判断假设是否成立的统计方法,有参数检验和,非,参数检验,逻辑上运用反证法，统计上依据小概率原理,小概率是在一次试验中，一个几乎不可能发生的事件发生的概率,在一次试验中小概率事件一旦发生，我们就有理由拒绝原假设,2008,年,8,月,原假设,(null hypothesis),又称“,0,假设”，研,究者想收集证据予以反对的假设，用,H,0,表示,所表达的含义总是指,参数没有变化或变量之间没有关系,最初被假设是成立的，之后根据样本数据确定是否有足够的证据拒绝它,总是有符号,或,H,0,：,=,某一数值,H,0,：,某一数值,H,0,：,某一数值,例如,H,0,：,10cm,null,2008,年,8,月,也称“研究假设”,研究,者想收集证据予以支持的假设，用,H,1,或,H,a,表示,所表达的含义是总体,参数发生了变化或变量之间有某种关系,备择假设通常用于表达研究者自己倾向于支持的看法，然后就是想办法收集证据拒绝原假设，以支持备择假设,总是有符号,或,H,1,：,某一数值,H,1,：,某一数值,H,1,：,”,或“,”,的假设检验，称为单侧检验或单尾检验,(one-tailed test),备择假设的方向为“,”,，称为,右侧检验,双侧检验与单侧检验,2008,年,8,月,双侧检验与单侧检验,(,假设的形式,),假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,以总体均值的检验为例,2008,年,8,月,【,例,】,一种零件的生产标准是直径应为,10cm,，,为对生产过程进行控制，质量监测人员定期对一台加工机床检查，确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,10cm,，,则表明生产过程不正常，必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设,(,例题分析,),解：,研究者想收集证据予以证明的假设应该是,“,生产过程不正常,”,。建立的原假设和备择假设为,H,0,：,10cm,H,1,：,10cm,2008,年,8,月,【,例,】,某品牌洗涤剂在它的产品说明书中声称：平均净含量不少于,500,克。从消费者的利益出发，有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设,(,例题分析,),解：,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为,H,0,：,500,H,1,：,500,2008,年,8,月,【,例,】,一家研究机构估计，某城市中家庭拥有汽车的比例超过,30%,。为验证这一估计是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设,(,例题分析,),解：,研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过,30%,”,。建立的原假设和备择假设为,H,0,：,30%,H,1,：,30%,2008,年,8,月,原假设和备择假设是一个完备事件组，而且相互对立,在一项假设检验中，原假设和备择假设必有一个成立，而且只有一个成立,先确定备择假设，再确定原假设,等号“,=,”,总是放在原假设上,因研究目的不同，对同一问题可能提出不同的假设,(,也可能得出不同的结论,),提出假设,(,结论与建议,),2008,年,8,月,6.1.2,怎样做出决策？,6.1,假设检验的基本原理,2008,年,8,月,假设检验的基本思想,.,因此我们拒绝假设,=50,.,如果这是总体的假设均值,样本均值,m,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值,.,20,2008,年,8,月,两类错误与显著性水平,研究者总是希望能做出正确的决策，但由于决策是建立在样本信息的基础之上，而样本又是随机的，因而就有可能犯错误,原假设和备择假设不能同时成立，决策的结果要么拒绝,H,0,，要么不拒绝,H,0,。决策时总是希望当原假设正确时没有拒绝它，当原假设不正确时拒绝它，但实际上很难保证不犯错误,第,类错误,(,错误,),原假设为正确时拒绝原假设,第,类错误的概率记为,，,被称为显著性水平,2.,第,类错误,(,错误,),原假设为错误时未拒绝原假设,第,类错误的概率记为,(Beta),2008,年,8,月,两类错误的控制,一般来说，对于一个给定的样本，如果犯第,类错误的代价比犯第,类错误的代价相对较高，则将犯第,类错误的概率定得低些较为合理；反之，如果犯第,类错误的代价比犯第,类错误的代价相对较低，则将犯第,类错误的概率定得高些,一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。但由于犯第,类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往先控制第,类错误的发生概率,2008,年,8,月,显著性水平,(,significant level,),事先确定的用于拒绝原假设,H,0,时所必须的证据,能够容忍的犯第,类错误的最大概率,(,上限值,),2.,原假设为真时，拒绝原假设的概率,抽样分布的拒绝,域,3.,表示为,(alpha),常用的,值有,0.01,0.05,0.10,4.,由研究者事先确定,2008,年,8,月,依据什么做出决策？,若假设为,H,0,=500,，,H,1,临界值，拒绝,H,0,左侧检验：,统计量,临界值，拒绝,H,0,2008,年,8,月,用,P,值决策,(,P,-value),如果原假设为真，所得到的样本结果会像实际观测结果那么极端或更极端的概率,P,值告诉我们：,如果原假设是正确的话，我们得到得到目前这个样本数据的可能性有多大，如果这个可能性很小，就应该拒绝原假设,被称为观察到的,(,或实测的,),显著性水平,决策规则：,若,p,值,拒绝,H,0,2008,年,8,月,双侧检验的,P,值,/,2,/,2,Z,拒绝,H,0,拒绝,H,0,0,临界值,计算出的样本统计量,计算出的样本统计量,临界值,1/2,P,值,1/2,P,值,2008,年,8,月,左侧检验的,P,值,Z,拒绝,H,0,0,临界值,计算出的样本统计量,1/2,P,值,2008,年,8,月,右侧检验的,P,值,Z,拒绝,H,0,0,计算出的样本统计量,临界值,1/2,P,值,2008,年,8,月,P,值是关于数据的概率,P,值,原假设的对或错的概率无关,它反映的是在某个总体的许多样本中某一类数据出现的经常程度，它是当原假设正确时，得到目前这个样本数据的概率,比如，要检验全校学生的平均生活费支出是否等于,500,元，检验的假设为,H,0,：,=500,；,H,0,：,500,。假定抽出一个样本算出的样本均值,600,元，得到的值为,P=0.02,，这个,0.02,是指如果平均生活费支出真的是,500,元的话，那么，从该总体中抽出一个均值为,600,的样本的概率仅为,0.02,。如果你认为这个概率太小了，就可以拒绝原假设，因为如果原假设正确的话，几乎不可能抓到这样的一个样本，既然抓到了，就表明这样的样本不在少数，所以原假设是不对的,值越小，你拒绝原假设的理由就越充分,2008,年,8,月,要证明原假设不正确，,P,值要多小，才能令人信服呢？,原假设的可信度又多高？,如果,H,0,所代表的假设是人们多年来一直相信的，就需要很强的证据,(,小的,P,值,),才能说服他们,拒绝的结论是什么？,如果拒绝,H,0,而肯定,H,1,，,你就需要有很强的证据显示要支持,H,1,。,比如，,H,1,代表要花很多钱把产品包装改换成另一种包装，你就要有很强的证据显示新包装一定会增加销售量,(,因为拒绝,H,0,要花很高的成本,),多大的,P,值合适,?,2008,年,8,月,有了,P,值，我们并不需要用,5%,或,1%,这类传统的显著性水平。,P,值提供了更多的信息，它让我们可以选择任意水平来评估结果是否具有统计上的显著性，从而可根据我们的需要来决定是否要拒绝原假设,只要你认为这么大的,P,值就算是显著了，你就可以在这样的,P,值水平上拒绝原假设,传统的显著性水平，如,1%,、,5%,、,10%,等等，已经被人们普遍接受为“拒绝原假设足够证据”的标准，我们大概可以说：,10%,代表有“,一些证据,”不利于原假设；,5%,代表有“,适度证据,”不利于原假设；,1%,代表有“,很强证据,”不利于原假设,固定显著性水平是否有意义,2008,年,8,月,用,P,值进行检验比根据统计量检验提供更多的信息,统计量检验是我们事先给出的一个显著性水平，以此为标准进行决策，无法知道实际的显著性水平究竟是多少,比如，根据统计量进行检验时，只要统计量的值落在拒绝域，我们拒绝原假设得出的结论都是一样的，即结果显著。但实际上，统计量落在拒绝域不同的地方，实际的显著性是不同的。比如，统计量落在临界值附近与落在远离临界值的地方，实际的显著性就有较大差异。而,P,值给出的是实际算出的显著水平，它告诉我们实际的显著性水平是多少,P,值决策与统计量的比较,2008,年,8,月,拒绝,H,0,P,值,决策与统计量的比较,拒绝,H,0,的两个统计量的不同显著性,Z,拒绝,H,0,0,统计量,1,P,1,值,统计量,2,P,2,值,拒绝,H,0,临界值,2008,年,8,月,6.1.3,怎样表述决策结果？,6.1,假设检验的基本原理,2008,年,8,月,假设检验不能证明原假设正确,假设检验的目的主要是收集证据拒绝原假设，而支持你所倾向的备择假设,假设检验只提供不利于原假设的证据。因此，当拒绝原假设时，表明样本提供的证据证明它是错误的，当没有拒绝原假设时，我们也没法证明它是正确的，因为假设检验的程序没有提供它正确的证据,这与法庭上对被告的定罪类似：先假定被告是无罪的，直到你有足够的证据证明他是有罪的，否则法庭就不能认定被告有罪。当证据不足时，法庭的裁决是“被告无罪”，但这里也没有证明被告就是清白的,2008,年,8,月,假设检验不能证明原假设正确,假设检验得出的结论都是根据原假设进行阐述的,我们要么拒绝原假设，要么不拒绝原假设,当不能拒绝原假设时，我们也从来不说“,接受原假设,”，因为没有证明原假设是真的,采用“接受”原假设的说法，则意味着你证明了原假设是正确的,没有足够的证据拒绝原假设并不等于你已经“证明”了原假设是真的，它仅仅意为着目前还没有足够的证据拒绝原假设，只表示手头上这个样本提供的证据还不足以拒绝原假设,比如，在例,6.2,中，如果拒绝原假设，表明样本提供的证据证明该品牌洗涤剂的净含量与说明书所标识的不相符。如果不拒绝原假设，只能说这个样本提供的证据还不足证明净含量不是,500,克或,500,克以上，并不等于证明了净含量就超过了,500,克,“不拒绝”的表述方式实际上意味着没有得出明确的结论,2008,年,8,月,假设检验不能证明原假设正确,“接受”的说法有时会产生误导,这种说法似乎暗示着原假设已经被证明是正确的了,实事上，,H,0,的真实值我们永远也无法知道，不知道真实值是什么，又怎么能证明它是什么？,H,0,只是对总体真实值的一个假定值，由样本提供的信息也就自然无法证明它是否正确,采用“不拒绝”的表述方法更合理一些，因为这种表述意味着样本提供的证据不够强大，因而没有足够的理由拒绝，这不等于已经证明原假设正确,2008,年,8,月,假设检验不能证明原假设正确,【,例,】,比如原假设为,H,0,:=10,，从该总体中抽出一个随机样本，得到,x,=9.8,，在,=0.05,的水平上，样本提供的证据没有推翻这一假设，我们说“接受”原假设，这意为着样本提供的证据已经证明,=10,是正确的。如果我们将原假设改为,H,0,:=10.5,，同样，在,=0.05,的水平上，样本提供的证据也没有推翻这一假设，我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢？,其人弗能应也,2008,年,8,月,假设检验不能证明原假设正确,假设检验中通常是先确定显著性水平，这就等于控制了第,类错误的概率，但犯第,类错误的概率却是不确定的,在拒绝,H,0,时，犯第,类错误的概率不超过给定的显著性水平,，当样本结果显示没有充分理由拒绝原假设时，也难以确切知道第,类错误发生的概率,采用“不拒绝”而不采用“接受”的表述方式，在多数场合下便避免了,错误发生的风险,因为“接受”所得结论可靠性将由第,类错误的概率,来测量，而,的控制又相对复杂，有时甚至根本无法知道的值，除非你能确切给出,，否则就不宜表述成“接受”原假设,2008,年,8,月,假设检验不能证明原假设正确,在实际检验中，针对一个具体的问题，将检验结果表述为“不拒绝”原假设，这似乎让人感到无所是从,比如，你想购买一批产品，检验的结果没有拒绝原假设，即达到合同规定的标准要求，你是否购买这批产品呢？这时，你可以对检验的结果采取某种默认态度，退一步说，你可以将检验结果表述为,“可以接受”,原假设，你但这并不等于说你,“确实接受”,它,2008,年,8,月,统计上显著不一定有实际意义,当拒绝原假设时，我们称样本结果是,统计上显著的,(statistically Significant),当不拒绝原假设时，我们称样本结果是,统计上不显著的,在“显著”和“不显著”之间没有清除的界限，只是在,P,值越来越小时，我们就有越来越强的证据，检验的结果也就越来越显著,2008,年,8,月,“显著的”,(,Significant,),一词的意义在这里并不是,“重要的”,，而是指,“非偶然的”,一项检验在统计上是,“显著的”,，,意思是指：这样的,(,样本,),结果不是偶然得到的，或者说，不是靠机遇能够得到的,如果得到这样的样本概率,(P),很小，则拒绝原假设,在这么小的概率下竟然得到了这样的一个样本，表明这样的样本经常出现，所以，样本结果是显著的,统计上显著不一定有实际意义,2008,年,8,月,统计上显著不一定有实际意义,在进行决策时，我们只能说,P,值越小，拒绝原假设的证据就越强，检验的结果也就越显著,但,P,值很小而拒绝原假设时，并不一定意味着检验的结果就有实际意义,因为假设检验中所说的“显著”仅仅是“统计意义上的显著”,一个在统计上显著的结论在实际中却不见得就很重要，也不意味着就有实际意义,因为值与样本的大小密切相关，样本量越大，检验统计量的,P,值也就越大，,P,值就越小，就越有可能拒绝原假设,2008,年,8,月,统计上显著不一定有实际意义,如果你主观上要想拒绝原假设那就一定能拒绝它,这类似于我们通常所说的“,欲加之罪，何患无词,”,只要你无限制扩大样本量，几乎总能拒绝原假设,当样本量很大时，解释假设检验的结果需要小心,在大样本情况下，总能把与假设值的任何细微差别都能查出来，即使这种差别几乎没有任何实际意义,在实际检验中，不要刻意追求“统计上的”显著性，也不要把统计上的显著性与实际意义上的显著性混同起来,一个在统计上显著的结论在实际中却不见得很重要，也不意为着就有实际意义,2008,年,8,月,6.2,一个总体参数的检验,6.2.1,总体均值的检验,6.2.2,总体比例的检验,6.2.3,总体方差的检验,第,6,章假设检验,2008,年,8,月,6.2.1,总体均值的检验,(,大样本,),6.2,一个总体参数的检验,2008,年,8,月,总体均值的检验,(,大样本,),1.,假定条件,大样本,(,n,30),使用,z,检验统计量,2,已知：,2,未知：,2008,年,8,月,总体均值的检验,(,2,已知,),(,例题分析,大样本,),【,例,】,一种罐装饮料采用自动生产线生产，每罐的容量是,255ml,，,标准差为,5ml,。,为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了,40,罐进行检验，测得每罐平均容量为,255.8ml,。,取显著性水平,=0.05,，检验该天生产的饮料容量是否符合标准要求？,双侧检验,2008,年,8,月,总体均值的检验,(,2,已知,),(,例题分析大样本,),H,0,：,=255,H,1,：,255,=,0.05,n,=,40,临界值,(,c,):,检验统计量,:,决策,:,结论,:,用,Excel,中的,【NORMSDIST】,函数得到的双尾检验,P=0.312945,不拒绝,H,0,没有证据表明该天生产的饮料不符合标准要求,z,0,1.96,-1.96,0.005,拒绝,H,0,拒绝,H,0,0.005,2008,年,8,月,总体均值的检验,(z,检验,),(,P,值的计算与应用,),第,1,步：,进入,Excel,表格界面，直接点击,【,fx,】,第,2,步：,在函数分类中点击,【,统计,】,，并在函数名,菜单下选择,【,NORMSDIST,】,，然后,【,确定,】,第,3,步：,将,z,的绝对值,1.01,录入，得到的函数值为,0.843752345,P,值,=2(1-,0.843752345,)=,0.312495,P,值远远大于,，故不拒绝,H,0,2008,年,8,月,总体均值的检验,(,2,未知,),(,例题分析,大样本,),【,例,】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。,生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据，检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低？,(,=0.01),左侧检验,50,个零件尺寸的误差数据,(,mm,),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,2008,年,8,月,总体均值的检验,(,例题分析,大样本,),H,0,：,1.35,H,1,：,1.35,=,0.01,n,=,50,临界值,(,c,):,检验统计量,:,拒绝,H,0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策,:,结论,:,-2.33,z,0,拒绝,H,0,0.01,2008,年,8,月,总体均值的检验,(,P,值的计算与应用,大样本,),第,1,步：,进入,Excel,表格界面，直接点击,【,f,(,x,),】,第,2,步：,在函数分类中点击,【,统计,】,，并在函数名的菜单下选,择,【,ZTEST,】,，然后,【,确定,】,第,3,步：,在所出现的对话框,【,Array,】,框中，输入原始数据所,在区域；在,【,X,】,后输入参数的某一假定值,(,这里为,1.35,),；在,【,Sigma,】,后输入已知的总体标准差,(,若总,体标准差未知则可忽略不填，系统将自动使用样本,标准差代替,),第,4,步：,用,1,减去得到的函数值,0.995421023,即为,P,值,P,值,=,1-0.995421023=,0.004579,P,值,5200,=,0.05,n,=,36,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.000088,=0.05),改良后的新品种产量有显著提高,决策,:,结论,:,z,0,拒绝,H,0,0.05,1.645,2008,年,8,月,总体均值的检验,(,z,检验,),(,P,值的图示,),抽样分布,P,=,0.000088,0,1.645,a,=,0.05,拒绝,H,0,1-,计算出的样本统计量,=3.75,P,值,2008,年,8,月,总体均值的检验,(,小样本,),1.,假定条件,总体服从正态分布,小样本,(,n,=0.05,，故不拒绝,H,0,2008,年,8,月,一个总体均值的检验,(,作出判断,),是否已知,小,样本量,n,大,是否已知,否,t,检验,否,z,检验,是,z,检验,是,z,检验,2008,年,8,月,6.2.2,总体比例的检验,6.2,一个总体参数的检验,2008,年,8,月,总体比例检验,假定条件,总体服从二项分布,可用正态分布来近似,(,大样本,),检验的,z,统计量,0,为假设的总体比例,2008,年,8,月,总体比例的检验,(,例题分析,),【,例,】,一种以休闲和娱乐为主题的杂志，声称其读者群中有,80%,为女性。为验证这一说法是否属实，某研究部门抽取了由,200,人组成的一个随机样本，发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,，检验该杂志读者群中女性的比例是否为,80%,？它们的,P,值各是多少？,2008,年,8,月,总体比例的检验,(,例题分析,),H,0,：,=80%,H,1,：,80%,=0.05,n,=,200,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.013328,=0.01),没有证据表明,“,该杂志声称读者群中有,80%,为女性,”,的看法不正确,决策,:,结论,:,z,0,2.58,-2.58,0.005,拒绝,H,0,拒绝,H,0,0.005,2008,年,8,月,6.2.3,总体方差的检验,6.2,一个总体参数的检验,2008,年,8,月,总体方差的检验,(,2,检验,),检验一个总体的方差或标准差,假设总体近似服从正态分布,使用,2,分布,检验统计量,假设的总体方差,2008,年,8,月,总体方差的检验,(,例题分析,),【,例,】,啤酒生产企业采用自动生产线灌装啤酒，每瓶的装填量为,640,ml,，,但由于受某些不可控因素的影响，每瓶的装填量会有差异。此时，不仅每瓶的平均装填量很重要，装填量的方差同样很重要。如果方差很大，会出现装填量太多或太少的情况，这样要么生产企业不划算，要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过,4,ml,。,企业质检部门抽取了,10,瓶啤酒进行检验，得到的样本标准差为,s,=3.8,ml,。,试以,0.05,的显著性水平检验装填量的标准差是否符合要求？,2008,年,8,月,总体方差的检验,(,例题分析,),H,0,：,2,4,2,H,1,：,2,4,2,=0.,10,df,=,10-1=9,临界值,(,s,):,统计量,:,不拒绝,H,0,(p=0.52185),没有证据表明,装填量的标准差不符合要求,2,0,16.9190,=0.05,决策,:,结论,:,2008,年,8,月,6.3,两个总体参数的检验,6.3.1,两个总体均值之差的检验,6.3.2,两个总体比例之差的检验,6.3.3,两个总体方差比的检验,第,6,章假设检验,2008,年,8,月,6.3.1,两个总体均值之差的检验,6.3,两个总体参数的检验,2008,年,8,月,两个总体均值之差的检验,(,独立大样本,),1.,假定条件,两个样本是独立的随机样本,正态总体或非正态总体大样本,(,n,1,30,和,n,2,30),检验统计量,1,2,，,2,2,已知：,1,2,，,2,2,未知：,2008,年,8,月,两个总体均值之差的检验,(,例题分析,独立大样本,),【,例,】,某公司对男女职员的平均小时工资进行了调查，独立抽取了具有同类工作经验的男女职员的两个随机样本，并记录下两个样本的均值、方差等资料如右表。在显著性水平为,0.05,的条件下，能否认为男性职员与女性职员的平均小时工资存在显著差异？,两个样本的有关数据,男性职员,女性职员,n,1,=44,n,1,=32,x,1,=75,x,2,=70,S,1,2,=64,S,2,2,=42.25,2008,年,8,月,两个总体均值之差的检验,(,例题分析,独立大样本,),H,0,：,1,-,2,=0,H,1,：,1,-,2,0,=,0.05,n,1,=,44,，,n,2,=,32,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,该公司男女职员的平均小时工资之间存在显著差异,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,2008,年,8,月,两个总体均值之差的检验,(,独立小样本：,1,2,，,2,2,已知,),假定,条件,两个独立的小样本,两个,总体都是正态分布,1,2,，,2,2,已知,检验,统计量,2008,年,8,月,两个总体均值之差的检验,(,独立小样本：,1,2,，,2,2,未知但,1,2,=,2,2,),假定,条件,两个独立的小样本,两个,总体都是正态分布,1,2,、,2,2,未知但相等，即,1,2,=,2,2,检验,统计量,其中：,自由度：,2008,年,8,月,两个总体均值之差的检验,(,独立小样本：,1,2,，,2,2,未知且不等,1,2,2,2,),假定,条件,两个,总体都是正态分布,1,2,，,2,2,未知且不相等，即,1,2,2,2,样本量不相等，,即,n,1,n,2,检验,统计量,自由度：,2008,年,8,月,两个总体均值之差的检验,(,例题分析,独立小样本，,1,2,=,2,2,),【,例,】,甲、乙两台机床同时加工某种同类型的零件，已知两台机床加工的零件直径,(,单位：,cm),分别服从正态分布，并且有,1,2,=,2,2,。为比较两台机床的加工精度有无显著差异，分别独立抽取了甲机床加工的,8,个零件和乙机床加工的,7,个零件，通过测量得到如下数据。在,=0.05,的显著性水平下，样本数据是否提供证据支持,“两台机床加工的零件直径不一致”的看法？,两台机床加工零件的样本数据,(,cm,),甲,20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9,乙,20.7,19.8,19.5,20.8,20.4,19.6,20.2,2008,年,8,月,两个总体均值之差的检验,(,例题分析,1,2,=,2,2,),H,0,：,1,-,2,=,0,H,1,：,1,-,2,0,=,0.05,n,1,=,8,，,n,2,=,7,临界值,(,c,):,检验统计量,:,决策,:,结论,:,不拒绝,H,0,没有证据表明,两台机床加工的零件直径不一致,t,0,2.160,-2.160,0.025,拒绝,H,0,拒绝,H,0,0.025,2008,年,8,月,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步：,将原始数据输入到,Excel,工作表格中,第,2,步：,选择,【,工具,】,下拉菜单并选择,【,数据分析,】,选项,第,3,步：,在,【,数据分析,】,对话框中选择,【,t-,检验：双样本,等,方,差假设,】,第,4,步：,当对话框出现后,在,【,变量,1,的区域,】,方框中输入第,1,个样本的数据区域,在,【,变量,2,的区域,】,方框中输入第,2,个样本的数据区域,在,【,假设平均差,】,方框中输入假定的总体均值之差,在,【,】,方框中输入给定的显著性水平,(,本例为,0.05,),在,【,输出选项,】,选择计算结果的输出位置，然后,【,确,定,】,用,Excel,进行检验,2008,年,8,月,两个总体均值之差的检验,(,例题分析,独立小样本，,1,2,2,2,),【,例,】,甲、乙两台机床同时加工某种同类型的零件，已知两台机床加工的零件直径,(,单位：,cm),分别服从正态分布，并且有,1,2,2,2,。为比较两台机床的加工精度有无显著差异，分别独立抽取了甲机床加工的,8,个零件和乙机床加工的,7,个零件，通过测量得到如下数据。在,=0.05,的显著性水平下，样本数据是否提供证据支持,“两台机床加工的零件直径不一致”的看法？,两台机床加工零件的样本数据,(,cm,),甲,20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9,乙,20.7,19.8,19.5,20.8,20.4,19.6,20.2,2008,年,8,月,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步：,将原始数据输入到,Excel,工作表格中,第,2,步：,选择“工具”下拉菜单并选择,【,数据分析,】,选项,第,3,步：,在,【,数据分析,】,对话框中选择,【,t-,检验：双样本,异,方,差假设,】,第,4,步：,当对话框出现后,在,【,变量,1,的区域,】,方框中输入第,1,个样本的数据区域,在,【,变量,2,的区域,】,方框中输入第,2,个样本的数据区域,在,【,假设平均差,】,方框中输入假定的总体均值之差,在,【,】,方框中输入给定的显著性水平,(,本例为,0.05,),在,【,输出选项,】,选择计算结果的输出位置，然后,【,确,定,】,用,Excel,进行检验,2008,年,8,月,两个总体均值之差的检验,(,配对,样本,),假定条件,两个总体配对差值构成的总体服从正态分布,配对差是由差值总体中随机抽取的,数据配对或匹配,(,重复测量,(,前,/,后,),检验统计量,样本差值均值,样本差值标准差,2008,年,8,月,匹配样本,(,数据形式,),观察序号,样本,1,样本,2,差值,1,x,11,x,21,d,1,=,x,11,-,x,21,2,x,12,x,22,d,2,=,x,12,-,x,22,M,M,M,M,i,x,1,i,x,2,i,d,i,=,x,1,i,-,x,2,i,M,M,M,M,n,x,1,n,x,2,n,d,n,=,x,1,n,-,x,2,n,2008,年,8,月,两个总体均值之差的检验,(,例题分析,配对样本,),【,例,】,某饮料公司开发研制出一新产品，为比较消费者对新老产品口感的满意程度，该公司随机抽选一组消费者,(,8,人,),，每个消费者先品尝一种饮料，然后再品尝另一种饮料，两种饮料的品尝顺序是随机的，而后每个消费者要对两种饮料分别进行评分,(,0,分,10,分,),，评分结果如下表。取显著性水平,=0.05,，该公司是否有证据认为消费者对两种饮料的评分存在显著差异？,两种饮料平均等级的样本数据,旧饮料,5,4,7,3,5,8,5,6,新饮料,6,6,7,4,3,9,7,6,2008,年,8,月,两个总体均值之差的检验,(,用,Excel,进行检验,配对样本,),第,1,步：,选择“,工具,”下拉菜单,，并,选择,【,数据分析,】,选项,第,3,步：,在分析工具中选择,【,t,检验：平均值成对二样本分析,】,第,4,步：,当出现对话框后,在,【,变量,1,的区域,】,方框内键入变量,1,的,数据区域,在,【,变量,2,的区域,】,方框内键入,变量,2,的数据区域,在,【,假设平均差,】,方框内键入假设的差值,(,这里为,0),在,【,】,框内键入给定的显著性水平，然后,【,确定,】,用,Excel,进行检验,2008,年,8,月,两个总体均值之差的检验,(TTEST,函数的应用,),函数语法：,TTEST(array1,array2,tails,type),说明：,【,Array1,】,为样本,1,的数据区域,【,array2,】,为样本,2,的数据区域,【,tails,】,表示分布曲线的尾数,如果,tails=1,，返回分布的单尾概率,如果,tails=2,，返回分布的双尾概率,【,type,】,为检验的类型,1,代表配对样本检验,1,代表双样本等方差假设,3,代表双样本异方差假设,使,用,TTEST,进行检验,2008,年,8,月,两个总体均值之差的检验,(,方法总结,),2008,年,8,月,6.3.2,两个比例均值之差的检验,6.3,两个总体参数的检验,2008,年,8,月,1.,假定条件,两个,总体都服从二项分布,可以用正态分布来近似,检验统计量,检验,H,0,：,1,-,2,=0,检验,H,0,：,1,-,2,=,d,0,两个总体比例之差的检验,2008,年,8,月,两个总体比例之差的检验,(,例题分析,),【,例,】,一所大学准备采取一项学生在宿舍上网收费的措施，为了解男女学生对这一措施的看法是否存在差异，分别抽取了,200,名男学生和,200,名女学生进行调查，其中的一个问题是：“你是否赞成采取上网收费的措施？”其中男学生表示赞成的比例为,27%,，女学生表示赞成的比例为,35%,。调查者认为，男学生中表示赞成的比例显著低于女学生。取显著性水平,=0.05,，样本提供的证据是否支持调查者的看法？,2008,年,8,月,两个总体比例之差的检验,(,例题分析,),H,0,：,1,-,2,0,H,1,：,1,-,2,0,=,0.05,n,1,=,200,n,2,=,200,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,(,P,=,0.041837 8%,=,0.01,n,1,=,300,n,2,=,300,临界值,(,c,):,检验统计量,:,决策,:,结论,

展开阅读全文