资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,上一章介绍了对总体中未知参数的估计方法。本章将讨论统计推断的另一个重要方面统计假设检验。出于某种需要,对未知的或不完全明确的总体给出某些假设,用以说明总体可能具备的某种性质,这种假设称为,统计假设,。如正态分布的假设,总体均值的假设等。这个假设是否成立,还需要考察,这一过程称为,假设检验,,并最终作出判断,是接受假设还是拒绝假设。本章主要介绍假设检验的基本思想和常用的检验方法,重点解决正态总体参数的假设检验。,统计推断的另一个重要问题是,假设检验问题,。在总体的分布函数未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的假设,又如,对于正态总体提出数学期望,0,的假设等。,这里,先结合例子来说明假设检验的基本思,想和做法。,假设检验就是根据样本对所提出的假设作出,判断:是,接受,,还是,拒绝,。,一、假设检验问题的提出,例,1,已知某炼铁厂的铁水含碳量,X,在某种工艺条件下服从正态分布,N,(4.55,0.108,2,)。现改变了工艺条件,又测了五炉铁水,其含碳量分别为:,4.28,4.40,4.42,4.35,4.37。,根据以往的经验,总体的方差,2,=,0.108,2,一般不会改变。试问工艺改变后,铁水含碳量的均值有无改变?,显然,这里需要解决的问题是,如何根据样本判断现在冶炼的铁水的含碳量是服从,4.55的正态分布呢?还是与过去一样仍然服从,=4.55的正态分布呢?若是前者,可以认为新工艺对铁水的含碳量有显著的影响;若是后者,则认为新工艺对铁水的含碳量没有显著影响。通常,选择其中之一作为假设后,再利用样本检验假设的真伪。,当然,在两个假设中用哪一个作为原假设,哪一个作为备择假设,视具体问题的题设和要求而定。在许多问题中,当总体分布的类型已知时,只对其中一个或几个未知参数作出假设,这类问题通常称之为,参数假设检验,,如例1。而在有些问题中,当总体的分布完全不知或不确切知道,就需要对总体分布作出某种假设,这种问题称为,分布假设检验,,如例2。,接下来我们要做的事是:给出一个合理的法则,根据这一法则,利用巳知样本做出判断是接受假设H,0,,还是拒绝假设H,0,。,假设检验的一般提法是:在给定备择假设,H,1,下,利用样本对原假设,H,0,作出判断,若拒绝原假设,H,0,,那就意味着接受备择假设,H,1,,否则,就接受原假设,H,0,。,换句话说,假设检验就是要在原假设,H,0,和备择假设,H,1,中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢?对一个统计假设进行检验的依据是所谓,小概率原理,,即,概率很小的事件在一次试验中是几乎不可能发生,二、假设检验的基本思想,例如,在100件产品中,有一件次品,随机地从中取出一个产品是次品的事件就是小概率事件。,因为此事件发生的概率,=0.01很小,因此,从中任意抽一件产品恰好是次品的事件可认为几乎不可能发生的,如果确实出现了次品,我们就有理由怀疑这“100件产品中只有一件次品”的真实性。,那么,取值多少才算是小概率呢?这就要视实际问题的需要而定,一般,取0.1,0.05,0.01等。,以例1为例:首先建立假设,:,H,0,:,=,0,=4.55,,H,1,:,4.55。,其次,从总体中作一随机抽样得到一样本观察值(,x,1,,,x,2,,,x,n,)。,注意到 是的无偏估计量。因此,若,H,0,正确,,则 与,0,的偏差一般不应太大,即 不,应太大,若过分大,我们有理由怀疑,H,0,的正确性而拒,绝,H,0,。由于 ,因此,考察,的大小等价于考察 的大小,哪么如,何判断 是否偏大呢?,具体设想是,对给定的小正数,,由于事件,是概率为的小概率事件,即,因此,当用样本值代入统计量 具体,计算得到其观察值 时,若 ,即说明在一次抽样中,小概率事件居然发生了。因此依据小概率原理,有理由拒绝,H,0,,接受,H,1,;,若 ,则没有理由拒绝,H,0,,只能接受,H,0,。,将上述检验思想归纳起来,可得参数的假设检验的一般步骤:,(1)根据所讨论的实际问题建立原假设,H,0,及备择假设,H,1,;,(2)选择合适的检验统计量,Z,,并明确其分布;,(3)对预先给定的小概率,0,由确定临界值;,(4)由样本值具体计算统计量,Z,的观察值,z,,并作出判断,若|,z,|,z,/2,,则拒绝,H,0,,接受,H,1,;若|,z,|,z,/2,,则接受,H,0,。,统计量 称为,检验统计量,。,当检验统计量取某个区域,C,中的值时,就拒绝,H,0,,则称,C,为,H,0,的,拒绝域,,拒绝域的边界点称为,临界值,。如,例1中拒绝域为 ,临界值为 和,现在,我们来解决例1提出的问题:,(1)假设,H,0,:,=,0,=4.55,,H,1,:,4.55;,(2)选择检验用统计量 ;,(3)对于给定小正数,如,=0.05,查标准正态分表得到临界值,z,/2,=,z,0.025,=1.96;,因为|,z,|=3.91.96,所以拒绝,H,0,,接受,H,1,,即认为新工艺改变了铁水的平均含碳量。,(4)具体计算:这里,n,=5,,故,Z,的观察值,第类错误,,当原假设,H,0,为真时,却作出拒绝,H,0,的判断,通常称之为,弃真错误,,由于样本的随机性,犯这类错误的可能性是不可避免的。若将犯这一类错误的概率记为,则有,P,拒绝,H,0,|,H,0,为真=,。,第类错误,,当原假设,H,0,不成立时,却作出接受,H,0,的决定,这类错误称之为,取伪错误,,这类错误同样是不可避免的。若将犯这类错误的概率记为,则有,P,接受,H,0,|,H,0,为假=,。,三、假设检验中两类错误,自然,我们希望一个假设检验所作的判断犯这两类错误的概率都很小。事实上,在样本容量,n,固定的情况下,这一点是办不到的。因为当,减小时,,就增大;反之,当,减小时,就,增大。,那么,如何处理这一问题呢?,事实上,在处理实际问题中,对原假设,H,0,,我们都是经过充分考虑的情况下建立的,或者认为犯弃真错误会造成严重的后果。,例如,原假设是前人工作的结晶,具有稳定性,从经验看,没有条件发生变化,是不会轻易被否定的,如果因犯第类错误而被否定,往往会造成很大的损失。,因此,在,H,0,与,H,1,之间,我们主观上往往倾向于保护,H,0,,即,H,0,确实成立时,作出拒绝,H,0,的概率应是一个很小的正数,也就是将犯弃真错误的概率限制在事先给定的范围内,这类假设检验通常称为显著性假设检验,小正数,称为,检验水平,或称,显著性水平,。,
展开阅读全文