资源描述
广东工业大学,广东工业大学,广东工业大学,第八章 假设检验,1,假设检验,2,正态总体均值的假设检验,3,正态总体方差的假设检验,4,置信区间与假设检验的关系,6,分布拟合检验,1,假设检验,一、引例,设一箱中有红白两种颜色的球共,100,个,甲说这里面有,99,个白球,1,个红球,乙从箱中任取一个,发现是红球,问甲的说法是否正确?,先作假设 :,箱中确有,99,个白球,如果假设 正确,则从箱中任取一个球是红球的概率只有,0.01,,是小概率事件。通常认为在一次随机试验中,概率小的事件不易发生,因此,若已从箱中任取一个,发现是白球,则没有理由怀疑假设 的正确性。今乙从箱中任取一个,发现是红球,即小概率事件竟然在一次试验中发生了,故有理由拒绝假设 ,即认为甲的说法不正确。,二、假设检验的思想方法,假设检验的基本思想实质上是带有某种概率性质的反证法。为了检验一个假设是否正确,首先假设该假设正确,然后根据抽取到的样本对假设作出接受或拒绝的决策。如果样本观察值导致了不合理的现象发生,就应拒绝假设,否则应该接受假设。,假设检验中所谓“不合理”,并非逻辑中的绝对矛盾,而是基于人们的实践活动中广泛采用的原则,即,小概率事件在一次试验中是几乎不发生的,。但概率小到什么程度才能算作“小概率事件”?显然,“小概率事件”的概率越小,否定原假设就越有说服力。,常记这个概率为 ,称为,检验的显著性水平,。对不同的问题,检验的显著性水平不一定相同,但一般应取为较小的值。,如:,0.1,,,0.05,或,0.01,等。,例,1,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从,该厂产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,试检验,这批砖的平均抗拉强度为,32.5,是否成立,取显著性水平,2,、原理,(,1,)提出假设,(,2,)在假设 成立的条件下,构造一个小概率事件,A,,,小概率原理:小概率事件在一次试验中是不太会发生的。,(,3,)根据样本值判断:,若在这一次试验中小概率事件,A,发生了,则拒绝假设,若在这一次试验中小概率事件,A,未发生,则接受假设,1,、原假设与备择假设,3,、接受域与拒绝域,小概率,拒绝域:,R,样本点落入,R,:,拒绝,接受域:,样本点落入,:,接受,第一类错误:弃真,正确,但拒绝了它。,不正确,但接受了它。,第二类错误:采伪,犯第一类错误的概率:,显著性水平,4,、两类错误,例,1,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从,该厂产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,试检验,这批砖的平均抗拉强度为,32.5,是否成立,取显著性水平,解,:,提出原假设,找统计量,在 成立的条件下,构造拒绝域,查表得,备择假设:,使得,由样本值算得,拒绝,临界值,(,1,)提出假设,(,2,)找统计量;,(,3,)求临界值;,对给定的显著性水平,构造拒绝域,求出临界值;,(,4,)求观察值,根据给定的样本计算出统计量的观察值;,(,5,)作出判断,统计量的观察值落入拒绝域,则拒绝;否则接受。,5,、假设检验的基本步骤,要求:在 下的分布知道,例,1,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从,该厂产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,试检验,这批砖的平均抗拉强度为,32.5,是否成立,取显著性水平,解,:,提出原假设,找统计量,在 成立的条件下,构造拒绝域,查表得,备择假设:,使得,由样本值算得,拒绝,临界值,例,1,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从,该厂产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,试检验,这批砖的平均抗拉强度为,32.5,是否成立,取显著性水平,解,:,提出原假设,备择假设:,找统计量,在 成立的条件下,构造拒绝域,查表得,使得,由样本值算得,拒绝,临界值,例,1,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从,该厂产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,试检验,这批砖的平均抗拉强度为,32.5,是否成立,取显著性水平,解,:,提出原假设,备择假设:,双边检验:,单边检验:,右边检验,左边检验,例,2,某工厂生产的固体燃料推进器的燃烧率服从正态分布,。现在用新方法生产了一批推进器。从中随机取,n,=25,只,测得燃烧率的样本均值为 。设在新方法下总体均方差仍为 ,问用新方法生产的推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?,解,按题意提出假设,找统计量,在 成立的条件下,又,得,即,得拒绝域为,或,例,2,某工厂生产的固体燃料推进器的燃烧率服从正态分布,。现在用新方法生产了一批推进器。从中随机取,n,=25,只,测得燃烧率的样本均值为 。设在新方法下总体均方差仍为 ,问用新方法生产的推进器的燃烧率是否较以往生产的推进器的燃烧率有显著的提高?,解,按题意提出假设,又,得拒绝域为,或,故在显著性水平,0.005,下拒绝原假设。即认为用新方法生产的推进器的燃烧器较以往生产的有显著的提高。,2,正态总体均值的假设检验,一、单个总体 均值 的假设检验,二、两个正态总体均值差的假设检验,1,、已知,关于 的检验,2,、未知,关于 的检验,(,Z,检验),(,t,检验),三、基于成对数据的检验,(,t,检验),(,t,检验),步骤,提出假设:,找统计量:,求临界值:,求观察值:,作出判断:,查表得,若,则拒绝,若,则接受,1,、已知,关于 的检验,(,Z,检验),例,1,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从,该厂产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,试检验,这批砖的平均抗拉强度为,32.5,是否成立,取显著性水平,解,:,提出原假设,找统计量,在 成立的条件下,构造拒绝域,查表得,备择假设:,使得,由样本值算得,拒绝,临界值,步骤,提出假设:,找统计量:,求临界值:,求观察值:,作出判断:,查表得,若,则拒绝,若,则接受,2,、未知,关于 的检验,(,t,检验),双边检验,例,2,某砖厂生产的砖其抗拉强度,X,服从正态分布,今从该厂,产品中随机抽取,6,块,测得其平均抗拉强度为,31.13.,样本方差为,1.21,试检验这批砖的平均抗拉强度为,32.5,是否成立,.,取著性水平,:,解,:,提出原假设,找统计量,在 成立的条件下,构造拒绝域,查表得,备择假设:,使得,由样本值算得,拒绝,临界值,例,3,某种元件的寿命,X,(以小时记)服从正态分布 均未知。现测得过,16,只元件的寿命如下:,159 280 101 212 224 379 179 264,222 362 168 250 149 260 485 170,问是否有理由认为元件的平均寿命大于,225,(小时)?,解,:,按题意需检验,找统计量,构造拒绝域,查表得,使得,由样本值算得,接受,二、两个正态总体均值差的假设检验,设 是来自正态总体 的样本。,是来自正态总体 的样本。,且两总,体相互独立。,分别表示两总体的样本均值与样本方差。,求检验问题:,步骤,提出假设:,找统计量:,求临界值:,求观察值:,作出判断:,查表得,若,则拒绝,若,则接受,例,1,在平炉上进行一项试验以确定改变操作方法的建议是否会增加钢的得率,试验是在同一只平炉上进行的。每炼一炉钢时除操作方法外,其它条件都尽可能做到相同。先用标准方法炼一炉,然后用建议的新方法炼一炉,以后交替进行,各炼了,10,炉,其得率分别为,设这两个样本相互独立,且分别来自总体 和,均未知。问建议的新操作方法能否提高得率?,(,1,)标准方法,78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3,(,2,)新方法,79.1 81.0 77.3 79.1 80.0 79.1,79.1,77.3 80.2 82.1,三、基于成对数据的检验,(,t,检验),3,正态总体方差的假设检验,一、单个总体的情况,二、两个正态总体的情况,1,、已知,关于 的检验,2,、未知,关于 的检验,步骤,提出假设:,找统计量:,求临界值:,求观察值:,作出判断:,若,则拒绝,若,则接受,接受域,一、单个总体的情况,1,、已知,关于 的检验,例,1,某涤纶厂的生产的维尼纶的纤度(纤维的粗细程度)在正常生产的条件下,服从正态分布鞋 ,某日随机地抽取,5,根纤维,测得纤度为,1.32 1.55 1.36 1.40 1.44,问这一天涤纶纤度总体,X,的均方差是否正确?,步骤,提出假设:,找统计量:,求临界值:,求观察值:,作出判断:,若,则拒绝,若,则接受,接受域,2,、未知,关于 的检验,例,2,某厂生产的某种型号的电池,其寿命(以小时记)长期以来服从方差 的正态分布,现有一批这种电池,从它的生产情况来看,寿命的波动有所改变。现随机取,26,只电池,测出其寿命的样本方差。问根据这一数据能否推断这批电池的寿命的波动性较以往有显著的变化?,设 是来自正态总体 的样本。,是来自正态总体 的样本。,且两总,体相互独立。,分别表示两总体的样本均值与样本方差。,求检验问题:,二、两个正态总体的情况,均未知。,4,置信区间与假设检验的关系,6,分布拟合检验,一、拟合检验,设总体,的分布未知,为取自总体,的样本。,检验关于总体的分布,:,总体,X,的分布函数为,总体,X,的分布函数不是,.,A:,离散型,总体,X,的分布律为,B:,连续型,总体,X,的密度函数为,.,分析,:,分两种情形讨论,.,1,、中所假定的,X,的分布函数 不含未知参数,在 下,记 为总体,X,所有可能的取值全体。,(,1,)将 分成,k,个两两不相交的子集:,(,2,)以 记样本观察值 中落在 的个数,,那么,在,n,次试验中事件 发生的频率为 。,(,3,)当 为真时,计算概率:,(,4,)由频率的稳定性知,当,n,比较大时,不应太大,.,(,5,)取统计量,来度量样本与 中所假设分布,的吻合程度。,取检验统计量,2,、中所假定的,X,的分布函数 含未知参数 时,则先利用样本求出未知参数 的最大似然估计,.,再求出 的估计值:,取检验统计量,定理 若,n,充分大 ,则当 为真时,有,近似,近似,其中,r,是被估计的参数的个数,.,拒绝域的构造,:,在 为真时,不应太大,.,或,不应太大,.,当 过大时就拒绝,.,因此,拒绝域的形式为,对给定的显著性水平,确定,G,使得,由前述定理知,或,拟合检验,因此,得拒绝域为,或,使用条件,:,1,、样本容量,n,足够大;,2,、每个 或 不能太小。,例,1,在一实验中,每隔一定时间观察一次由某种铀所放射的到达计数器上的粒子数,X,,共观察了,100,次,得结果如下表所示,:,0 1 2 3 4 5 6 7 8 9 10 11 ,11,1 5 16 17 26 11 9 9 2 1 2 1 0,其中 是观察到有,i,个 粒子的次数,从理论上考虑知,X,应服从,泊松分布,问是否符合实际(取 )?,即在水平,0.05,下检验假设,总体,X,的服从泊松分布,解,:,(1),给出 的最大似然估计,A0,A1,A2,A3,A4,A5,A6,A7,A8,A9,A10,A11,A12,1,5,16,17,26,11,9,9,2,1,2,1,0,0.015,0.063,0.132,0.185,0.194,0.163,0.114,0.069,0.036,0.017,0.007,0.003,0.002,1.5,6.3,13.2,18.5,19.4,16.3,11.4,6.9,3.6,1.7,0.7,0.3,0.2,19.394,15.622,34.845,7.423,7.105,11.739,4.615,5.538,6,0.078,7.8,6,0.065,6.5,(2),列表,计算,接受,(3),比较,判定,例,2,自,1965,年,1,月,1,日至,1971,年,2,月,9,日共,2231,天中,全世界记录到里氏震级,4,级和,4,级以上地震计,162,次,统计如下,:,相继两次地震间隔天数,x,0-4 5-9 10-14 15-19 20-24 25-29 30-34 35-39,39,出现的频数,50 31 26 17 10 8 6 6 8,试检验相继两次地震间隔的天数,X,服从指数分布,例,3,例,4,一农场,10,年前在一鱼塘里按比例,20:15:40:25,投放了四种鱼,:,鲑鱼,鲈鱼,竹夹鱼和鲇鱼的鱼苗,.,现在在鱼塘里获得一样本如下,:,序号,1 2 3 4,种类,鲑鱼 鲈鱼 竹夹鱼 鲇鱼,数量,(,条,),132 100 200 168,试取 检验各类鱼数量的比例较,10,年前是否有显著变化,.,解,:,以,X,记鱼种类的序号,则原假设为,1 2 3 4,0.20 0.15 0.40 0.25,X,的分布律为,例表计算如下,Ai,A1,A2,A3,A4,132,100,200,168,0.20,0.15,0.40,0.25,120,90,240,150,145.20,111.11,166.67,188.16,拒绝,比较,判定,二、偏度、峰度检验,偏度,峰度,特别地,当,X,为正态随机变量时,有,设 为来自总体,X,的样本,则 的矩估计,量分别为,其中,样本偏度,样本峰度,设总体,X,服从正态分布,则当,n,充分大时,近似地有,设 为来自正态,X,的样本,,考虑检验问题:,X,为正态总体,记,则当 为真,且,n,充分大时,近似地有,由大数定律知,因此,当,X,服从正态分布为真,且,n,充分大时,,与 偏离不应太大,与 偏离不应太大,构造拒绝域:,或,其中,由标准正态分布的分位点知,因此,此检验问题的拒绝域为,或,例,5,试用偏听偏度、峰度检验法检验例,3,中的数据是否来自正态总体。,
展开阅读全文