资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,5-,*,统计学概论,第,5,章 假设检验,假设检验在统计方法中的地位,2,假设检验与区间估计的关系,假设检验与区间估计是统计推断的两个组成部分。,假设检验与区间估计的区别主要在于:,区间估计是用给定的大概率推断出总体参数的范围,总体参数在估计前是未知的。,假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。如先对总体均值提出一个假设,然后利用样本信息去检验这个假设是否成立。,3,第一节 假设检验概述,主要内容,假设检验的概念与思想,假设检验的步骤,假设检验中的小概率原理,双侧检验和单侧检验,假设检验中的,P,值,5,假设检验的概念与思想,什么是假设,?(hypothesis),对总体参数的的数值所作的一种陈述,总体参数包括总体均值、成数、方差等,分析之前必需陈述,我认为该地区新生婴儿的平均体重为,3190,克,!,7,什么是假设检验,?,(hypothesis testing),1.,事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立,2.,有参数假设检验和,非,参数假设检验,3.,采用逻辑上的反证法,依据统计上的小概率原理,8,假设检验的基本思想,.,因此我们拒绝假设,=50,.,如果这是总体的真实均值,样本均值,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值,.,20,9,总体,假设检验的过程,抽取随机样本,均值,X,=20,我认为人口的平均年龄是,50,岁,提出假设,拒绝假设,!,别无选择,.,作出决策,10,假设检验的步骤,假设检验的步骤,提出假设,确定适当的检验统计量,规定显著性水平,计算检验统计量的值,作出统计决策,12,提出原假设和备择假设,什么是原假设?,(null hypothesis),待检验的假设,又称“,0,假设”,表示为,H,0,什么是备择假设?,(alternative hypothesis),与原假设对立的假设,表示为,H,1,13,确定适当的检验统计量,什么检验统计量?,1.,用于假设检验决策的统计量,2.,选择统计量的方法与参数估计相同,需考虑,是大样本还是小样本,总体方差已知还是未知,检验统计量的基本形式为,14,规定显著性水平,(significant level),什么显著性水平?,1.,是一个概率值,2.,原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝,域,3.,表示为,,,常用的,值有,0.01,0.05,0.10,4.,由研究者事先确定,15,作出统计决策,计算检验的统计量,根据给定的显著性水平,,查表得出相应的临界值,z,或,z,/2,,,t,或,t,/2,。,将检验统计量的值与临界值进行比较,得出接受或拒绝原假设的结论,16,假设检验中的小概率原理,假设检验中的小概率原理,什么小概率?,1.,在一次试验中,一个几乎不可能发生的事件发生的概率,2.,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,3.,小概率由研究者事先确定,18,假设检验中的小概率原理,3190,3205.68,3174.32,3210,由以往的资料可知,某地新生儿的平均体重为,3190,克,从今年的新生儿中随机抽取,100,个,测得其平均体重为,3210,克,问今年新生儿的平均体重是否为,3190,克(即与以往的体重是否有显著差异)?,为方便,设今年新生儿总体的体重标准差为,80,克。,右图是在假设今年新生儿总体平均体重为,3190,克(这就是原假设)的情况下,样本平均体重的抽样分布(标准差为,80,克,样本容量为,100,),可以看出,95%,样本均值落在红线之间的区域。,小概率原理,:我们认为,某次抽样,得到的样本平均体重,不可能,落在红线之外的区域,(,即落在红线之外被看成是小概率事件,),,如果落在红线之外,则是在一次试验中小概率事件发生了,那么我们据此认为“今年新生儿总体平均体重为,3190,克”这一假设是不成立的。红线的位置在哪里,即显著性水平是多大,由研究者事先确定。,0.025,19,假设检验中的两类错误,(,决策风险,),假设检验中的两类错误,1.,第一类错误(弃真错误),原假设为真时拒绝原假设,会产生一系列后果,第一类错误的概率为,,被称为显著性水平,2.,第二类错误(取伪错误),原假设为假时接受原假设,第二类错误的概率为,(Beta),21,H,0,:,无罪,陪审团审判,裁决,实际情况,无罪,有罪,无罪,正确,错误,有罪,错误,正确,H,0,检验,决策,实际情况,H,0,为真,H,0,为假,接受,H,0,正确决策,(1,a),第二类错误,(,b),拒绝,H,0,第一类错误,(,a),正确决策,(1-,b),假设检验就好像一场审判过程,统计检验过程,假设检验中的两类错误(决策结果),22,错误和,错误的关系,你不能同时减少两类错误,!,和的关系就像翘翘板,,小,就大,,大,就小,23,它们这种关系可通过正态分布的统计检验,图示如下:,24,/2,/2,X,(x),增大样本容量,n,时,可以使,和,同时减小,.,注意,:,z,1-/2,-z,1-/2,=,0,0,(,0,),25,影响,错误的因素,1.,总体参数的真值,随着假设的总体参数的减少而增大,2.,显著性水平,当,减少时增大,3.,总体标准差,当,增大时增大,4.,样本容量,n,当,n,减少时增大,26,哪类错误是首要控制目标,一般来讲,我们更关心原假设为真时,却把它拒绝的可能性,而这正是,错误所表现的内容。,错误是首要控制目标。,27,双侧检验和单侧检验,双侧检验与单侧检验,(,假设的形式,),假设,研究的问题,双侧检验,左侧检验,右侧检验,H,0,m,=,m,0,m,m,0,m,m,0,H,1,m,m,0,m,m,0,是何种检验,决定于备择假设的不等式形式与方向,29,双侧检验,(,原假设与备择假设的确定,),属于,决策中的假设检验,不论是拒绝,H,0,还是不能拒绝,H,0,,,都必需采取相应的行动措施,例如,某种零件的尺寸,要求其平均长度为,10cm,,,大于或小于,10cm,均属于不合格,我们想要证明,(,检验,),大于或小于这两种可能性中的任何一种是否成立,建立的原假设与备择假设应为,H,0,:,=,10 H,1,:,10,30,双侧检验,(,显著性水平与拒绝域,),抽样分布,H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,1-,置信水平,31,双侧检验,(,显著性水平与拒绝域,),H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,抽样分布,1-,置信水平,32,双侧检验,(,显著性水平与拒绝域,),H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,抽样分布,1-,置信水平,33,双侧检验,(,显著性水平与拒绝域,),H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒绝域,抽样分布,1-,置信水平,34,单侧检验,(,原假设与备择假设的确定,),将研究者,想收集证据予以支持的假设,作为备择假设,H,1,例如,一个研究者总是想证明自己的研究结论是正确的,一个销售商总是想正确供货商的说法是不正确的,备择假设的方向与想要证明其正确性的方向一致,将研究者想收集证据证明其不正确的假设作为原假设,H,0,先确立备择假设,H,1,35,单侧检验,(,原假设与备择假设的确定,),一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到,1500,小时以上。检验这一结论是否成立,研究者总是想证明自己的研究结论,(,寿命延长,),是正确的,备择假设的方向为“,”(,寿命延长,),建立的原假设与备择假设应为,H,0,:,1500 H,1,:,1500,36,单侧检验,(,原假设与备择假设的确定,),一项研究表明,改进生产工艺后,会使产品的废品率降低到,2%,以下。检验这一结论是否成立,?,研究者总是想证明自己的研究结论,(,废品率降低,),是正确的,备择假设的方向为“,”(,废品率降低,),建立的原假设与备择假设应为,H,0,:,2%H,1,:,2%,37,单侧检验,(,原假设与备择假设的确定,),某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在,1000,小时以上。如果你准备进一批货,怎样进行检验,检验权在销售商一方,作为销售商,你总是想收集证据证明生产商的说法,(,寿命在,1000,小时以上,),是不是正确的,备择假设的方向为“,”(,寿命不足,1000,小时,),建立的原假设与备择假设应为,H,0,:,1000 H,1,:,不能拒绝,H,0,若,p-,值,/2,不能拒绝,H,0,若,p-,值,1020,=0.05,n,=16,临界值,(s):,检验统计量,:,在,=0.05,的水平上拒绝,H,0,有证据表明这批灯泡的使用寿命有显著提高,决策,:,结论,:,Z,0,拒绝域,0.05,1.645,60,2,未知大样本均值的检验,(,例题分析,),【,例,】,某电子元件批量生产的质量标准为平均使用寿命,1200,小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了,100,件作为样本,测得平均使用寿命,1245,小时,标准差,300,小时。能否说该厂生产的电子元件质量显著地高于规定标准?,(,0.05),单侧,检验,61,2,未知大样本均值的检验,(,例题分析,),H,0,:,1200,H,1,:,1200,=0.05,n,=100,临界值,(s):,检验统计量,:,在,=0.05,的水平上不能拒绝,H,0,不能认为该厂生产的元件寿命显著地高于,1200,小时,决策,:,结论,:,Z,0,拒绝域,0.05,1.645,62,总体均值的检验,(,2,未知小样本,),1.,假定条件,总体为正态分布,2,未知,且小样本,2.,使用,t,统计量,63,2,未知小样本均值的检验,(,例题分析,),【,例,】,某机器制造出的肥皂厚度为,5cm,,,今欲了解机器性能是否良好,随机抽取,10,块肥皂为样本,测得平均厚度为,5.3cm,,,标准差为,0.3cm,,,试以,0.05,的显著性水平检验机器性能良好的假设。,双侧检验,64,2,未知小样本均值的检验,(,例题分析,),H,0,:,=5,H,1,:,5,=0.05,df,=10-1=9,临界值,(s):,检验统计量,:,在,=0.05,的水平上拒绝,H,0,说明该机器的性能不好,决策,:,结论:,t,0,2.262,-2.262,.025,拒绝,H,0,拒绝,H,0,.025,65,2,未知小样本均值的检验,(,P,值的计算与应用,),第,1,步:进入,Excel,表格界面,选择“插入”下拉菜单,第,2,步:选择“函数”点击,,并,在函数分类中点击“统,计”,然后,在函数名的菜单中选择字符,“,TDIST,”,,,确定,第,3,步:在弹出的,X,栏中录入计算出的,t,值,3.16,在自由度,(,Deg-freedom,),栏中录入,9,在,Tails,栏中录入,2,,表明是双侧检验,(,单测,检验则在该栏内录入,1,),P,值的结果为,0.011550.025,,,拒绝,H,0,66,2,未知小样本均值的检验,(,例题分析,),【,例,】,一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下大于,40000,公里,对一个由,20,个轮胎组成的随机样本作了试验,测得平均值为,41000,公里,标准差为,5000,公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?,(,=0.05),单侧检验!,67,均值的单尾,t,检验,(,计算结果,),H,0,:,40000,H,1,:,40000,=0.05,df,=20-1=19,临界值,(s):,检验统计量,:,在,=0.05,的水平上不能拒绝,H,0,有证据表明轮胎使用寿命显著地大于,40000,公里,决策,:,结论,:,-1.7291,t,0,拒绝域,.05,68,总体比例的检验,(,Z,检验,),一个总体比例检验,假定条件,有两类结果,总体服从二项分布,可用正态分布来近似,比,例检验的,Z,统计量,0,为假设的总体比例,70,一个总体比例的检验,(,例题分析,),【,例,】,一项统计结果声称,某市老年人口(年龄在,65,岁以上)的比重为,14.7%,,该市老年人口研究会为了检验该项统计是否可靠,随机抽选了,400,名居民,发现其中有,57,人年龄在,65,岁以上。调查结果是否支持该市老年人口比重为,14.7%,的看法?,(,=,0.05,),双侧检验,71,一个总体比例的检验,(,例题分析,),H,0,:,=14.7%,H,1,:,14.7%,=0.05,n,=400,临界值,(s):,检验统计量,:,在,=0.05,的水平上不能拒绝,H,0,该市老年人口比重为,14.7%,决策,:,结论,:,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,72,总体方差的检验,(,2,检验,),方差的卡,方,(,2,),检验,检验一个总体的方差或标准差,假设总体近似服从正态分布,检验统计量,样本方差,假设的总体方差,74,方差的卡,方,(,2,),检验,(,例题分析,),【,例,】,某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升,(,1000cm,3,),的饮料误差上下不超过,1cm,3,。,如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取,25,瓶,分别进行测定,(,用样本减,1000cm,3,),,,得到如下结果。,检验该机器的性能是否达到设计要求,(,=0.05,),0.3,-0.4,-0.7,1.4,-0.6,-0.3,-1.5,0.6,-0.9,1.3,-1.3,0.7,1,-0.5,0,-0.6,0.7,-1.5,-0.2,-1.9,-0.5,1,-0.2,-0.6,1.1,绿色,健康饮品,绿色,健康饮品,双侧检验,75,方差的卡,方,(,2,),检验,(,例题分析,),H,0,:,2,=1,H,1,:,2,1,=0.05,df,=25-1=24,临界值,(s):,统计量,:,在,=0.05,的水平上不能拒绝,H,0,可以认为该机器的性能达到设计要求,2,0,39.36,12.40,/2=.05,决策,:,结论,:,76,用置信区间进行检验,用置信区间进行检验,(,双侧检验,),1.,求出双侧检验均值的置信区间,2,已知时:,2,未知时:,2.,若总体的假设值,0,在置信区间外,拒绝,H,0,78,用置信区间进行检验,(,单侧检验,),1.,左侧检验:求出单边置信下限,2.,若总体的假设值,0,小于单边置信下限,拒绝,H,0,3.,右侧检验:求出单边置信上限,4.,若总体的假设值,0,大于单边置信上限,拒绝,H,0,79,用置信区间进行检验,(,例题分析,),【,例,】,一种袋装食品每包的标准重量应为,1000,克。现从生产的一批产品中随机抽取,16,袋,测得其平均重量为,991,克。已知这种产品重量服从标准差为,50,克的正态分布。试确定这批产品的包装重量是否合格?,(,=0.05),双侧检验!,香脆蛋卷,80,用置信区间进行检验,(,例题分析,),H,0,:,=,1000,H,1,:,1000,=0.05,n,=49,临界值,(s):,置信区间为,决策,:,结论,:,假设的,0,=1000,在置信区间内,不能拒绝,H,0,表明这批产品的包装重量合格,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,81,假设检验注意事项,备择假设比原假设更重要,由实际问题来确定,一般把期望出现的结论作为备择假设。,在进行假设检验时,一般是通过拒绝原假设接受备择假设,来支持,/,得到我们所想要的。,拒绝原假设时,可能犯的错误是弃真错误(概率为,),这一错误是可控的,并且是首要控制的目标。,而如果是接受了假设,此时可能犯的错误是纳伪错误,概率是,,这是不容易控制的,而且一般来讲其值较大。,假设检验的结果不是,100%,可靠的,是有可能犯错误的,大家一定要牢记这一点!,83,
展开阅读全文