资源描述
,6-,*,STAT,第,6,章 假设检验,第一节 假设检验的基本概念,第二节 参数的假设检验,第三节 非参数,假设检验,假设检验在统计方法中的地位,参数估计,假设检验,统计方法,描述统计,推断统计,第一节,假设检验的基本概念,1,、,原假设,和,备择假设,2,、,检验统计量,3,、,接受域和拒绝域,4,、,显著性水平,5,、,双侧检验与单侧检验,6,、,假设检验中的两类错误,什么是假设,?,(,hypothesis,),对总体参数的具体数值所作的陈述,总体参数包括,总体均值,、,比率,、,方差,等,分析,之前,必须陈述,我认为这种新药的疗效比原有的药物更有效,!,什么是假设检验,?,(,hypothesis test,),先对总体的参数,(,或分布形式,),提出某种假设,然后利用样本信息判断假设是否成立的过程,有参数检验和,非,参数检验,逻辑上运用反证法,统计上依据小概率原理,假设检验的基本思想,.,因此我们拒绝假设,=50,.,如果这是总体的假设均值,样本均值,m,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值,.,20,总体,假设检验的过程,抽取随机样本,均值,x,=20,我认为人口的平均年龄是,50,岁,提出假设,拒绝假设,别无选择,!,作出决策,原假设与备择假设,原假设,(null hypothesis),在假设检验时首先要提出一个假设,就称原假设。又称零假设或虚拟假设,通常用,H,0,表示,例如:在质量管理中假设在正常的情况下,零件的平均长度应是,2,厘米,就建立,在提出原假设的同时,还要制定另一个假设称做备择假设。,原假设是待检验的假设,备择假设则是原假设被拒绝后替换的假设。因为对于任何一个假设检验问题所有可能的结果都应包含在两个假设之内,,非此即彼,。如上述例子中零件长度要么等于,2,厘米,要么不等于,2,厘米,备择假设通常用,表示,因此可以建立,备择假设,(alternative hypothesis),【,例,】,一种电子元件的生产标准是直径为,0.,1cm,,为对生产过程进行控制,质量检测人员定期对一台加工设备检查,确定这台设备生产的电子元件是否符合标准要求。如果元件的平均直径大于或小于,0.,1cm,,则表明生产过程不正常,必须进行调整。试建立用来检验生产过程是否正常的原假设和备择假设,提出假设,(,例题分析,),解:,研究者想收集证据予以证明的假设应该是,“,生产过程不正常,”,。建立的原假设和备择假设为,H,0,:,0.1cm,H,1,:,0.1cm,【,例,】,某厂家声称,所生产的某品牌灯管寿命不低于,4000,小时,经销商在对该灯管经销前,有关研究人员想通过抽检其中的一批灯管来验证该生产厂家的声称是否属实。试建立用于检验的原假设和备择假设。,提出假设,(,例题分析,),解:,研究者想搜集证据予以证明的假设应该是,“,灯管寿命低于,4000,小时,”,。于是原假设和备择假设应设定为,H,0,:,4000,H,1,:,临界值,拒绝,H,0,左侧检验:统计量,临界值,拒绝,H,0,假设检验步骤的总结,(一)提出原假设和备择假设,(二)确定适当的检验统计量,(三)规定显著性水平,(四)计算检验统计量的值,(五)作出统计决策,第二节,参数的假设检验,一、单个总体的均值检验,二、单一样本的比例检验,三、两个总体均值之差的检验,四、两个总体比例之差的检验,一、单个总体,的检验,1,、正态总体且,2,已知,例,某厂商声称其新开发的钓鱼线的强度服从正态分布,且平均强度为,8kg,,标准差为,0.5kg,。现从中随机抽出,50,条,测试结果为平均强度为,7.85kg,,问能否接受厂商的声称?(,=0.05,),解:,H,0,:,=8 H,1,:,8,-Z,/2,0 Z,/2,例,某厂商声称其新开发的钓鱼线的强度服从正态分布,且平均强度不超过,8kg,,标准差为,0.5kg,。现从中随机抽出,50,条,测试结果为平均强度为,8.1kg,,可否认为其平均强度比,8kg,高?(,=0.05,),解:,H,0,:,8 H,1,:,8,x,0,2,、正态总体,,2,未知,例,某种金属线的抗拉强度,XN,(,10620,,,2,),据说目前有所下降。为此从新生产的产品中任取,10,根,测得样本均值,10600kg,,样本标准差为,81kg,。可否认为其平均抗拉强度比过去下降了?(,=0.05,),解:,H,0,:,10620,H,1,:,500,1.645,二、单个总体,比例的检验,STAT,(一)确定假设,1,、,H,0,:,P=P,0,H,1,:,P,P,0,2,、,H,0,:,PP,0,H,1,:,P,P,0,3,、,H,0,:,PP,0,H,1,:,P,P,0,(二)检验统计量,当,n,很大,(,30,),且,nP,和,n,(,1P,),两者均大于等于,5,时,,STAT,例,据以往调查,购买某企业产品的顾客中,30,岁以上的男子占,50%,。该企业关心这个比例是否有变,于是随机抽取,400,名顾客进行调查,结果有,210,人为,30,岁以上的男子。该厂希望在,0.05,的显著性水平下检验这个比例是否有变。,解:,H,0,:,P=50%,H,1,:,P50%,-1.96 1.96,三、两个总体平均数之差的假设检验,STAT,(一)确定假设,1,、,H,0,:,1,2,=0,H,1,:,1,2,0,2,、,H,0,:,1,2,0,H,1,:,1,2,0,3,、,H,0,:,1,2,0,H,1,:,1,2,0,(二)确定检验统计量,正态总体、,2,未知但相等,STAT,例,两种方法生产的产品抗拉强度都近似服从正态分布。方法,1,的标准差,1,6kg,,方法,2,的标准差,2,8kg,。现从方法,1,和方法,2,生产的产品中分别抽取容量为,12,、,16,的样本,其样本均值分别,40kg,和,34kg,。管理部门想知道这两种方法生产出来的产品的平均抗拉强度是否相同(,0.05,),建立假设:,H,0,:,1,2,=0,H,1,:,1,2,0,四、两个总体比率之差的假设检验,STAT,(一)确定假设,1,、,H,0,:,P,1,=P,2,H,1,:,P,1,P,2,2,、,H,0,:,P,1,P,2,H,1,:,P,1,P,2,3,、,H,0,:,P,1,P,2,H,1,:,P,1,P,2,(二)检验统计量,当,n,很大,(,30,),且,np,和,n(1p),两者均大于,5,时,,STAT,例,一保险机构称,对于新出台的某一险种,沿海地区的人们的喜爱程度要高于内地的人们。为此进行的一次抽样调查显示:沿海和内地人们的喜爱程度分别为,0.65,、,0.55,,样本容量为,300,、,400,人。可否认为沿海比内地更喜爱这一险种(,0.01,)。,建立假设:,H,0,:,P,1,P,2,0,H,1,:,P,1,P,2,0,第三节 非参数检验,一、什么是非参数假设检验,1.,非参数检验:它泛指参数假设检验以外的各种检验。,2.,非参数检验的特点,非参数检验不依赖于总体分布。,非参数假设检验适用于较低的计量水平,如等级、顺序的计量等。,常常用于参数以外的检验,如随机变量是否服从某种规律、某种分布的拟合优度检验,数据是否随机的游程检验等。,3.,由于非参数检验只应用于顺序等计量,没有充分利用信息,其效率不如参数检验,有些数据可以同时使用参数检验和非参数检验。,二、,2,检验,(一)分类数据的拟合优度检验,1.,如何探讨数据规律,显示数据规律性的方法:频数分布表,能否了解数据来自某一分布或与某一理论分布相一致的程度如何?,2,检验,直方图和统计量的检测可能给出了一些探索性的假设。然而,这些应该用一些较为正规的方式来加以论证。拟合优度检验给出了统计意义上的证据来检验有关分布的假设。最为通用的拟合优度检验是卡方检验(,2,)。拟合优度的卡方检验的假设为:,H0,:抽样数据来自于一个特殊的分布(如正态分布),H1,:抽样数据不是来自于这个特殊的分布,2.,利用,2,进行拟合优度检验的步骤,第一步,先将观测到的数据分类,假设分成,m,类,每类中的频数为,或记为,i,(,i=1,2,m,)。,第二步:根据观测结果似乎服从某一理论分布的规律,需要进一步检验。按照理论分布,各类的频数应为,ei,=,nPi,(,i=1,2,m,),其中,Pi,为根据理论分布,观测发生在第,i,类的概率。,第三步:计算统计量,如果理论分布的参数是预先给定的(已知的),则,2,统计量服从自由度为,m-1,的,2,分布。若理论分布的参数是未知的,需要用样本观测值来估计时,,2,统计量服从自由度为,m-r-1,的,2,分布,其中,r,为需要估计的参数的个数。,第四步:根据显著性水平,a,查,2,分布表求相应的临界值,2,a,。,2,2,a,时,拒绝原假设,说明样本观测并非来自该理论分布。,例题分析,p184-185,例,6.10,和,6.11,(二),2,分布的独立性检验,在独立性检验中的,2,统计量为,其中,例题分析,p187,例,6.12,或者用公式,例题分析,p189,例,6.13,三、秩和检验(等级和检验),当总体不符合正态分布时,转换成等级,然后检验,这一类的检验统称为秩和检验。,(一)曼,-,惠特尼,U,检验,它假设两个样本分别来自两个总体,目的是检验这两个总体的均值是否有显著的差别。,2.,具体步骤,第一步:把两组数据混和在一起,按照大小顺序编排等级。最小的为,1,,其次为,2,等等,,,两个数据和三个数据相等如何处理,?,若有两个数据相等,且它们在按大小顺序编排好的数列里是第,m,和第,m+1,个数据,则它们的等级(也称作秩)都是,m+,(,m+1,),/2=2m+1/2,。同理,若有,3,个数据相等,且它们在按大小顺序编排好的数据列里第,m,,第,m+1,和第,m+2,位数据,则它们的等级都是,3m+3/3=m+1,。,第二步:分别求两个样本的等级和,。设第一个样本的等级和为,W1,,第二个样本的等级和为,W2,,则有,W1+W2=n,(,n+1,),/2,。,第三步:计算曼,-,惠特尼,U,检验统计量,第四步:作出判断,对于,n1 n2,都比较小的情形,可以查附表,6,得到临界值,Ua,,在,U,Ua,时拒绝,H0,:。在原假设为真的情况下,可以证明随机变量,U,的均值和方差分别为,例题分析,p191,例,6.14,(二)威尔科克森带符号的秩检验,它只要求数据之差所服从的分布是对称分布。目的是检验成对观测的数据之差是否来自均值为,0,的总体,或产生数据的两个总体是否具有相同的均值,2.,具体步骤。教材,p193,例题分析,:,p193-196,例,6.15,和例,6.16,四、等级相关系数及其检验,主要用于测量两组变量之间是否存在相关以及相关程度,数值型和非数值型:,(一)测定两组等级变量之间的相关系数,1.,斯皮尔曼等级相关系数,其中,di,表示两组数据的等级之差,,n,为样本量,例题分析,p196,例,6.17,(二)等级相关系数的检验,1.,假设检验的问题,2.,小样本和大样本情况的处理,和其他的推断一样,当以样本的数据来说明总体时,由于样本带有随机性,在小样本时有时,看来相关,但总体之间则不一定相关。因此也同样有一个假设检验的问题:,H0,:研究的总体之间无相关(),H1,:研究的总体之间有相关(),检验的样本估计量为样本的相关系数,rSP,,在小样本的情况下通常临界值的,r,已编制成表可以直接查阅(见附表,8,),但在大样本的情况下可以通过变换,服从,t,(,n-2,)的,t,分布,采用,t,检验。,本章主要讨论了假设检验的基本原理,参数检验和非参数检验的问题。,本章小结,假设检验的基本问题,一个总体参数的检验,两个总体参数的检验,利用,p,值进行检验,谢谢!,Thank you very much!,
展开阅读全文