统计学假设检验第五章12.ppt

资源描述

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2008,年,8,月,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2008,年,8,月,第五章假设检验,假设检验的基本原理,假设检验的步骤,一个总体参数的检验,利用,p,值进行假设检验,随机原则,总体,样本,总体参数,统计量,推断估计,参数估计,检验,假设检验,抽样分布,假设检验在统计方法中的地位：,统计方法,描述统计法,推断统计法,参数估计,假设检验,正常人的平均体温是,37,o,C,吗？,当问起健康的成年人体温是多少时，多数人的回答是37,o,C！这似乎已经成了一种共识以下是一位研究人员测量的50个健康成年人的体温数据。,根据样本数据，计算的,平均值,为36.8,o,C，,标准差,为0.36,o,C,根据,参数估计,方法，健康成年人平均体温的,95%的置信区间为(36.7，36.9),研究人员发现这个区间内并没有包括37,o,C！,因此，提出了“,不应该再把37,o,C作为正常人体温的一个有任何特定意义的概念,”,我们应该放弃“正常人的平均体温是37,o,C”这个共识吗？,1,先,对总体参数（或分布形式）,提出某种假设,，,再,利用样本信息,判断假设是否成立,2,参数检验,总体的分布形式已知；,非,参数检验,3,逻辑上运用,反证法,，,统计上依据小概率原理！,小概率是在一次试验中，一个几乎不可能发生的事件发生的概率；,在一次试验中小概率事件一旦发生，我们就有理由,拒绝原假设,一、假设检验的基本原理,1.假设检验（hypothesis test）,二、假设检验的步骤,1.,提出,原假设,和,备择假设,2.,确定适当的,检验统计量,3.,规定显著性水平,4.,计算检验统计量的值,5.,作出,统计决策,1.提出假设,1原假设,（null hypothesis）,研究者收集证据，指的是待检验的假设，用,H,0,表示,统计学涵义是指,参数没有变化或变量之间没有关系,起初被假设是成立的，后面根据样本数据确定是否有足够的证据,拒绝它,总是有符号,，,，,H,0,：,=某一数值,H,0,：,某一数值,H,0,：,某一数值,也称“研究假设”，,研究者想收集证据予以支持的假设,，通常用,H,1,表示,统计学涵义是指,总体参数发生了变化或变量之间有某种关系,备择假设,用于表达研究者自己倾向于支持的看法，然后收集证据,拒绝原假设,，以支持备择假设,总是有符号,，,，,H,1,：,某一数值,H,1,：,某一数值,H,1,：,某一数值,2,备择假设,（,alternative hypothesis,）,【例1】,一种零件的生产标准,直径为10cm,，为对生产过程进行控制，质量监测人员,定期对一台加工机床检查,，来确定这台机床生产的零件是否符合标准要求。,若零件的平均直径大于或小于10cm，则表明,生产过程不正常,，必须进行调整。,试陈述用来检验生产过程是否正常的,原假设,和,备择假设,。,解：,研究者想收集证据予以证明的假设应该是“生产过程不正常”。,建立的,原假设,和,备择假设,为：,H,0,：,10cm,H,1,：,10cm,【例2】,某品牌洗涤剂在它的产品说明书中声称：,平均净含量不少于500克,，从消费者的利益出发，有关研究人员要通过,抽检,其中的一批产品来,验证该产品制造商的说明是否属实。,试陈述用于检验的,原假设,与,备择假设,。,解：,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。,建立的,原假设,和,备择假设,为：,H,0,：,500,H,1,：,500,【例3】,一家研究机构,估计,，某城市中,家庭拥有汽车的比例超过30%,。为验证这一,估计,是否正确，该研究机构随机抽取了一个样本进行检验。试陈述用于检验的,原假设,与,备择假设,。,解：,研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过,30%”,。,建立的,原假设,和,备择假设,为：,H,0,：,30%,H,1,：,30%,1原假设和备择假设是一个完备事件组，而且相互对立,2,先确定备择假设，再确定原假设,3等号,“”,总是放在原假设上,提出假设（小结）：,1用于,假设检验,问题的统计量,2,选择统计量的方法与参数估计相同，需考虑：,是大样本,or 小样本,总体方差已知 or 未知,2.,确定适当的,检验统计量,1是一个,概率值,2原假设为真时，拒绝原假设的概率,3表示为,常用的,值有,0.01，0.05，0.10,3.规定,显著性水平,（,significant level,）,1根据样本观测结果，计算出对原假设和备择假设做出决策的某个样本统计量,2,对样本估计量的标准化结果,原假设,H,0,为真,点估计量的抽样分布,3检验统计量的基本形式为,（以正态分布为例）：,4.,检验统计量,（,test statistic,）,的计算,5.作出统计决策,1根据给定的显著性水平,，,查表,得出相应的临界值,Z,或,Z,/2,，,t,或,t,/2,2将检验统计量的值与,水平的临界值,进行比较,3得出接受或拒绝原假设的结论,1备择假设,没有特定的方向性,，并含有符号,“,”,的假设检验，称为双侧检验或双尾检验,（,two-tailed test）,2备择假设,具有特定的方向性,，并含有符号,“”或“”,的假设检验，称为单侧检验或单尾检验,（one-tailed test）,备择假设的方向为“,”，称为,右侧检验,（,1,）双侧检验与单侧检验,以总体均值的检验为例：,假设检验的3种形式：,【例1】,一种零件的生产标准,直径为10cm,，为对生产过程进行控制，质量监测人员,定期对一台加工机床检查,，来确定这台机床生产的零件是否符合标准要求。,若零件的平均直径大于或小于10cm，则表明,生产过程不正常,，必须进行调整。,试陈述用来检验生产过程是否正常的,原假设,和,备择假设,。,解：,研究者想收集证据予以证明的假设应该是“生产过程不正常”。,建立的,原假设,和,备择假设,为：,H,0,：,10cm,H,1,：,10cm,抽样分布,H,0,临界值,临界值,a,/2,a,/2,拒绝,H,0,拒绝,H,0,1-,置信水平,Region of Rejection,Region of,Non rejection,Region of Rejection,双侧检验：,观察到的样本统计量,抽样分布,H,0,临界值,临界值,a,/2,a,/2,拒绝,H,0,拒绝,H,0,1-,置信水平,Region of Rejection,Region of,Non rejection,Region of Rejection,双侧检验：,观察到的样本统计量,抽样分布,H,0,临界值,临界值,a,/2,a,/2,拒绝,H,0,拒绝,H,0,1-,置信水平,Region of Rejection,Region of,Non rejection,Region of Rejection,双侧检验：,观察到的样本统计量,【例2】,某品牌洗涤剂在它的产品说明书中声称：,平均净含量不少于500克,，从消费者的利益出发，有关研究人员要通过,抽检,其中的一批产品来,验证该产品制造商的说明是否属实。,试陈述用于检验的,原假设,与,备择假设,。,解：,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。,建立的,原假设,和,备择假设,为：,H,0,：,500,H,1,：,临界值，拒绝,H,0,左侧检验：,统计量,临界值，拒绝,H,0,统计量决策规则：,第一类错误,（弃真错误）,原假设为真时，拒绝原假设,会产生一系列后果,第一类错误的概率为,，被称为,显著性水平,第二类错误,（取伪错误）,原假设为假时，接受原假设,第二类错误的概率为,（2）假设检验中的两类错误,假设检验的结果不一定正确！,0,x,原假设抽样分布,0,原假设抽样分布,x,拒绝域,弃真错误：原假设为真，却落在拒绝域内被拒绝。,扩大拒绝域（,变大），第一类错误可能性变大；反之，为防止弃真错误，就要缩小,。,拒绝域,第一类错误（弃真错误）,接受域,（原假设为真）,原假设：,1-,0,接受域,拒绝域,备择假设：,1-,1,拒绝域,接受域,研究者总是希望能做出正确的决策，但由于决策是建立在,样本信息,的基础之上，而样本又是随机的，因而就,有可能犯错误,；,原假设和备择假设不能同时成立，决策的结果要么拒绝,H,0,，要么不拒绝,H,0,。决策时总是希望当原假设正确时，没有拒绝它；当原假设不正确时拒绝它，但实际上很难保证不犯错误,H,0,：无罪,假设检验中的两类错误,（决策结果）,假设检验就好像,一场审判过程,统计检验过程,是针对原假设,H,0,说的！,冤枉好人,放过坏人,对于一个给定的样本，如果犯第一类错误的代价比犯第二类错误的代价相对较高，则将犯第类错误的概率定得低些较为合理；反之，则将犯第类错误的概率定得高些；,一般来说，发生哪一类错误的后果更为严重，就应该首要控制哪类错误发生的概率。由于犯第一类错误的概率是可以由研究者控制的，因此在假设检验中，人们往往,先控制第一类错误的发生概率,两类错误的控制：,错误和,错误的关系：,你不能同时减少两类错误,!,和的关系就像翘翘板，,小,就大，,大,就小,两类错误与显著性水平：,第一类错误：弃真（显著水平,）,第二类错误：取伪,显著,水平,与,两类,错误,生活中如何避免,弃真错误控制得小一些！,传统上，做出决策所依据的是样本统计量，现代检验中人们直接使用由统计量算出的,犯第一类错误的概率,，即所谓的,P,值。,注：假设检验不能证明原假设正确。,假设检验只提供不利于原假设的证据。当拒绝原假设时，表明样本提供的证据证明它是错误的；当没有拒绝原假设时，我们也不说“,接受原假设,”，因为没法证明原假设是正确的,这与法庭上对被告的定罪类似：先假定被告是无罪的，直到你有足够的证据证明他是有罪的，否则法庭就不能认定被告有罪。当证据不足时，法庭的裁决是“被告无罪”，这里也没有证明被告就是清白的,如果你主观上要想拒绝原假设，那就一定能拒绝它,这类似于我们通常所说的“,欲加之罪，何患无词,”,只要你无限制扩大样本容量，几乎总能拒绝原假设,1用于,假设检验,问题的统计量,2,选择统计量的方法与参数估计相同，需考虑：,是大样本,or 小样本,总体方差已知 or 未知,回顾上节课以下内容,2.,确定适当的,检验统计量,1是一个,概率值,2原假设为真时，拒绝原假设的概率,3表示为,常用的,值有,0.01，0.05，0.10,3.规定,显著性水平,（,significant level,）,1根据样本观测结果，计算出对原假设和备择假设做出决策的某个样本统计量,2,对样本估计量的标准化结果,原假设,H,0,为真,点估计量的抽样分布,3检验统计量的基本形式为,（以正态分布为例）：,4.,检验统计量,（,test statistic,）,的计算,5.作出统计决策,1根据给定的显著性水平,，,查表,得出相应的临界值,Z,或,Z,/2,，,t,或,t,/2,2将检验统计量的值与,水平的临界值,进行比较,3得出拒绝或不拒绝原假设的结论,1.总体均值的检验,（大样本）,1,假定条件：,总体服从,正态分布,；总体为,非正态分布,或,总体分布未知,，可近似为正态分布（,n,30）,2使用,z,检验统计量,2,已知：,2,未知,：,三、总体均值的检验,【例1】,一种罐装饮料采用自动生产线生产，每罐的容量是,255ml,，标准差为,5ml,。为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了,40,罐进行检验，测得每罐平均容量为,255.8ml,。取显著性水平,=0.05,，检验该天生产的饮料容量是否符合标准要求？,双侧检验,H,0,：,=255,H,1,：,255,检验统计量,:,统计决策：,没有证据表明该天生产的饮料不符合标准要求,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,观察到的样本统计量,=0.05,n,=40,【例2】,某一小麦品种的平均产量为,5200,kg/hm,2,。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高，随机抽取了,36,个地块进行试种，得到的样本平均产量为,5275,kg/hm,2,，标准差为,120,/hm,2,。试检验改良后的新品种产量是否有显著提高？,（,=0.05）,右侧检验,2.总体均值的检验,（,2,未知、大样本）,H,0,：,5200,H,1,：,5200,检验统计量,:,拒绝,H,0,，改良后的新品种产量有显著提高,统计决策,:,=0.05,n,=36,拒绝,H,0,1.645,z,0.05,0,观察到的样本统计量,【例3】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据，检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低？,(,=0.01,),左侧检验,H,0,：,1.35,H,1,：,1.35,检验统计量,:,拒绝,H,0,，,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,统计决策,:,-2.33,z,0,拒绝,H,0,0.01,=0.01,n,=50,观察到的样本统计量,1,假定条件：,总体服从正态分布；,小样本（,n,/2,=0.025,，,不能拒绝,H,0,【例2】,某儿童食品厂生产盒装儿童食品，每盒标准重量,不低于,368,克。现从某天生产的一批食品中随机抽取,25,盒进行检查，测得每盒的平均重量为,x=372.5,克。企业规定每盒重量的标准差,为,15,克,，,确定,P,值。（,=0.05）,368,克,某儿童食品厂,（2）,P,值计算实例,单侧检验,样本统计量的,Z,值,（观察到的）,计算的检验统计量为：,0,1.5,Z,p,值为,：,P,(,Z,1.5,),0,1.5,Z,p,值,=0.0668,=0.05,拒绝,检验统计量未在拒绝区域,p,=0.0668,=0.05,，,不能拒绝,H,0,P,值告诉我们：,如果原假设是正确的，我们得到目前这个,样本数据的可能性有多大,，如果这个可能性很小，就应该拒绝原假设,P,值被称为,观察到的（或实测的）显著性水平,决策规则：,若,p,值,，拒绝,H,0,若,p,值,/2,，拒绝,H,0,用,P,值决策（小结）：,

展开阅读全文