收藏 分销(赏)

第三讲1应用统计.ppt

上传人:xrp****65 文档编号:13160469 上传时间:2026-01-27 格式:PPT 页数:74 大小:1.10MB 下载积分:10 金币
下载 相关 举报
第三讲1应用统计.ppt_第1页
第1页 / 共74页
第三讲1应用统计.ppt_第2页
第2页 / 共74页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第三讲,假设检验问题,虽然我们不知道一批灯管的平均使用寿命是多少,不知道一批产品的合格率是多少,不知道全校学生的生活费支出的方差是多少,但我们可以事先提取一个假设值,比如,这批灯管的平均使用寿命是,1500,小时,这批产品的合格率是,95%,,全校学生的生活费支出的方差是,1000,,然后从中抽取一个样本,根据样本提供的信息来判断假设是否成立。这就是统计上所说的假设检验。,1,一、假设检验的基本思路和概念,1.,两种统计推断,估计:求总体参数的近似值或近似值的误差范围,。基本方法是选择一个(组)合适的模型,;,检验:判断总体的某个性质是否成立,。基本方法是,检验一个(组)给定的模型。,2,2,.,假设检验的过程和思路,概率意义下的反证法,类似于“无罪推定”,总体,假设总体的,平均年龄是,50,岁,拒绝,样本均值是,20,样本,无效假设,不可能,!,3,什么是假设,?,(,hypothesis,),对总体参数的具体数值所作的陈述,总体参数包括,总体均值,、,比例,、,方差,等,分析,之前,必需陈述,我认为这种新药的疗效比原有的药物更有效,!,4,什么是假设检验,?,(,hypothesis test,),先对总体的参数,(,或分布形式,),提出某种假设,然后利用样本信息判断假设是否成立的过程,有参数检验和,非,参数检验,逻辑上运用反证法,统计上依据小概率原理,5,假设检验的基本思想,.,因此我们拒绝假设,=50,.,如果这是总体的真实均值,样本均值,m,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值,.,20,6,总体,假设检验的过程,抽取随机样本,均值,x,=20,我认为人口的平均年龄是,50,岁,提出假设,拒绝假设,别无选择,!,作出决策,7,【,例,】,一种零件的生产标准是直径应为,10cm,,,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,10cm,,,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设,(,例题分析,),解:,研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为,H,0,:,10cm,H,1,:,10cm,8,【,例,】,某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于,500,克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设,(,例题分析,),解:,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为,H,0,:,500,H,1,:,500,500g,绿叶,洗涤剂,9,【,例,】,一家研究机构估计,某城市中家庭拥有汽车的比例超过,30%,。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设,(,例题分析,),解:,研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比例超过,30%,”,。建立的原假设和备择假设为,H,0,:,30%,H,1,:,30%,10,原假设和备择假设是一个完备事件组,而且相互对立,在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立,先确定备择假设,再确定原假设,等号“,=,”,总是放在原假设上,因研究目的不同,对同一问题可能提出不同的假设,(,也可能得出不同的结论,),提出假设,(,结论与建议,),11,双侧检验与单侧检验,(,假设的形式,),假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,12,假设检验中的两类错误,1.,第,类错误,(,弃真错误,),原假设为真时拒绝原假设,第,类错误的概率记为,被称为显著性水平,2.,第,类错误,(,取伪错误,),原假设为假时未拒绝原假设,第,类错误的概率记为,(Beta),13,H,0,:,无罪,假设检验中的两类错误,(,决策结果,),陪审团审判,裁决,实际情况,无罪,有罪,无罪,正确,错误,有罪,错误,正确,H,0,检验,决策,实际情况,H,0,为真,H,0,为假,未,拒绝,H,0,正确决策,(1,a,),第,类错误,(,b,),拒绝,H,0,第,类错误,(,a,),正确决策,(1-,b,),假设检验就好像一场审判过程,统计检验过程,14,a,和,b,呈相反关系,a,b,降低一类错误的概率另一类错误的概率就会提高,15,显著性水平,(,significant level,),1.,是一个概率值,2.,原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝,域,3.,表示为,(alpha),常用的,值有,0.01,0.05,0.10,4.,由研究者事先确定,16,拒绝域和显著性水平,拒绝域:原假设,H,0,成立条件下,统计量落入的小概率区域。统计量真的落入拒绝域你会拒绝原假设。,显著性水平,:,事先给定的形成拒绝域的小概率,通常,=0.01,、,0.05,、,0.10,。,建立拒绝域的根据是什么?根据抽样分布,统计量落入该区域的概率,=,。,所谓检验就是选择一个拒绝域。,17,假设检验中的小概率原理,什么小概率?,1.,在一次试验中,一个几乎不可能发生的事件发生的概率,2.,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,3.,小概率由研究者事先确定,什么是小概率?,18,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,对样本估计量的标准化结果,原假设,H,0,为真,点估计量的抽样分布,检验统计量,(,test statistic,),标准化的检验统计量,19,显著性水平和拒绝域,(,双侧检验,),抽样分布,0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,1-,置信水平,20,显著性水平和拒绝域,(,双侧检验,),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,21,显著性水平和拒绝域,(,双侧检验,),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,22,显著性水平和拒绝域,(,双侧检验,),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,23,显著性水平和拒绝域,(,单侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,24,显著性水平和拒绝域,(,左侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,观察到的样本统计量,25,显著性水平和拒绝域,(,左侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,26,显著性水平和拒绝域,(,右侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,观察到的样本统计量,27,显著性水平和拒绝域,(,右侧检验,),0,临界值,a,样本统计量,抽样分布,1-,置信水平,拒绝,H,0,28,决策规则,给定显著性水平,,查表得出相应的临界值,z,或,z,/2,,,t,或,t,/2,将检验统计量的值与,水平的临界值进行比较,作出决策,双侧检验,:|,统计量,|,临界值,拒绝,H,0,左侧检验:统计量,临界值,拒绝,H,0,29,什么是,P,值,?,(,P,-value),在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,双侧检验为分布中两侧面积的总和,反映实际观测到的数据与原假设,H,0,之间不一致的程度,被称为观察到的,(,或实测的,),显著性水平,决策规则:,若,p,值,拒绝,H,0,30,双侧检验的,P,值,/,2,/,2,Z,拒绝,H,0,拒绝,H,0,0,临界值,计算出的样本统计量,计算出的样本统计量,临界值,1/2,P,值,1/2,P,值,31,左侧检验的,P,值,0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,计算出的样本统计量,P,值,32,右侧检验的,P,值,0,临界值,a,拒绝,H,0,抽样分布,1-,置信水平,计算出的样本统计量,P,值,33,假设检验步骤的总结,陈述原假设和备择假设,从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值,确定一个适当的显著性水平,并计算出其临界值,指定拒绝域,将统计量的值与临界值进行比较,作出决策,统计量的值落在拒绝域,拒绝,H,0,,,否则不拒绝,H,0,也可以直接利用,P,值作出决策,34,一个总体参数的检验,z,检验,(,单尾和双尾,),t,检验,(,单尾和双尾,),z,检验,(,单尾和双尾,),2,检验,(,单尾和双尾,),均值,一个总体,比例,方差,35,总体均值的检验,(,作出判断,),是否已知,小,样本容量,n,大,是否已知,否,t,检验,否,z,检验,是,z,检验,是,z,检验,36,总体均值的检验,(,2,已知,),(,例题分析,),【,例,】,一种罐装饮料采用自动生产线生产,每罐的容量是,255ml,,,标准差为,5ml,。,为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了,40,罐进行检验,测得每罐平均容量为,255.8ml,。,取显著性水平,=0.05,,检验该天生产的饮料容量是否符合标准要求?,双侧检验,绿色,健康饮品,绿色,健康饮品,255,255,37,总体均值的检验,(,2,已知,),(,例题分析,),H,0,:,=255,H,1,:,255,=0.05,n,=40,临界值,(,c,):,检验统计量,:,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,决策,:,结论,:,不拒绝,H,0,样本提供的证据还不足以推翻“该天生产的饮料符合标准要求,”的看法,38,总体均值的检验,(z,检验,),(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(,粘贴函数,),第,2,步:,在函数分类中点击“统计”,并在函数名的菜单下选择“,NORMSDIST,”,,,然后确定,第,3,步:,将,z,的绝对值,1.01,录入,得到的函数值为,0.843752345,P,值,=2(1-,0.843752345,)=,0.312495,P,值远远大于,,故不拒绝,H,0,39,总体均值的检验,(,2,未知,),(,例题分析,),【,例,】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。,生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?,(,=0.01),左侧检验,50,个零件尺寸的误差数据,(,mm,),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,40,总体均值的检验,(,2,未知,),(,例题分析,),H,0,:,1.35,H,1,:,1.35,=0.01,n,=50,临界值,(,c,):,检验统计量,:,拒绝,H,0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策,:,结论,:,-2.33,z,0,拒绝,H,0,0.01,41,总体均值的检验,(,z,检验,),(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(,粘贴,函数,),第,2,步:,在函数分类中点击“统计”,并在函数名的,菜单下选择“,ZTEST,”,,,然后确定,第,3,步:,在所出现的对话框,Array,框中,输入原始数据所在区,域;在,X,后输入参数的某一假定值,(,这里为,1.35,),;在,Sigma,后输入已知的总体标准差,(,若未总体标准差未,知则可忽略不填,系统将自动使用样本标准差代替,),第,4,步:,用,1,减去得到的函数值,0.995421023,即为,P,值,P,值,=,1-0.995421023=,0.004579,P,值,5200,=0.05,n,=36,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.000088,=0.05),改良后的新品种产量有显著提高,决策,:,结论,:,z,0,拒绝,H,0,0.05,1.645,45,总体均值的检验,(,z,检验,),(,P,值的图示,),抽样分布,P,=,0.000088,0,1.645,a,=,0.05,拒绝,H,0,1-,计算出的样本统计量,=3.75,P,值,46,2.,总体均值的单边(单尾)检验,H,0,:,0,或,H,0,:,0,1,)是否对,Hilltop,咖啡投诉?,联邦贸易委员会(,FTC,),意欲对大瓶,Hilltop,咖啡,进行检查,以确定是否符合其标签上注明的,“,容量,至少是,3,磅,”,的说法,并由此决定是否因为包装重量,的不足而对其提出投诉。,假设检验问题,H,0,:,3,H,1,:3.,给定显著水平,=0.05,,给出一个检验方法。,请你说出该显著水平在这一问题中有什么实际意,义?,47,总体均值的检验,(,大,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知:,未知:,拒绝域,P,值决策,拒绝,H,0,48,总体均值的检验,(,小样本,),1.,假定条件,总体服从正态分布,小样本,(,n,30),检验统计量,2,已知:,2,未知:,49,总体均值的检验,(,小,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知:,未知:,拒绝域,P,值决策,拒绝,H,0,注:,已知的拒绝域同大样本,50,总体均值的检验,(,例题分析,),【,例,】,一种汽车配件的平均长度要求为,12,cm,,,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的,10,个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在,0.05,的显著性水平下,检验该供货商提供的配件是否符合要求?,1,0,个零件尺寸的长度,(,cm,),12.2,10.8,12.0,11.8,11.9,12.4,11.3,12.2,12.0,12.3,51,总体均值的检验,(,例题分析,),H,0,:,=12,H,1,:,12,=0.05,df,=10-1=9,临界值,(,c,):,检验统计量,:,不拒绝,H,0,样本提供的证据还不足以推翻“该供货商提供的零件符合要求,”的看法,决策:,结论:,t,0,2.262,-2.262,0.025,拒绝,H,0,拒绝,H,0,0.025,52,总体均值的检验,(,t,检验,),(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(,粘贴,函数,),第,2,步:,在函数分类中点击“统计”,并在函数名的,菜单下选择“,TDIST,”,,,然后确定,第,3,步:,在出现对话框的,X,栏中输入计算出的,t,的绝对值,0.7035,,在,Deg-freedom,(,自由度,),栏中输入,本例的自由度,9,,在,Tails,栏中输入,2,(,表明是双,侧检验,如果是单测检验则在该栏输入,1,),第,4,步:,P,值,=,0.499537958,P,值,=0.05,,故不拒绝,H,0,53,三、总体比率的检验,1.,总体比率单边检验,H,0,:p,p,0,或,H,0,:p,p,0,例:,Pine Greek,高尔夫球场的性别比率,问题。,400,个运动者中,100,个女性,能否认为女性比,率比过去的,20%,增加了?,解,H,0,:p,0.20,H,1,:p0.20;,拒绝域的形状:,54,当,=0.05,时,拒绝域为,你的结论?,=0.250.2329,拒绝,H,0,利用大样本下样本比率的抽样分布得到拒绝域为:,55,2.,总体比率的双边检验,给定显著性水平,大样本情况下你能写出相应的拒绝域吗,?,56,总体比例的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,=,0,H,1,:,0,H,0,:,0,H,1,:,0,统计量,拒绝域,P,值决策,拒绝,H,0,57,总体比例的检验,(,例题分析,),【,例,】,一种以休闲和娱乐为主题的杂志,声称其读者群中有,80%,为女性。为验证这一说法是否属实,某研究部门抽取了由,200,人组成的一个随机样本,发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,,检验该杂志读者群中女性的比例是否为,80%,?它们的值各是多少?,双侧检验,58,总体比例的检验,(,例题分析,),H,0,:,=80%,H,1,:,80%,=0.05,n,=200,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.013328,=0.01),样本提供的证据还不足以推翻“该杂志声称读者群中有,80%,为女性”的看法,决策,:,结论,:,z,0,2.58,-2.58,0.025,拒绝,H,0,拒绝,H,0,0.025,60,总体方差的检验,(,2,检验,),检验一个总体的方差或标准差,假设总体近似服从正态分布,使用,2,分布,检验统计量,样本方差,假设的总体方差,61,总体方差的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,2,=,0,2,H,1,:,2,0,2,H,0,:,2,0,2,H,1,:,2,0,2,统计量,拒绝域,P,值决策,拒绝,H,0,62,总体方差的检验,(,例题分析,),【,例,】,啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为,640,ml,,,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于,4,ml,。,企业质检部门抽取了,10,瓶啤酒进行检验,得到的样本标准差为,s,=3.8,ml,。,试以,0.10,的显著性水平检验装填量的标准差是否符合要求?,朝日,BEER,朝日,BEER,朝日,BEER,朝日,63,总体方差的检验,(,例题分析,),H,0,:,2,=4,2,H,1,:,2,4,2,=0.10,df,=10-1=9,临界值,(,s,):,统计量,:,不拒绝,H,0,样本提供的证据还不足以推翻“装填量的标准差否符合要求”的看法,2,0,16.9190,3.32511,/2=0.05,决策,:,结论,:,64,四、整理假设检验的思路,1.,假设检验的过程,1,)确定适当的原假设和备择假设;,2,)选择检验统计量;,3,)指定显著水平,即,“允许犯第一类错误的,最大,概率”,;,4,)根据显著水平和统计量的抽样分布来确定统计量,的临界值,从而确定拒绝域;,5,)根据样本计算统计量的值并与临界值比较看是否,落入拒绝域;,6,)得出结论。,65,2.,原假设,H,0,和,备择假设,H,1,的,选定,1),假设检验是概率意义下的反证法,根据,N-P,原则,否定,H,0,(,即肯定,H,1,),把握更大,犯错误只是事先控制的,小概率,所以把希望得到的结果做为备择假设,.,2),把可能被推翻的标准、宣示、结论做为原假设,因此带“,=”,的标志,(,、,=,、,),置于,H,0,.,3,),把比较保守的论断置于,H,1,。,4),原假设和备择假设的地位不对等,内容不能互换,:,H,0,:,H,1,:,拒绝域,:,c,0,H,0,:,H,1,:,拒绝域,:,c,0,66,原假设,H,0,和备择假设,H,1,的选定(续),5),如果统计量值,不必检验,H,0,:,,,因为,一定不在拒绝域;同理,如果统计量值 ,不必检验,H,0,:,。,6),如果实际问题要求,不,否定,H,0,就必须肯定,H,0,:,则只,有增大,值,=0.10,、,甚至,=0.25,都不能,否定,H,0,才,接受,H,0,.,67,3.,显著水平,a,与,拒绝域,H,0,:,m,3,H,1,:,m,3,H,0,:,m,=,3,H,1,:,m,3,a,a,a,/2,拒绝域,临界值,68,4.,置信区间和双边检验,总体均值的,95%,置信区间是什么?它和双边检验的拒绝域有什么关系?,启示,-,通过置信区间进行双边检验:,找出,的,95%,置信区间为,(),。,做双边检验,H,0,:,=,0,时,如果,0,落入上述置信,区间,则相当于没有落入显著性水平,=0.05,的拒绝域,从而没有 充分的理由否定,H,0,。,相反,如果,0,落入上述置信区间之外,则相当于落入拒绝域,从而以显著性水平,=0.05,否定,H,0,。,69,5.,单个总体检验小结,假设检验的基本思路和概念,均值的双边单边检验,比率的双边单边检验,双边检验和区间估计的关系,70,更多的例子,Ford Taurus,宣称在高速路上行驶的油耗为,30,英里,/,加仑。一个保护消费者利益的小组对汽车进行检验。从的,50,次高速路行驶组成的样本中,得到样本平均为,29.5,英里,/,加仑,样本标准差为,1.8,英里,/,加仑。取显著性水平,0.01,,得出你的结论。,71,72,1,一个快餐店决定计划实施一次特殊供应,使顾客能购买到专门印有著名卡通人物的杯装饮料。如果有超过,15%,的消费者购买这种饮料,则认为可以推行这种特殊供应。在某些地方已经进行的初步试验表明,,500,名消费者有,88,名购买了这种杯装饮料。是否应推行这种特殊杯装饮料?当显著性水平为,0.01,时,得出你的建议。,73,74,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服