收藏 分销(赏)

统计学假设检验课件.ppt

上传人:人****来 文档编号:10172771 上传时间:2025-04-24 格式:PPT 页数:91 大小:1.22MB
下载 相关 举报
统计学假设检验课件.ppt_第1页
第1页 / 共91页
统计学假设检验课件.ppt_第2页
第2页 / 共91页
点击查看更多>>
资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,统计学,STATISTICS,6-,*,第 五 章 假设检验,假设检验在统计方法中的地位,统计方法,描述统计,推断统计,参数估计,假设检验,学习目标,假设检验的基本思想和原理,假设检验的步骤,一个总体参数的检验,P,值的计算与应用,5.1 假设检验的基本问题,一、假设的陈述,二、两类错误与显著性水平,三、统计量与拒绝域,四、利用,P,值进行决策,4,什么是假设?,(hypothesis),对总体参数的具体数值所作的陈述,总体参数包括,总体均值,、,比率,、,方差,等,分析,之前,必须陈述,我认为这种新药的疗效比原有的药物更有效!,假设的陈述,什么是假设检验?,(hypothesis test),先对总体的参数,(,或分布形式,),提出某种假设,然后利用样本信息判断假设是否成立的过程,有参数检验和,非,参数检验,逻辑上运用反证法,统计上依据小概率原理,假设检验的基本思想,.因此我们拒绝假设,=50,.如果这是总体的假设均值,样本均值,m,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值.,20,总体,假设检验的过程,(提出假设抽取样本作出决策),抽取随机样本,均值,x,=20,我认为人口的平均年龄是50岁,提出假设,拒绝假设,别无选择!,作出决策,原假设和备择假设,什么是原假设?(Null Hypothesis),1.,待检验的假设,又称“0假设”,2.如果错误地作出决策会导致一系列后果,3.总是有等号,或,4.表示为 H,0,H,0,:,某一数值,指定为=号,即,或,例如,H,0,:,3190(克),研究,者想收集证据予以支持的假设,也称“研究假设”,总是有符号,或,表示为,H,1,H,1,:,某一数值,或,某一数值,例如,H,1,:,10cm,,或,10cm,什么是,备择假设,(alternative hypothesis),【例】,一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。,提出假设,(例题分析),解:,研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为,H,0,:,10cm,H,1,:,10cm,【例】,某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设,(例题分析),解:,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为,H,0,:,500,H,1,:,”,或“,”,的假设检验,称为单侧检验或单尾检验,(one-tailed test),备择假设的方向为“,”,,称为,右侧检验,双侧检验与单侧检验,双侧检验与单侧检验,(假设的形式),假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,H,0,:无罪,假设检验中的两类错误,(决策结果),陪审团审判,裁决,实际情况,无罪,有罪,无罪,正确,错误,有罪,错误,正确,H,0,检验,决策,实际情况,H,0,为真,H,0,为假,未拒绝,H,0,正确决策,(1,a,),第类错误(,b,),拒绝,H,0,第类错误(,a,),正确决策,(1-,b,),假设检验就好像,一场审判过程,统计检验过程,假设检验中的两类错误,1.,第类错误(弃真错误),原假设为真时拒绝原假设,第类错误的概率记为,被称为显著性水平,2.第类错误(取伪错误),原假设为假时未拒绝原假设,第类错误的概率记为,错误和,错误的关系,你不能同时减少两类错误!,和,的关系就像翘翘板,,小,就大,,大,就小,影响,错误的因素,1.总体参数的真值,随着假设的总体参数的减少而增大,2.显著性水平,当,减少时增大,3.总体标准差,当,增大时增大,4.样本容量,n,当,n,减少时增大,显著性水平,(significant level),1.是一个概率值,2.原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域,3.表示为,(alpha),常用的,值有,0.01,0.05,0.10,4.由研究者事先确定,假设检验中的小概率原理,什么小概率?,1.在一次试验中,一个几乎不可能发生的事件发生的概率,2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,3.小概率由研究者事先确定,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,对样本估计量的标准化结果,原假设,H,0,为真,点估计量的抽样分布,检验统计量,(test statistic),标准化的检验统计量,显著性水平和拒绝域,(双侧检验),抽样分布,0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,1-,置信水平,显著性水平和拒绝域,(双侧检验),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(双侧检验),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(双侧检验),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(单侧检验),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(左侧检验),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,观察到的样本统计量,显著性水平和拒绝域,(左侧检验),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(右侧检验),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,观察到的样本统计量,显著性水平和拒绝域,(右侧检验),0,临界值,a,样本统计量,抽样分布,1-,置信水平,拒绝,H,0,决策规则,给定显著性水平,,查表得出相应的临界值,z,或,z,/2,,,t,或,t,/2,将检验统计量的值与,水平的临界值进行比较,作出决策,双侧检验:,I,统计量,I,临界值,拒绝,H,0,左侧检验:,统计量,临界值,拒绝,H,0,利用,P,值 进行决策,什么是,P,值?,(,P,-Value),是一个概率值,如果我们假设原假设为真,,P-,值是观测到的样本均值不同于(,实测值的概率,左侧检验时,,P,-,值为曲线上方,小于等于,检验统计量部分的面积,右侧检验时,,P,-,值为曲线上方,大于等于,检验统计量部分的面积,被称为观察到的,(,或实测的,),显著性水平,H,0,能被拒绝的,的最小值,利用,P,值进行决策,单侧检验,若p-值,不能拒绝 H,0,若p-值,拒绝 H,0,双侧检验,若p-值,/2,不能拒绝 H,0,若p-值,/2,拒绝 H,0,双侧检验的,P,值,/,2,/,2,Z,拒绝,H,0,拒绝,H,0,0,临界值,计算出的样本统计量,计算出的样本统计量,临界值,1/2,P,值,1/2,P,值,左侧检验的,P,值,0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,计算出的样本统计量,P,值,右侧检验的,P,值,0,临界值,a,拒绝,H,0,抽样分布,1-,置信水平,计算出的样本统计量,P,值,假设检验步骤的总结,陈述原假设和备择假设,从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值,确定一个适当的显著性水平,并计算出其临界值,指定拒绝域,将统计量的值与临界值进行比较,作出决策,统计量的值落在拒绝域,拒绝,H,0,,,否则不拒绝,H,0,也可以直接利用,P,值,作出决策,5.2,一个总体参数的检验,一、总体均值的检验,二、总体比率的检验,40,总体均值的检验,(作出判断),是否已知,小,样本容量n,大,是否已知,否,t 检验,否,z 检验,是,z 检验,是,z 检验,一个总体参数的检验,z,检验,(单侧和双侧),t,检验,(单侧和双侧),z,检验,(单侧和双侧),2,检验,(单侧和双侧),均值,一个总体,比率,方差,总体均值的检验,(大样本),1.,假定条件,正态总体或非正态总体大样本(,n,30),使用,z,检验统计量,2,已知:,2,未知:,均值的双侧,Z,检验,(,2,已知),1.,假定条件,总体服从正态分布,若不服从正态分布,可用正态分布来近似(,n,30),原假设为,:,H,0,:,=,0,;,备择假设为,:,H,1,:,0,3,使用,z,统计量,总体均值的检验(,2,已知),(例题分析),【例】,一种罐装饮料采用自动生产线生产,每罐的容量是,255ml,,标准差为,5ml,。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了,40,罐进行检验,测得每罐平均容量为,255.8ml,。取显著性水平,=0.05,,检验该天生产的饮料容量是否符合标准要求?,双侧检验,绿色,健康饮品,绿色,健康饮品,255,255,总体均值的检验(,2,已知),(例题分析),H,0,:,=255,H,1,:,255,=,0.05,n,=,40,临界值(,c,):,检验统计量:,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,决策:,结论:,不拒绝,H,0,样本提供的证据表明:该天生产的饮料符合标准要求,均值的双侧,Z,检验,(实例),【例】,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为,0,=0.081mm,,总体标准差为,=,0.025,。今换一种新机床进行加工,抽取,n,=200,个零件进行检验,得到的椭圆度为,0.076,mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(,0.05,),均值的双侧Z 检验,(计算结果),H,0,:,=0.081,H,1,:,0.081,=,0.05,n,=,200,临界值(s):,检验统计量:,Z,0,1.96,-1.96,.025,拒绝 H,0,拒绝 H,0,.025,决策:,结论:,拒绝H,0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,均值的单侧Z 检验,(,2,已知),假定条件,总体服从正态分布,若不服从正态分布,可以用正态分布来近似,(,n,30),备择假设有,符号,使用,z,统计量,均值的单侧Z检验,(实例),【例1】,根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布,N,(,1020,,,100,2,)。现从最近生产的一批产品中随机抽取,16,只,,测得样本平均寿命为,1080,小时。试在,0.05,的显著性水平下判断这批产品的使用寿命是否有显著提高?(,0.05,),均值的单侧Z检验,(计算结果),H,0,:,1020,H,1,:,1020,=,0.05,n,=,16,临界值(s):,检验统计量:,在,=0.05的水平上拒绝H,0,有证据表明这批灯泡的使用寿命有显著提高,决策:,结论:,Z,0,拒绝域,0.05,1.,645,【例2】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?(,=0.01),左侧检验,50个零件尺寸的误差数据,(mm),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,总体均值的检验(,2,未知),(例题分析),H,0,:,1.35,H,1,:,5200,=,0.05,n,=,36,临界值(,c,):,检验统计量:,拒绝,H,0,(,P,=0.000088,=0.05),改良后的新品种产量有显著提高,决策:,结论:,z,0,拒绝,H,0,0.05,1.645,总体均值的检验(,z,检验),(,P,值的图示),抽样分布,P,=,0.000088,0,1.645,a,=,0.05,拒绝,H,0,1-,计算出的样本统计量=3.75,P,值,总体均值的检验,(,大,样本检验方法的总结),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知:,未知:,拒绝域,P,值决策,拒绝,H,0,总体均值的检验,(小样本),1.,假定条件,总体服从正态分布,小样本(,n,30),检验统计量,2,已知:,2,未知:,总体均值的检验,(,小,样本检验方法的总结),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知:,未知:,拒绝域,P,值决策,拒绝,H,0,注:,已知的拒绝域同大样本,总体均值的检验,(例题分析),【例】,一种汽车配件的平均长度要求为,12,cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的,10,个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在,0.05,的显著性水平下,检验该供货商提供的配件是否符合要求?,10个零件尺寸的长度,(cm),12.2,10.8,12.0,11.8,11.9,12.4,11.3,12.2,12.0,12.3,总体均值的检验,(例题分析),H,0,:,=12,H,1,:,12,=0.05,df,=10-1=9,临界值(,c,):,检验统计量:,不拒绝,H,0,该供货商提供的零件符合要求,决策:,结论:,t,0,2.262,-2.262,0.025,拒绝,H,0,拒绝,H,0,0.025,均值的双侧 t 检验,(实例),【例】,某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为,1000,克。某日随机抽查,9,包,测得样本平均重量为,986,克,样本标准差为,24,克。试问在,0.05,的显著性水平上,能否认为这天自动包装机工作正常?,属于决策中的假设!,均值的双侧 t 检验,(计算结果),H,0,:,=1000,H,1,:,1000,=0.05,df,=9,-1=8,临界值(s):,检验统计量:,在,=0.05的水平上接受H,0,有证据表明这天自动包装机工作正常,决策:,结论:,t,0,2.306,-2.306,.025,拒绝 H,0,拒绝 H,0,.025,均值的单侧 t 检验,(实例),【例】,一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下,大于40000,公里,对一个由,20,个轮胎组成的随机样本作了试验,测得平均值为,41000,公里,标准差为,5000,公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?(,=0.05,),属于检验声明有效性的假设!,均值的单侧 t 检验,(计算结果),H,0,:,40000,H,1,:,40000,=0.,05,df,=,20-1=19,临界值(s):,检验统计量:,在,=0.05的水平上接受H,0,有证据表明轮胎使用寿命显著地大于40000公里,决策:,结论:,-1.7291,t,0,拒绝域,.05,总体比率检验,假定条件,总体服从二项分布,可用正态分布来近似,(,大样本,),检验的,z,统计量,0,为假设的总体比率,总体比率的检验,(检验方法的总结),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,=,0,H,1,:,0,H,0,:,0,H,1,:,0,统计量,拒绝域,P,值决策,拒绝,H,0,总体比率的检验,(例题分析),【例】,一种以休闲和娱乐为主题的杂志,声称其读者群中有,80%,为女性。为验证这一说法是否属实,某研究部门抽取了由,200,人组成的一个随机样本,发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?,双侧检验,总体比率的检验,(例题分析),H,0,:,=80%,H,1,:,80%,=0.01,n,=,200,临界值(c):,检验统计量:,不拒绝,H,0,(,P,=0.013328,=0.01),该杂志的说法属实,决策:,结论:,z,0,2.58,-2.58,0.025,拒绝,H,0,拒绝,H,0,0.025,一个总体比例的 Z 检验,(实例),【例】,某研究者估计本市居民家庭的电脑拥有率为,30%,。现随机抽查了,200,的家庭,其中,68,个家庭拥有电脑。试问研究者的估计是否可信?(,=0.05,),属于决策中的假设!,一个样本比例的 Z 检验,(结果),H,0,:,P=0.3,H,1,:,P,0.3,=0.05,n,=,200,临界值(s):,检验统计量:,在,=0.05的水平上接受H,0,有证据表明研究者的估计可信,决策:,结论:,Z,0,1.96,-1.96,.025,拒绝 H,0,拒绝 H,0,.025,利用置信区间进行假设检验,(双侧检验),求出双侧检验均值的置信区间,2,已知时:,2,未知时:,若总体的假设值,0,在置信区间外,拒绝,H,0,利用置信区间进行假设检验,(左侧检验),1.求出单边置信下限,若总体的假设值,0,小于单边置信下限,拒绝,H,0,利用置信区间进行假设检验,(右侧检验),1.求出单边置信上限,若总体的假设值,0,大于单边置信上限,拒绝,H,0,利用置信区间进行假设检验,(,例子,),【例】,一种袋装食品每包的标准重量应为,1000,克。现从生产的一批产品中随机抽取,16,袋,测得其平均重量为,991,克。已知这种产品重量服从标准差为,50,克的正态分布。试确定这批产品的包装重量是否合格?(,=0.05,),属于决策的假设!,香脆蛋卷,利用置信区间进行假设检验,(,计算结果),H,0,:,=,1000,H,1,:,1000,n,=,16,=,0.05,临界值(s):,置信区间为,决策:,结论:,假设的,0,=1000在置信区间内,接受H,0,表明这批产品的包装重量合格,Z,0,1.96,-1.96,.025,拒绝 H,0,拒绝 H,0,.025,【例】某电视机厂声称其显象管平均使用寿命超过规定标准1200小时,随机抽查100件产品后测得均值为1245小时,已知总体标准差为300小时,问该厂产品质量是否显著高于规定标准?,(,=0.05,),假设检验的P值,假设检验的P值,H,0,:,1200,H,1,:,1200,接受,H,0,现在换一个角度,假设总体均值,求样本均值 的可能性有多大?即求,决策:,样本均值不低于1245小时的可能性仍有6.7%,这个概率大于给定显著性水平,P值就是指,这个概率,说明,我们可以将P值概括为:,它是原假设H,0,为真时,样本可能结果不低于实际观测值(右侧检验),或样本可能结果不高于实际观测值(左侧检验)的概率。,P值可以提供更多的信息,不仅可以用它与给定的显著性水平做比较,进行检验决策,且还显示了样本值在一定范围内出现的概率,这有助于我们对检验对象有进一步的已经,同时也为进行灵活的检验决策提供了可能。,双尾 Z 检验,(,P,-值计算实例),【例】,欣欣儿童食品厂生产的盒装儿童食品每盒的标准重量为,368,克。现从某天生产的一批食品中随机抽取,25,盒进行检查,测得每盒的平均重量为,x,=372.5,克。企业规定每盒重量的标准差,为,15,克。确定,P,-值。,368 克,欣欣儿童食品厂,双尾 Z 检验,(,P,-值计算结果),样本统计量的Z值,(观察到的),计算的检验统计量为:,0,1.50,-1.50,Z,双尾 Z 检验,(,P,-值计算结果),p-值为 P(Z,-1.50 或 Z,1.50),样本统计量的Z值,(观察到的),0,1.50,-1.50,Z,1/2 p-值,1/2 p-值,双尾 Z 检验,(,P,-值计算结果),p-值为 P(Z,-1.50 或 Z,1.50),从Z分布表查找1.50,样本统计量的Z值,(观察到的),0,1.50,-1.50,Z,1/2 p-值,1/2 p-值,双尾 Z 检验,(,P,-值计算结果),0,1.50,-1.50,Z,1/2 p-值=.0334,1/2 p-值=.0334,1/2,=.025,1/2,=.025,拒绝,拒绝,双尾 Z 检验,(,P,-值计算结果),p=0.1336,=0.05,不能拒绝H,0,检验统计量未在拒绝区域,0,1.50,-1.50,Z,1/2 p-值=.0334,1/2 p-值=.0334,1/2,=.025,1/2,=.025,拒绝,拒绝,单尾 Z 检验,(,P,-值计算结果),【例】,欣欣儿童食品厂生产的某种盒装儿童食品,规定每盒的重量,不低于,368,克。现从某天生产的一批食品中随机抽取,25,盒进行检查,测得每盒的平均重量为,x,=372.5,克。企业规定每盒重量的标准差,为,15,克。确定P-值。,368 克,欣欣儿童食品厂,单尾 Z 检验,(,P,-值计算结果),p-值为 P(Z,1.50),样本统计量的Z值,用备择假设找出方向,0,1.50,Z,P-值,单尾 Z 检验,(,P,-值计算结果),p-值为 P(Z,1.50),样本统计量的Z值,用备择假设找出方向,从Z分布表:查找1.50,0,1.50,Z,P-值,单尾 Z 检验,(,P,-值计算结果),p-值为 P(Z,1.50)=.0668,样本统计量的Z值,用备择假设找出方向,从Z分布表:查找1.50,0,1.50,Z,P-值,.0668,单尾 Z 检验,(,P,-值计算结果),检验统计量未在拒绝区域,(p-值=0.0668),(,=.05),不能拒绝H,0,0,1.50,Z,1 p-值=.0668,=.05,拒绝,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传
相似文档                                   自信AI助手自信AI助手

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服