资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,统计学,STATISTICS,6-,#,假设检验在统计方法中的地位,统计方法,描述统计,推断统计,参数估计,假设检验,学习目标,假设检验的基本思想和原理,假设检验的步骤,一个总体参数的检验,两个总体参数的检验,P,值的计算与应用,用,Excel,进行检验,6,.1,假设检验的基本问题,一、假设的陈述,二、两类错误与显著性水平,三、统计量与拒绝域,四、利用,P,值进行决策,假设的陈述,什么是假设,?,(,hypothesis,),对总体参数的具体数值所作的陈述,总体参数包括,总体均值,、,比率,、,方差,等,分析,之前,必须陈述,我认为这种新药的疗效比原有的药物更有效,!,什么是假设检验,?,(,hypothesis test,),先对总体的参数,(,或分布形式,),提出某种假设,然后利用样本信息判断假设是否成立的过程,有参数检验和,非,参数检验,逻辑上运用反证法,统计上依据小概率原理,假设检验的基本思想,.,因此我们拒绝假设,=50,.,如果这是总体的假设均值,样本均值,m,=50,抽样分布,H,0,这个值不像我们应该得到的样本均值,.,20,总体,假设检验的过程,抽取随机样本,均值,x,=20,我认为人口的平均年龄是,50,岁,提出假设,拒绝假设,别无选择,!,作出决策,原假设与备择假设,原假设,(null hypothesis),研,究者想收集证据予以反对的假设,又称“,0,假设”,总是有符号,或,4.,表示为,H,0,H,0,:,=,某一数值,指定为符号,=,,,或,例如,H,0,:,10cm,研究,者想收集证据予以支持的假设,也称“研究假设”,总是有符号,或,表示为,H,1,H,1,:,某一数值,或,某一数值,例如,H,1,:,10cm,,或,10cm,备择假设,(alternative hypothesis),【,例,】,一种零件的生产标准是直径应为,10cm,,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,10cm,,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设,(,例题分析,),解:,研究者想收集证据予以证明的假设应该是,“,生产过程不正常,”,。建立的原假设和备择假设为,H,0,:,10cm,H,1,:,10cm,【,例,】,某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于,500,克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设,(,例题分析,),解:,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为,H,0,:,500,H,1,:,”,或“,”,的假设检验,称为单侧检验或单尾检验,(one-tailed test),备择假设的方向为“,”,,称为,右侧检验,双侧检验与单侧检验,双侧检验与单侧检验,(,假设的形式,),假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,两类错误与显著性水平,假设检验中的两类错误,1.,第,类错误,(,弃真错误,),原假设为真时拒绝原假设,第,类错误的概率记为,被称为显著性水平,2.,第,类错误,(,取伪错误,),原假设为假时未拒绝原假设,第,类错误的概率记为,(Beta),H,0,:,无罪,假设检验中的两类错误,(,决策结果,),陪审团审判,裁决,实际情况,无罪,有罪,无罪,正确,错误,有罪,错误,正确,H,0,检验,决策,实际情况,H,0,为真,H,0,为假,未拒绝,H,0,正确决策,(1,a,),第,类错误,(,b,),拒绝,H,0,第,类错误,(,a,),正确决策,(1-,b,),假设检验就好像一场审判过程,统计检验过程,错误和,错误的关系,你不能同时减少两类错误,!,和,的关系就像翘翘板,,小,就大,,大,就小,影响,错误的因素,1.,总体参数的真值,随着假设的总体参数的减少而增大,2.,显著性水平,当,减少时增大,3.,总体标准差,当,增大时增大,4.,样本容量,n,当,n,减少时增大,显著性水平,(,significant level,),1.,是一个概率值,2.,原假设为真时,拒绝原假设的概率,被称为抽样分布的拒绝域,3.,表示为,(alpha),常用的,值有,0.01,0.05,0.10,4.,由研究者事先确定,假设检验中的小概率原理,什么小概率?,1.,在一次试验中,一个几乎不可能发生的事件发生的概率,2.,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,3.,小概率由研究者事先确定,检验统计量与拒绝域,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,对样本估计量的标准化结果,原假设,H,0,为真,点估计量的抽样分布,检验统计量,(,test statistic,),标准化的检验统计量,显著性水平和拒绝域,(,双侧检验,),抽样分布,0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,1-,置信水平,显著性水平和拒绝域,(,双侧检验,),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(,双侧检验,),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(,双侧检验,),0,临界值,临界值,a,/2,a,/2,样本统计量,拒绝,H,0,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(,单侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(,左侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,观察到的样本统计量,显著性水平和拒绝域,(,左侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,显著性水平和拒绝域,(,右侧检验,),0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,观察到的样本统计量,显著性水平和拒绝域,(,右侧检验,),0,临界值,a,样本统计量,抽样分布,1-,置信水平,拒绝,H,0,决策规则,给定显著性水平,,查表得出相应的临界值,z,或,z,/2,,,t,或,t,/2,将检验统计量的值与,水平的临界值进行比较,作出决策,双侧检验:,I,统计量,I,临界值,拒绝,H,0,左侧检验:,统计量,临界值,拒绝,H,0,利用,P,值 进行决策,什么是,P,值,?,(,P,-value),在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率,双侧检验为分布中两侧面积的总和,反映实际观测到的数据与原假设,H,0,之间不一致的程度,被称为观察到的,(,或实测的,),显著性水平,决策规则:,若,p,值,拒绝,H,0,双侧检验的,P,值,/,2,/,2,Z,拒绝,H,0,拒绝,H,0,0,临界值,计算出的样本统计量,计算出的样本统计量,临界值,1/2,P,值,1/2,P,值,左侧检验的,P,值,0,临界值,a,样本统计量,拒绝,H,0,抽样分布,1-,置信水平,计算出的样本统计量,P,值,右侧检验的,P,值,0,临界值,a,拒绝,H,0,抽样分布,1-,置信水平,计算出的样本统计量,P,值,假设检验步骤的总结,陈述原假设和备择假设,从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值,确定一个适当的显著性水平,并计算出其临界值,指定拒绝域,将统计量的值与临界值进行比较,作出决策,统计量的值落在拒绝域,拒绝,H,0,,否则不拒绝,H,0,也可以直接利用,P,值,作出决策,6,.,2,一个总体参数的检验,一、总体均值的检验,二、总体比率的检验,三、总体方差的检验,一个总体参数的检验,z,检验,(,单尾和双尾,),t,检验,(,单尾和双尾,),z,检验,(,单尾和双尾,),2,检验,(,单尾和双尾,),均值,一个总体,比率,方差,总体均值的检验,总体均值的检验,(,作出判断,),是否已知,小,样本容量,n,大,是否已知,否,t,检验,否,z,检验,是,z,检验,是,z,检验,总体均值的检验,(,大样本,),总体均值的检验,(,大样本,),1.,假定条件,正态总体或非正态总体大样本,(,n,30),使用,z,检验统计量,2,已知:,2,未知:,总体均值的检验,(,2,已知,),(,例题分析,),【,例,】,一种罐装饮料采用自动生产线生产,每罐的容量是,255ml,,标准差为,5ml,。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了,40,罐进行检验,测得每罐平均容量为,255.8ml,。取显著性水平,=0.05,,检验该天生产的饮料容量是否符合标准要求?,双侧检验,绿色,健康饮品,绿色,健康饮品,255,255,总体均值的检验,(,2,已知,),(,例题分析,),H,0,:,=255,H,1,:,255,=,0.05,n,=,40,临界值,(,c,):,检验统计量,:,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,决策,:,结论,:,不拒绝,H,0,样本提供的证据表明:该天生产的饮料符合标准要求,总体均值的检验,(z,检验,),(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(,粘贴,函数,),第,2,步:,在函数分类中点击“统计”,并在函数名的,菜单下选择“,NORMSDIST,”,,然后确定,第,3,步:,将,z,的绝对值,1.01,录入,得到的函数值为,0.843752345,P,值,=2(1-,0.843752345,)=,0.312495,P,值远远大于,,故不拒绝,H,0,总体均值的检验,(,2,未知,),(,例题分析,),【,例,】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?,(,=0.01),左侧检验,50,个零件尺寸的误差数据,(,mm,),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,总体均值的检验,(,2,未知,),(,例题分析,),H,0,:,1.35,H,1,:,1.35,=,0.01,n,=,50,临界值,(,c,):,检验统计量,:,拒绝,H,0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策,:,结论,:,-2.33,z,0,拒绝,H,0,0.01,总体均值的检验,(,z,检验,),(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(,粘贴,函数,),第,2,步:,在函数分类中点击“统计”,并在函数名的,菜单下选择“,ZTEST,”,,然后确定,第,3,步:,在所出现的对话框,Array,框中,输入原始数据所在区,域;在,X,后输入参数的某一假定值,(,这里为,1.35,),;在,Sigma,后输入已知的总体标准差,(,若未总体标准差未,知则可忽略不填,系统将自动使用样本标准差代替,),第,4,步:,用,1,减去得到的函数值,0.995421023,即为,P,值,P,值,=,1-0.995421023=,0.004579,P,值,5200,=,0.05,n,=,36,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.000088,=0.05),改良后的新品种产量有显著提高,决策,:,结论,:,z,0,拒绝,H,0,0.05,1.645,总体均值的检验,(,z,检验,),(,P,值的图示,),抽样分布,P,=,0.000088,0,1.645,a,=,0.05,拒绝,H,0,1-,计算出的样本统计量,=3.75,P,值,总体均值的检验,(,大,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知:,未知:,拒绝域,P,值决策,拒绝,H,0,总体均值的检验,(,小样本,),总体均值的检验,(,小样本,),1.,假定条件,总体服从正态分布,小样本,(,n,30),检验统计量,2,已知:,2,未知:,总体均值的检验,(,小,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知:,未知:,拒绝域,P,值决策,拒绝,H,0,注:,已知的拒绝域同大样本,总体均值的检验,(,例题分析,),【,例,】,一种汽车配件的平均长度要求为,12,cm,,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的,10,个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在,0.05,的显著性水平下,检验该供货商提供的配件是否符合要求?,1,0,个零件尺寸的长度,(,cm,),12.2,10.8,12.0,11.8,11.9,12.4,11.3,12.2,12.0,12.3,总体均值的检验,(,例题分析,),H,0,:,=12,H,1,:,12,=0.05,df,=10-1=9,临界值,(,c,):,检验统计量,:,不拒绝,H,0,该供货商提供的零件符合要求,决策:,结论:,t,0,2.262,-2.262,0.025,拒绝,H,0,拒绝,H,0,0.025,总体均值的检验,(,t,检验,),(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,直接点击“,f,(,x,),”(,粘贴,函数,),第,2,步:,在函数分类中点击“统计”,并在函数名的,菜单下选择“,TDIST,”,,然后确定,第,3,步:,在出现对话框的,X,栏中输入计算出的,t,的绝对值,0.7035,,在,Deg-freedom,(,自由度,),栏中输入,本例的自由度,9,,在,Tails,栏中输入,2,(,表明是双,侧检验,如果是单测检验则在该栏输入,1,),第,4,步:,P,值,=,0.499537958,P,值,=0.05,,故不拒绝,H,0,总体比率的检验,适用的数据类型,离散数据,连续数据,数值型数据,数 据,品质数据,总体比率检验,假定条件,总体服从二项分布,可用正态分布来近似,(,大样本,),检验的,z,统计量,0,为假设的总体比率,总体比率的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,=,0,H,1,:,0,H,0,:,0,H,1,:,0,统计量,拒绝域,P,值决策,拒绝,H,0,总体比率的检验,(,例题分析,),【,例,】,一种以休闲和娱乐为主题的杂志,声称其读者群中有,80%,为女性。为验证这一说法是否属实,某研究部门抽取了由,200,人组成的一个随机样本,发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,,检验该杂志读者群中女性的比率是否为,80%,?它们的值各是多少?,双侧检验,总体比率的检验,(,例题分析,),H,0,:,=80%,H,1,:,80%,=0.05,n,=,200,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.013328,=0.01),该杂志的说法属实,决策,:,结论,:,z,0,2.58,-2.58,0.025,拒绝,H,0,拒绝,H,0,0.025,总体方差的检验,(,2,检验,),总体方差的检验,(,2,检验,),检验一个总体的方差或标准差,假设总体近似服从正态分布,使用,2,分布,检验统计量,样本方差,假设的总体方差,总体方差的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,2,=,0,2,H,1,:,2,0,2,H,0,:,2,0,2,H,1,:,2,0,2,统计量,拒绝域,P,值决策,拒绝,H,0,总体方差的检验,(,例题分析,),【,例,】,啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为,640,ml,,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于,4,ml,。企业质检部门抽取了,10,瓶啤酒进行检验,得到的样本标准差为,s,=3.8,ml,。试以,0.10,的显著性水平检验装填量的标准差是否符合要求?,朝日,BEER,朝日,BEER,朝日,BEER,朝日,总体方差的检验,(,例题分析,),H,0,:,2,=4,2,H,1,:,2,4,2,=0.,10,df,=,10-1=9,临界值,(,s,):,统计量,:,不拒绝,H,0,装填量的标准差否符合要求,2,0,16.9190,3.32511,/2=0.05,决策,:,结论,:,6,.,3,两个总体参数的检验,一、两个总体均值之差的检验,二、两个总体比率之差的检验,三、两个总体方差比的检验,两个总体参数的检验,两个总体参数的检验,z,检验,(,大样本,),t,检验,(,小样本,),t,检验,(,小样本,),z,检验,F,检验,独立样本,配对样本,均值,比率,方差,两个总体均值之差的检验,(,独立大样本,),两个总体均值之差的,检验,(,独立大样本,),1.,假定条件,两个样本是独立的随机样本,正态总体或非正态总体大样本,(,n,1,30,和,n,2,30),检验统计量,1,2,,,2,2,已知:,1,2,,,2,2,未知:,两个总体均值之差的,检验,(,大,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,1,-,m,2,=,0,H,1,:,m,1,-,m,2,0,H,0,:,m,1,-,m,2,0,H,1,:,m,1,-,m,2,0,统计量,1,2,,,2,2,已知,1,2,,,2,2,未知,拒绝域,P,值决策,拒绝,H,0,两个总体均值之差的检验,(,例题分析,),【,例,】,某公司对男女职员的平均小时工资进行了调查,独立抽取了具有同类工作经验的男女职员的两个随机样本,并记录下两个样本的均值、方差等资料如右表。在显著性水平为,0.05,的条件下,能否认为男性职员与女性职员的平均小时工资存在显著差异?,两个样本的有关数据,男性职员,女性职员,n,1,=44,n,1,=32,x,1,=75,x,2,=70,S,1,2,=64,S,2,2,=42.25,两个总体均值之差的检验,(,例题分析,),H,0,:,1,-,2,=0,H,1,:,1,-,2,0,=,0.05,n,1,=,44,,,n,2,=,32,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,该公司男女职员的平均小时工资之间存在显著差异,z,0,1.96,-1.96,0.025,拒绝,H,0,拒绝,H,0,0.025,两个总体均值之差的检验,(,独立小样本,),两个总体均值之差的,检验,(,1,2,,,2,2,已知,),假定,条件,两个独立的小样本,两个,总体都是正态分布,1,2,,,2,2,已知,检验,统计量,两个总体均值之差的,检验,(,1,2,,,2,2,未知但,1,2,=,2,2,),假定,条件,两个独立的小样本,两个,总体都是正态分布,1,2,、,2,2,未知但相等,即,1,2,=,2,2,检验,统计量,其中:,自由度:,两个总体均值之差的,检验,(,1,2,,,2,2,未知且不相等,1,2,2,2,),假定条件,两个,总体都是正态分布,1,2,,,2,2,未知且不相等,即,1,2,2,2,样本容量相等,即,n,1,=,n,2,=,n,检验统计量,自由度:,两个总体均值之差的,检验,(,1,2,,,2,2,未知且不相等,1,2,2,2,),假定,条件,两个,总体都是正态分布,1,2,,,2,2,未知且不相等,即,1,2,2,2,样本容量不相等,即,n,1,n,2,检验,统计量,自由度:,两个总体均值之差的检验,(,例题分析,),【,例,】,甲、乙两台机床同时加工某种同类型的零件,已知两台机床加工的零件直径,(,单位:,cm),分别服从正态分布,并且有,1,2,=,2,2,。为比较两台机床的加工精度有无显著差异,分别独立抽取了甲机床加工的,8,个零件和乙机床加工的,7,个零件,通过测量得到如下数据。在,=0.05,的显著性水平下,样本数据是否提供证据支持,“两台机床加工的零件直径不一致”的看法?,两台机床加工零件的样本数据,(,cm,),甲,20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9,乙,20.7,19.8,19.5,20.8,20.4,19.6,20.2,两个总体均值之差的检验,(,例题分析,),H,0,:,1,-,2,=,0,H,1,:,1,-,2,0,=,0.05,n,1,=,8,,,n,2,=,7,临界值,(,c,):,检验统计量,:,决策,:,结论,:,不拒绝,H,0,没有理由认为甲、乙两台机床加工的零件直径有显著差异,t,0,2.160,-2.160,0.025,拒绝,H,0,拒绝,H,0,0.025,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步:,将原始数据输入到,Excel,工作表格中,第,2,步:,选择“工具”下拉菜单并选择“,数据分析,”选项,第,3,步:,在“数据分析”对话框中选择,“,t-,检验:双样本,等,方差,假设,”,第,4,步:,当对话框出现后,在“变量,1,的区域”方框中输入第,1,个样本的数据区域,在“变量,2,的区域”方框中输入第,2,个样本的数据区域,在“假设平均差”方框中输入假定的总体均值之差,在“,”方框中输入给定的显著性水平,(,本例为,0.05,),在“输出选项”选择计算结果的输出位置,然后“确定”,用,Excel,进行检验,两个总体均值之差的估计,(,例题分析,),【,例,】,为检验两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排,12,个工人,每个工人组装一件产品所需的时间,(,分钟,),下如表,。,假定两种方法组装产品的时间服从正态分布,但方差未知且不相等。取显著性水平,0.05,,能否认为方法,1,组装产品的平均数量明显地高于方法,2,?,两个方法组装产品所需的时间,方法,1,方法,2,28.3,36.0,27.6,31.7,30.1,37.2,22.2,26.0,29.0,38.5,31.0,32.0,37.6,34.4,33.8,31.2,32.1,28.0,20.0,33.4,28.8,30.0,30.2,26.5,2,1,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步:,将原始数据输入到,Excel,工作表格中,第,2,步:,选择“工具”下拉菜单并选择“,数据分析,”选项,第,3,步:,在“数据分析”对话框中选择,“,t-,检验:双样本,异,方差,假设,”,第,4,步:,当对话框出现后,在“变量,1,的区域”方框中输入第,1,个样本的数据区域,在“变量,2,的区域”方框中输入第,2,个样本的数据区域,在“假设平均差”方框中输入假定的总体均值之差,在“,”方框中输入给定的显著性水平,(,本例为,0.05,),在“输出选项”选择计算结果的输出位置,然后“确定”,用,Excel,进行检验,两个总体均值之差的检验,(,匹配样本,),两个总体均值之差的检验,(,匹配,样本,),假定条件,两个总体配对差值构成的总体服从正态分布,配对差是由差值总体中随机抽取的,数据配对或匹配,(,重复测量,(,前,/,后,),检验统计量,样本差值均值,样本差值标准差,匹配样本,(,数据,形式,),观察序号,样本,1,样本,2,差值,1,x,11,x,21,d,1,=,x,11,-,x,21,2,x,12,x,22,d,2,=,x,12,-,x,22,M,M,M,M,i,x,1,i,x,2,i,d,i,=,x,1,i,-,x,2,i,M,M,M,M,n,x,1,n,x,2,n,d,n,=,x,1,n,-,x,2,n,两个总体均值之差的检验,(,匹配,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,d,=0,H,1,:,d,0,H,0,:,d,0,H,1,:,d,0,统计量,拒绝域,P,值决策,拒绝,H,0,两个总体均值之差的检验,(,例题分析,),【,例,】,某饮料公司开发研制出一新产品,为比较消费者对新老产品口感的满意程度,该公司随机抽选一组消费者,(,8,人,),,每个消费者先品尝一种饮料,然后再品尝另一种饮料,两种饮料的品尝顺序是随机的,而后每个消费者要对两种饮料分别进行评分,(,0,分,10,分,),,评分结果如下表。取显著性水平,=0.05,,该公司是否有证据认为消费者对两种饮料的评分存在显著差异?,两种饮料平均等级的样本数据,新饮料,5,4,7,3,5,8,5,6,旧饮料,6,6,7,4,3,9,7,6,两个总体均值之差的检验,(,用,Excel,进行检验,),第,1,步:,选择“,工具,”下拉菜单,,并,选择“,数据分析,”选项,第,3,步:,在分析工具中选择“,t,检验:平均值的成对二样本分析,”,第,4,步:,当出现对话框后,在“变量,1,的区域”方框内键入,数据区域,在“变量,2,的区域”方框内键入,数据区域,在“假设平均差”方框内键入假设的差值,(,这里为,0),在“,”框内键入给定的显著性水平,用,Excel,进行检验,两个总体比率之差的检验,1.,假定条件,两个,总体都服从二项分布,可以用正态分布来近似,检验统计量,检验,H,0,:,1,-,2,=0,检验,H,0,:,1,-,2,=,d,0,两个总体比率之差的检验,两个总体比率之差的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,1,-,2,=,0,H,1,:,1,-,2,0,H,0,:,1,-,2,0,H,1,:,1,-,2,0,统计量,拒绝域,P,值决策,拒绝,H,0,两个总体比率之差的检验,(,例题分析,),【,例,】,一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存在差异,分别抽取了,200,名男学生和,200,名女学生进行调查,其中的一个问题是:“你是否赞成采取上网收费的措施?”其中男学生表示赞成的比率为,27%,,女学生表示赞成的比率为,35%,。调查者认为,男学生中表示赞成的比率显著低于女学生。取显著性水平,=0.01,,样本提供的证据是否支持调查者的看法?,2,1,net,net,两个总体比率之差的检验,(,例题分析,),H,0,:,1,-,2,0,H,1,:,1,-,2,0,=,0.05,n,1,=,200,n,2,=,200,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,(,P,=,0.041837,=0.05),样本提供的证据支持调查者的看法,-1.645,Z,0,拒绝域,两个总体比率之差的检验,(,例题分析,),【,例,】,有两种方法生产同一种产品,方法,1,的生产成本较高而次品率较低,方法,2,的生产成本较低而次品率则较高。管理人员在选择生产方法时,决定对两种方法的次品率进行比较,如方法,1,比方法,2,的次品率低,8%,以上,则决定采用方法,1,,否则就采用方法,2,。管理人员从方法,1,生产的产品中随机抽取,300,个,发现有,33,个次品,从方法,2,生产的产品中也随机抽取,300,个,发现有,84,个次品。用显著性水平,=0.01,进行检验,说明管理人员应决定采用哪种方法进行生产?,两个总体比率之差的检验,(,例题分析,),H,0,:,1,-,2,8%,H,1,:,1,-,2,8%,=,0.01,n,1,=,300,n,2,=,300,临界值,(,c,):,检验统计量,:,决策,:,结论,:,拒绝,H,0,(,P,=1.22E-15,=0.05),方法,1,的次品率显著低于方法,2,达,8%,,应采用方法,1,进行生产,-2.33,Z,0,拒绝域,两个总体方差比的检验,两个总体方差比的检验,(,F,检验,),假定条件,两个总体都服从正态分布,且方差相等,两个独立的随机样本,检验统计量,两个总体方差比的,F,检验,(,临界值,),F,F,1-,F,拒绝,H,0,方差比,F,检验示意图,拒绝,H,0,两个总体方差比的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,1,2,/,2,2,=,1,H,1,:,1,2,/,2,2,1,H,0,:,1,2,/,2,2,1,H,1,:,1,2,/,2,2,1,统计量,拒绝域,两个总体方差比的检验,(,例题分析,),【,例,】,一家房地产开发公司准备购进一批灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表,。,检验两家供货商灯泡使用寿命的方差是否有显著差异,(,=0.05),两家供货商灯泡使用寿命数据,样本,1,650,569,622,630,596,637,628,706,617,624,563,580,711,480,688,723,651,569,709,632,样本,2,568,540,596,555,496,646,607,562,589,636,529,584,681,539,617,两个总体方差比的检验,(,用,Excel,进行检验,),第,1,步:,选择“,工具,”下拉菜单,,并,选择“,数据分析,”选项,第,3,步:,在分析工具中选择“,F,检验双样本方差,”,第,4,步:,当出现对话框后,在“变量,1,的区域”方框内键入,数据区域,在“变量,2,的区域”方框内键入,数据区域,在“,”框内键入给定的显著性水平,选择输出区域,选择“确定”,用,Excel,进行检验,本章小结,假设检验的基本问题,一个总体参数的检验,两个总体参数的检验,用,Excel,进行检验,利用,p,值进行检验,结 束,THANKS,:,
展开阅读全文