资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,5-,#,2020-8-20,统计学基础,(,第,6,版,),数据分析,(,方法与案例,),作者 贾俊平,版权所有 违者必究,统计学基础,(,第,6,版,),Fundamental Statistics,第,5,章 假设检验,5.1,假设检验的基本原理,5.2,总体均值的检验,5.3,总体比例的检验,hypothesis test,学习目标,假设检验的基本思想和原理,总体均值的检验,总体比例的检验,P,值的计算与应用,5.1,假设检验的基本原理,5.1.1,假设的陈述,5.1.2,两类错误与显著性水平,5.1.3,检验统计量与拒绝域,5.1.3,利用,P,值进行决策,第,5,章 假设检验,5.1.1,假设的陈述,5.1,假设检验的基本原理,什么是假设,?,(,hypothesis,),在参数检验中,,对总体参数的具体数值所作的陈述,就一个总体而言,总体参数包括,总体均值,、,比例,、,方差,等,分析,之前,必需陈述,我认为这种新药的疗效比原有的药物更有效,!,什么是假设检验,?,(,hypothesis test,),先对总体的参数,(,或分布形式,),提出某种假设,然后利用样本信息判断假设是否成立的统计方法,有参数检验和,非,参数检验,逻辑上运用反证法,统计上依据小概率原理,小概率是在一次试验中,一个几乎不可能发生的事件发生的概率,在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设,原假设,(null hypothesis),又称“,0,假设”,研,究者想收集证据予以反对的假设,用,H,0,表示,所表达的含义总是指,参数没有变化或变量之间没有关系,最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它,总是有符号,或,H,0,:,=,某一数值,H,0,:,某一数值,H,0,:,某一数值,例如,H,0,:,10cm,null,也称“研究假设”,研究,者想收集证据予以支持的假设,用,H,1,或,H,a,表示,所表达的含义是总体,参数发生了变化或变量之间有某种关系,备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设,总是有符号,或,H,1,:,某一数值,H,1,:,某一数值,H,1,:,某一数值,备择假设,(alternative hypothesis),【,例,5-1】,一种零件的生产标准是直径应为,10cm,,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,10cm,,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设,(,例题分析,),解:,研究者想收集证据予以证明的假设应该是,“,生产过程不正常,”,。建立的原假设和备择假设为,H,0,:,10cm,H,1,:,10cm,【,例,5-2】,某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于,500,克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设,(,例题分析,),解:,研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为,H,0,:,500,H,1,:,”,或“,”,的假设检验,称为单侧检验或单尾检验,(one-tailed test),备择假设的方向为“,”,,称为,右侧检验,双侧检验与单侧检验,双侧检验与单侧检验,(,假设的形式,),假设,双侧检验,单侧检验,左侧检验,右侧检验,原假设,H,0,:,m,=,m,0,H,0,:,m,m,0,H,0,:,m,m,0,备择假设,H,1,:,m,m,0,H,1,:,m,m,0,以总体均值的检验为例,5.1.2,两类错误与显著性水平,5.1,假设检验的基本原理,两类错误与显著性水平,研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误,原假设和备择假设不能同时成立,决策的结果要么拒绝,H,0,,要么不拒绝,H,0,。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误,第,类错误,(,错误,),原假设为正确时拒绝原假设,第,类错误的概率记为,,,被称为显著性水平,2.,第,类错误,(,错误,),原假设为错误时未拒绝原假设,第,类错误的概率记为,(Beta),两类错误的控制,一般来说,对于一个给定的样本,如果犯第,类错误的代价比犯第,类错误的代价相对较高,则将犯第,类错误的概率定得低些较为合理;反之,如果犯第,类错误的代价比犯第,类错误的代价相对较低,则将犯第,类错误的概率定得高些,一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第,类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第,类错误的发生概率,显著性水平,(,significant level,),事先确定的用于拒绝原假设,H,0,时所必须的证据,能够容忍的犯第,类错误的最大概率,(,上限值,),2.,原假设为真时,拒绝原假设的概率,抽样分布的拒绝域,3.,表示为,(alpha),常用的 值有,0.01,0.05,0.10,4.,由研究者事先确定,5.1.3,检验统计量与拒绝域,5.1,假设检验的基本原理,依据什么做出决策?,若假设为,H,0,:,=500,,,H,1,:,临界值,拒绝,H,0,左侧检验:,统计量,临界值,拒绝,H,0,5.1.4,利用,P,值进行决策,5.1,假设检验的基本原理,用,P,值决策,(,P,-value),如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率,P,值告诉我们:,如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设,被称为观察到的,(,或实测的,),显著性水平,决策规则:,若,p,值,拒绝,H,0,双侧检验的,P,值,左侧检验的,P,值,右侧检验的,P,值,P,值是关于数据的概率,P,值,原假设的对或错的概率无关,它反映的是在某个总体的许多样本中某一类数据出现的经常程度,它是当原假设正确时,得到目前这个样本数据的概率,比如,要检验全校学生的平均生活费支出是否等于,500,元,检验的假设为,H,0,:,=500,;,H,0,:,500,。假定抽出一个样本算出的样本均值,600,元,得到的值为,P=0.02,,这个,0.02,是指如果平均生活费支出真的是,500,元的话,那么,从该总体中抽出一个均值为,600,的样本的概率仅为,0.02,。如果你认为这个概率太小了,就可以拒绝原假设,因为如果原假设正确的话,几乎不可能抓到这样的一个样本,既然抓到了,就表明这样的样本不在少数,所以原假设是不对的,值越小,你拒绝原假设的理由就越充分,要证明原假设不正确,,P,值要多小,才能令人信服呢?,原假设的可信度又多高?,如果,H,0,所代表的假设是人们多年来一直相信的,就需要很强的证据,(,小的,P,值,),才能说服他们,拒绝的结论是什么?,如果拒绝,H,0,而肯定,H,1,,你就需要有很强的证据显示要支持,H,1,。比如,,H,1,代表要花很多钱把产品包装改换成另一种包装,你就要有很强的证据显示新包装一定会增加销售量,(,因为拒绝,H,0,要花很高的成本,),多大的,P,值合适,?,用,P,值进行检验比根据统计量检验提供更多的信息,统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少,比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而,P,值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少,P,值决策与统计量的比较,P,值,决策与统计量的比较,假设检验结论的表述,(“,显著”与“不显著”,),当拒绝原假设时,我们称样本结果是,统计上显著的,拒绝原假设时结论是清楚的,当不拒绝原假设时,我们称样本结果是,统计上不显著的,不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的,假设检验结论的表述,(“,显著”与“不显著”,),当拒绝原假设时,我们称样本结果是,统计上显著的,拒绝原假设时结论是清楚的,当不拒绝原假设时,我们称样本结果是,统计上不显著的,不拒绝原假设时,并未给出明确的结论,不能说原假设是正确的,也不能说它不是正确的,假设检验结论的表述,(“,不拒绝”不等于“接受”,),假设检验的目的在于试图找到证据拒绝原假设,而不在于证明什么是正确的,当没有足够证据拒绝原假设时,不采用“,接受原假设,”的表述,而采用“,不拒绝原假设,”的表述。“不拒绝”的表述实际上意为着并未给出明确的结论,我们没有说原假设正确,也没有说它不正确,“接受”的说法有时会产生误导,因为这种说法似乎暗示着原假设已经被证明是正确的了。但实事上,,H,0,的真实值我们永远也无法知道,,H,0,只是对总体真实值的一个假定值,由样本提供的信息也就自然无法证明它是否正确,假设检验步骤的总结,陈述原假设和备择假设,从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值,确定一个适当的显著性水平,并计算出其临界值,指定拒绝域,将统计量的值与临界值进行比较,作出决策,统计量的值落在拒绝域,拒绝,H,0,,否则不拒绝,H,0,也可以直接利用,P,值,作出决策,5.2,总体均值的检验,5.2.1,大样本的检验方法,5.2.2,小样本的检验方法,第,5,章 假设检验,5.2.1,大样本的检验方法,5.2,总体均值的检验,总体均值的检验,(,大样本,),1.,假定条件,大样本,(,n,30),使用,z,检验统计量,2,已知:,2,未知:,总体均值的检验,(,2,已知,),(,例题分析,大样本,),【,例,5-4】,一种罐装饮料采用自动生产线生产,每罐的容量是,255ml,,标准差为,5ml,。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了,40,罐进行检验,测得每罐平均容量为,255.8ml,。取显著性水平,=0.05,,检验该天生产的饮料容量是否符合标准要求?,双侧检验,绿色,健康饮品,绿色,健康饮品,255,255,总体均值的检验,(,2,已知,),(,例题分析大样本,),H,0,:,=255,H,1,:,255,=,0.05,n,=,40,临界值,(,c,):,检验统计量,:,决策,:,结论,:,用,Excel,中的,【NORMSDIST】,函数得到的双尾检验,P=0.312945,不拒绝,H,0,没有证据表明该天生产的饮料不符合标准要求,总体均值的检验,(z,检验,),(,P,值的计算与应用,),用,Excel,的【,】函数计算,P,值,第,1,步:,将光标放在任意空白单元格。然后点击【公式】,点击插入函数【,】。,第,2,步:,在【选择类别】中选择【统计】,并在【选择函数】中点击【,】,单击【确定】。,第,3,步:,在,Z,框内输入,z,的值,1.01,,在【,Cumulative,】后输入,1,(或,TRUE,)】,得到的累积概率为为,0.8437523455,,该值表示的是在标准正态分布条件下,z,值为,1.01,左边的面积,总体均值的检验,(,2,未知,),(,例题分析,大样本,),【,例,5-5】,一种机床加工的零件尺寸绝对平均误差为,1.35mm,。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取,50,个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低?,(,=0.01),左侧检验,50,个零件尺寸的误差数据,(,mm,),1.26,1.19,1.31,0.97,1.81,1.13,0.96,1.06,1.00,0.94,0.98,1.10,1.12,1.03,1.16,1.12,1.12,0.95,1.02,1.13,1.23,0.74,1.50,0.50,0.59,0.99,1.45,1.24,1.01,2.03,1.98,1.97,0.91,1.22,1.06,1.11,1.54,1.08,1.10,1.64,1.70,2.37,1.38,1.60,1.26,1.17,1.12,1.23,0.82,0.86,总体均值的检验,(,例题分析,大样本,),H,0,:,1.35,H,1,:,1.35,=,0.01,n,=,50,临界值,(,c,):,检验统计量,:,拒绝,H,0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策,:,结论,:,总体均值的检验,(,P,值的计算与应用,大样本,),第,1,步:,进入,Excel,表格界面,直接点击,【,f,x,】,第,2,步:,在函数分类中点击,【,统计,】,,并在函数名的菜单下选,择,【,Z.TEST,】,,然后,【,确定,】,第,3,步:,在所出现的对话框,【,Array,】,框中,输入原始数据所,在区域;在,【,X,】,后输入参数的某一假定值,(,这里为,1.35,),;在,【,Sigma,】,后输入已知的总体标准差,(,若总,体标准差未知则可忽略不填,系统将自动使用样本,标准差代替,),第,4,步:,用,1,减去得到的函数值,0.995421023,即为,P,值,P,值,=,1-0.995421023=,0.004579,P,值,5200,=,0.05,n,=,36,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.000088,=0.05),改良后的新品种产量有显著提高,决策,:,结论,:,总体均值的检验,(,z,检验,),(,P,值的图示,),总体均值的检验,(,大,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知,未知,拒绝域,P,值决策,拒绝,H,0,5.2.2,小样本的检验方法,5.2,总体均值的检验,总体均值的检验,(,小样本,),1.,假定条件,总体服从正态分布,小样本,(,n,30),检验统计量,2,已知:,2,未知:,总体均值的检验,(,小,样本检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,m,=,m,0,H,1,:,m,m,0,H,0,:,m,m,0,H,1,:,m,m,0,统计量,已知,未知,拒绝域,P,值决策,拒绝,H,0,注:,已知的拒绝域同大样本,总体均值的检验,(,例题分析,小样本,),【,例,5-7】,一种汽车配件的平均长度要求为,12,cm,,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的,10,个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在,0.05,的显著性水平下,检验该供货商提供的配件是否符合要求?,1,0,个零件尺寸的长度,(,cm,),12.2,10.8,12.0,11.8,11.9,12.4,11.3,12.2,12.0,12.3,总体均值的检验,(,例题分析,小样本,),H,0,:,=12,H,1,:,12,=0.05,df,=10,-1=9,临界值,(,c,):,检验统计量,:,不拒绝,H,0,没有证据表明该供货商提供的零件不符合要求,决策:,结论:,总体均值的检验,(,P,值的计算与应用,t,检验,),第,1,步:,进入,Excel,表格界面,直接点击,【,f,x,】,第,2,步:,在函数分类中点击,【,统计,】,,并在函数名的,菜单下选择,【,TDIST,】,,然后,【,确定,】,第,3,步:,在出现对话框的,【,X,】,栏中输入计算出的,t,的绝对,值,0.7053,,在,【,Deg-freedom,】,(,自由度,),栏中输,入本例的自由度,9,,在,【,Tails,】,栏中输入,2,(,表明,是双侧检验,如果是单测检验则在该栏输入,1,),第,4,步:,P,值,=,0.498453,P,值,=0.05,,故不拒绝,H,0,一个总体均值的检验,(,作出判断,),5.3,总体比例的检验,第,5,章 假设检验,总体比例检验,假定条件,总体服从二项分布,可用正态分布来近似,(,大样本,),检验的,z,统计量,0,为假设的总体比例,总体比例的检验,(,检验方法的总结,),假设,双侧检验,左侧检验,右侧检验,假设形式,H,0,:,=,0,H,1,:,0,H,0,:,0,H,1,:,0,统计量,拒绝域,P,值决策,拒绝,H,0,总体比例的检验,(,例题分析,),【,例,5-8】,一种以休闲和娱乐为主题的杂志,声称其读者群中有,80%,为女性。为验证这一说法是否属实,某研究部门抽取了由,200,人组成的一个随机样本,发现有,146,个女性经常阅读该杂志。分别取显著性水平,=0.05,和,=0.01,,检验该杂志读者群中女性的比例是否为,80%,?它们的,P,值各是多少?,双侧检验,总体比例的检验,(,例题分析,),H,0,:,=80%,H,1,:,80%,=0.05,n,=,200,临界值,(,c,):,检验统计量,:,拒绝,H,0,(,P,=,0.013328,=0.01),没有证据表明,“,该杂志声称读者群中有,80%,为女性,”,的看法不正确,决策,:,结论,:,本章小节,结 束,THANKS,
展开阅读全文