1、Click to edit Master title,Click to edit Master text styles,Second Level,Third Level,Fourth Level,Fifth Level,8-,*,作者:贾俊平,中国人民大学统计学院,统计学,STATISTICS,(,第五版,),第,8,章 假设检验,8.1,假设检验的基本问题,8.2,一个总体参数的检验,8.3,两个总体参数的检验,8.4,检验问题的进一步说明,参数假设检验,在总体的分布函数已知,但参数未知时,如对总体分布中的未知参数提出假设,则如何利用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。
2、这类统计问题我们称之为参数的假设检验问题。,参数估计和参数检验是利用样本对总体的统计特性提供的信息,建立样本的函数,即估计量或检验统计量,是从不同角度处理总体未知参数的两种统计方法。,案例,:,某健身俱乐部欲根据往年的会员情况,制定,今年的会员发展营销策略,.,主管经理估计俱乐部会,员的平均年龄是,35,岁,其中,25-35,岁的会员占总人,数的,70%.,研究人员从去年入会的新成员中随机抽,取,40,人,调查得知他们的平均年龄是,32,岁,其中,25-,35,岁的占,74%.,根据这份调查,问,:,主管经理对会,员年龄的估计是否准确,?,95%,置信水平,统计量,8.1,假设检验的基本问题
3、8.1.1,假设问题的提出,8.1.2,假设的表达式,8.1.3,两类错误,8.1.4,假设检验的流程,8.1.5,利用,P,值进行决策,8.1.6,单侧检验,什么是假设,?,(,hypothesis,),对总体参数的的数值所作的一种陈述,总体参数包括,总体均值,、,比例,、,方差,等,分析,之前,必需陈述,8.1.1,假设问题的提出,什么是假设检验,?,(,hypothesis testing,),事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立,有,参数假设检验,和,非,参数假设检验,采用逻辑上的反证法,依据统计上的小概率原理,提出原假设和备择假设,什么是原假设
4、null hypothesis),待检验的假设,又称“,0,假设”,研,究者想收集证据予以反对的假设,3.,总是有等号,或,4.,表示为,H,0,H,0,:,某一数值,指定为,=,号,即,或,例如,H,0,:,3190,(克),什么是备择假设?,(alternative hypothesis),与原假设对立的假设,也称“研究假设”,研究,者想收集证据予以支持的假设,总是有不等号,:,或,表示为,H,1,H,1,:,某一数值,或,某一数值,例如,H,1,:,不拒绝,H,0,若,p-,值,/2,不拒绝,H,0,若,p-,值,/2,拒绝,H,0,双侧检验与单侧检验,(,假设的形式,),假设,研
5、究的问题,双侧检验,左侧检验,右侧检验,H,0,m,=,m,0,m,m,0,m,m,0,H,1,m,m,0,m,m,0,双侧检验,(,原假设与备择假设的确定,),属于,决策中的假设检验,不论是拒绝,H,0,还是不拒绝,H,0,,都必需采取相应的行动措施,例如,某种零件的尺寸,要求其平均长度为,10cm,,大于或小于,10cm,均属于不合格,我们想要证明,(,检验,),大于或小于这两种可能性中的任何一种是否成立,建立的原假设与备择假设应为,H,0,:,=,10 H,1,:,10,双侧检验,(,显著性水平与拒绝域,),抽样分布,H,0,值,临界值,临界值,a,/2,a,/2,样本统计量,拒绝域,拒
6、绝域,1-,置信水平,单侧检验,(,显著性水平与拒绝域,),H,0,值,临界值,a,样本统计量,拒绝域,抽样分布,1-,置信水平,8.2,一个总体参数的检验,8.2.1,检验统计量的确定,8.2.2,总体均值的检验,8.2.3,总体比例的检验,8.2.4,总体方差的检验,一个总体参数的检验,Z,检验,(单尾和双尾),t,检验,(单尾和双尾),Z,检验,(单尾和双尾),2,检验,(单尾和双尾),均值,一个总体,比例,方差,总体,均值检验,总体均值的检验,(,检验统计量,),总体,是否已知?,用样本标,准差,S,代替,t,检验,小,样本量,n,否,是,z,检验,z,检验,大,总体均值的检验,(,2
7、已知或,2,未知大样本,),1.,假定条件,总体服从正态分布,若不服从正态分布,可用正态分布来近似,(,n,30),使用,Z,-,统计量,2,已知:,2,未知:,2,已知均值的检验,(,例题分析,),【,例,】,某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为,0,=0.081mm,,总体标准差为,=0.025,。今换一种新机床进行加工,抽取,n,=200,个零件进行检验,得到的椭圆度为,0.076,mm,。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(,0.05,),双侧检验,2,已知均值的检验,(,例题分析,),H,0,:,=0.081,H,
8、1,:,0.081,=,0.05,n,=,200,临界值,(s):,检验统计量,:,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,决策,:,结论,:,在,=0.05,的水平上拒绝,H,0,有证据表明新机床加工的零件的椭圆度与以前有显著差异,2,已知均值的检验,(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,选择“插入”下拉菜单,第,2,步:,选择“函数”点击,第,3,步:,在函数分类中点击“统计”,在函数名的菜,单下选择字符“,NORMSDIST,”,然后确定,第,4,步:,将,Z,的绝对值,2.83,录入,得到的函数值为,0.997672
9、537,P,值,=2(1,0.997672537)=0.004654,P,值远远小于,,故拒绝,H,0,2,已知均值的检验,(,小样本例题分析,),【,例,】,根据过去大量资料,某厂生产的灯泡的使用寿命服从正态分布,N,(,1020,,,100,2,),。现从最近生产的一批产品中随机抽取,16,只,,测得样本平均寿命为,1080,小时。试在,0.05,的显著性水平下判断这批产品的使用寿命是否有显著提高?,(,0.05,),单侧检验,2,已知均值的检验,(,小样本例题分析,),H,0,:,1020,H,1,:,1020,=,0.05,n,=,16,临界值,(s):,检验统计量,:,在,=0.05
10、的水平上拒绝,H,0,有证据表明这批灯泡的使用寿命有显著提高,决策,:,结论,:,Z,0,拒绝域,0.05,1.645,2,未知大样本均值的检验,(,例题分析,),【,例,】,某电子元件批量生产的质量标准为平均使用寿命,1200,小时。某厂宣称他们采用一种新工艺生产的元件质量大大超过规定标准。为了进行验证,随机抽取了,100,件作为样本,测得平均使用寿命,1245,小时,标准差,300,小时。能否说该厂生产的电子元件质量显著地高于规定标准?,(,0.05,),单侧检验,2,未知大样本均值的检验,(,例题分析,),H,0,:,1200,H,1,:,1200,=,0.05,n,=,100,临界值
11、s):,检验统计量,:,在,=0.05,的水平上不拒绝,H,0,不能认为该厂生产的元件寿命显著地高于,1200,小时,决策,:,结论,:,Z,0,拒绝域,0.05,1.645,总体均值的检验,(,2,未知小样本,),1.,假定条件,总体为正态分布,2,未知,且小样本,2.,使用,t,统计量,2,未知小样本均值的检验,(,例题分析,),【,例,】,某机器制造出的肥皂厚度为,5,cm,,今欲了解机器性能是否良好,随机抽取,10,块肥皂为样本,测得平均厚度为,5.3,cm,,标准差为,0.3,cm,,试以,0.05,的显著性水平检验机器性能良好的假设。,双侧检验,2,未知小样本均值的检验,(,例
12、题分析,),H,0,:,=5,H,1,:,5,=0.05,df,=10,-1=9,临界值,(s):,检验统计量,:,在,=0.05,的水平上拒绝,H,0,说明该机器的性能不好,决策:,结论:,t,0,2.262,-2.262,.025,拒绝,H,0,拒绝,H,0,.025,2,未知小样本均值的检验,(,P,值的计算与应用,),第,1,步:,进入,Excel,表格界面,选择“插入”下拉菜单,第,2,步:,选择“函数”点击,,并,在函数分类中点击“统,计”,然后,在函数名的菜单中选择字符,“,TDIST,”,,确定,第,3,步:,在弹出的,X,栏中录入计算出的,t,值,3.16,在自由度,(,De
13、g-freedom,),栏中录入,9,在,Tails,栏中录入,2,,表明是双侧检验,(,单测,检验则在该栏内录入,1,),P,值的结果为,0.011550.025,,,拒绝,H,0,2,未知小样本均值的检验,(,例题分析,),【,例,】,一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条件下,大于,40000,公里,对一个由,20,个轮胎组成的随机样本作了试验,测得平均值为,41000,公里,标准差为,5000,公里。已知轮胎寿命的公里数服从正态分布,我们能否根据这些数据作出结论,该制造商的产品同他所说的标准相符?,(,=0.05,),单侧检验!,均值的单尾,t,检
14、验,(,计算结果,),H,0,:,40000,H,1,:,40000,=0.,05,df,=,20-1=19,临界值,(s):,检验统计量,:,在,=0.05,的水平上不拒绝,H,0,不能认为制造商的产品同他所说的标准不相符,决策,:,结论,:,-1.7291,t,0,拒绝域,.05,总体比例的检验,(,Z,检验,),一个总体比例检验,假定条件,有两类结果,总体服从二项分布,可用正态分布来近似,比,例检验的,Z,统计量,0,为假设的总体比例,一个总体比例的检验,(,例题分析,),【,例,】,一项统计结果声称,某市老年人口(年龄在,65,岁以上)的比重为,14.7,%,,该市老年人口研究会为了检
15、验该项统计是否可靠,随机抽选了,400,名居民,发现其中有,57,人年龄在,65,岁以上。调查结果是否支持该市老年人口比重为,14.7%,的看法?,(,=,0.05,),双侧检验,一个总体比例的检验,(,例题分析,),H,0,:,=14.7%,H,1,:,14.7%,=0.05,n,=,400,临界值,(s):,检验统计量,:,在,=0.05,的水平上不拒绝,H,0,该市老年人口比重为,14.7%,决策,:,结论,:,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,总体方差的检验,(,2,检验,),方差的卡,方,(,2,),检验,检验一个总体的方差或标准差,假设总
16、体近似服从正态分布,检验统计量,样本方差,假设的总体方差,方差的卡,方,(,2,),检验,(,例题分析,),【,例,】,某厂商生产出一种新型的饮料装瓶机器,按设计要求,该机器装一瓶一升,(,1000cm,3,),的饮料误差上下不超过,1cm,3,。如果达到设计要求,表明机器的稳定性非常好。现从该机器装完的产品中随机抽取,25,瓶,分别进行测定,(,用样本减,1000cm,3,),,得到如下结果。,检验该机器的性能是否达到设计要求,(,=0.05,),0.3,-0.4,-0.7,1.4,-0.6,-0.3,-1.5,0.6,-0.9,1.3,-1.3,0.7,1,-0.5,0,-0.6,0.7,
17、1.5,-0.2,-1.9,-0.5,1,-0.2,-0.6,1.1,绿色,健康饮品,绿色,健康饮品,双侧检验,方差的卡,方,(,2,),检验,(,例题分析,),H,0,:,2,=1,H,1,:,2,1,=0.,05,df,=,25-1=24,临界值,(s):,统计量,:,在,=0.05,的水平上不拒绝,H,0,不能认为该机器的性能未达到设计要求,2,0,39.36,12.40,/2=.05,决策,:,结论,:,8.3,两个总体参数的检验,8.3.1,检验统计量的确定,8.3.2,两个总体均值之差的检验,8.3.3,两个总体比例之差的检验,8.3.4,两个总体方差比的检验,8.3.5,检验中
18、的匹配样本,两个正态总体参数的检验,两个总体的检验,Z,检验,(,大样本,),t,检验,(,小样本,),t,检验,(,小样本,),Z,检验,F,检验,独立样本,配对样本,均值,比例,方差,独立样本总体均值之差的检验,两个总体均值之差的,检验,(,1,2,、,2,2,已知,),1.,假定条件,两个样本是独立的随机样本,两个,总体都是正态分布,若不是正态分布,可以用正态分布来近似,(,n,1,30,和,n,2,30),检验统计量为,两个总体均值之差的检验,(,假设的形式,),假设,研究的问题,没有差异,有差异,均值,1,均值,2,均值,1,均值,2,H,0,1,2,=0,1,2,0,1,2,0,H
19、1,1,2,0,1,2,0,两个总体均值之差的检验,(,例题分析,),双侧检验!,【,例,】,有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为,8,公斤,第二种方法的标准差为,10,公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为,n,1,=32,,,n,2,=40,,测得,x,1,=,50,公斤,,x,2,=,44,公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?,(,=0.05,),两个总体均值之差的检验,(,例题分析,),H,0,:,1,-,2,=0,H,1,:,1,-,2,0,=,0.05,n,1,
20、32,,,n,2,=,40,临界值,(s):,检验统计量,:,决策,:,结论,:,在,=0.05,的水平上拒绝,H,0,有证据表明两种方法生产的产品其抗拉强度有显著差异,Z,0,1.96,-1.96,.025,拒绝,H,0,拒绝,H,0,.025,两个总体均值之差的,检验,(,1,2,、,2,2,未知且不相等,小样本,),检验具有不等方差的两个总体的均值,假定,条件,两个样本是独立的随机样本,两个,总体都是正态分布,两个总体方差未知且不相等,1,2,=,2,2,检验,统计量,其中:,两个总体均值之差的,检验,(,1,2,、,2,2,未知但相等,小样本,),检验具有等方差的两个总体的均值,假
21、定,条件,两个样本是独立的随机样本,两个,总体都是正态分布,两个总体方差未知但相等,1,2,2,2,检验,统计量,两个总体均值之差的检验,(,例题分析,),单侧检验,【,例,】,“,多吃谷物,将有助于减肥。”为了验证这个假设,随机抽取了,35,人,询问他们早餐和午餐的通常食谱,根据他们的食谱,将其分为二类,一类为经常的谷类食用者,(,总体,1,),,一类为非经常谷类食用者,(,总体,2,),。然后测度每人午餐的大卡摄取量。经过一段时间的实验,得到如下结果:检验该假设,(,=0.05,),两个总体均值之差的检验,(,例题分析,用统计量进行检验,),H,0,:,1,-,2,0,H,1,:,1,-,
22、2,0,=,0.05,n,1,=,15,,,n,2,=,20,临界值,(s):,检验统计量,:,决策,:,结论,:,在,=0.05,的水平上拒绝,H,0,没有证据表明,多吃谷物将有助于减肥,-1.694,t,0,拒绝域,.05,两个总体均值之差的检验,(,例题分析,用,Excel,进行检验,),第,1,步:,选择“工具”下拉菜单,,并,选择“数据分析”选项,第,2,步:,选择“,t,检验,双样本异方差假设,”,第,3,步:,当出现对话框后,在“变量,1,的区域”方框内键入,数据区域,在“变量,2,的区域”方框内键入,数据区域,在“假设平均差”的方框内键入,0,在“,(A),”,框内键入,0.0
23、5,在“输出选项”中选择输出区域,选择,“,确定,”,两个匹配,(,或配对,),样本的均值检验,两个总体均值之差的检验,(,匹配,样本的,t,检验,),1.,检验两个总体的均值,配对或匹配,重复测量,(,前,/,后,),3.,假定条件,两个总体都服从正态分布,如果不服从正态分布,可用正态分布来近似,(,n,1,30,n,2,30),匹配样本的,t,检验,(,假设的形式,),假设,研究的问题,没有差异,有差异,总体,1,总体,2,总体,1,总体,2,H,0,m,D,=,0,m,D,0,m,D,0,H,1,m,D,0,m,D,0,注:,D,i,=,X,1,i,-,X,2,i,,对第,i,对观察值,
24、匹配样本的,t,检验,(,数据,形式,),观察序号,样本,1,样本,2,差值,1,x,11,x,21,D,1,=,x,11,-,x,21,2,x,12,x,22,D,1,=,x,12,-,x,22,M,M,M,M,i,x,1i,x,2i,D,1,=,x,1,i,-,x,2,i,M,M,M,M,n,x,1n,x,2n,D,1,=,x,1n,-,x,2n,匹配样本的,t,检验,(,检验统计量,),样本差值均值,样本差值标准差,自由度,df,n,D,-1,统计量,D,0,:假设的差值,【,例,】,一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重,8.5,kg,以上。为了
25、验证该宣称是否可信,调查人员随机抽取了,10,名参加者,得到他们的体重记录如下表:,匹配样本的,t,检验,(,例题分析,),在,=0.05,的显著性水平下,调查结果是否支持该俱乐部的声称?,训练前,94.5,101,110,103.5,97,88.5,96.5,101,104,116.5,训练后,85,89.5,101.5,96,86,80.5,87,93.5,93,102,单侧检验,样本差值计算表,训练前,训练后,差值,D,i,94.5,101,110,103.5,97,88.5,96.5,101,104,116.5,85,89.5,101.5,96,86,80.5,87,93.5,93,1
26、02,9.5,11.5,8.5,7.5,11,8,9.5,7.5,11,14.5,合计,98.5,配对样本的,t,检验,(,例题分析,),配对样本的,t,检验,(,例题分析,),差值均值,差值标准差,H,0,:,m,1,m,2,8.5,H,1,:,m,1,m,2,8.5,a,=,0.05,df,=,10-1=9,临界值,(s):,检验统计量,:,决策,:,结论,:,在,=0.05,的水平上不拒绝,H,0,不能认为该俱乐部的宣称不可信,配对样本的,t,检验,(,例题分析,),-1.833,t,0,拒绝域,.05,配对样本的,t,检验,(,例题分析,用,Excel,进行检验,),第,1,步:,选择
27、工具”,第,2,步:,选择“数据分析”选项,第,3,步:,在分析工具中选择,“,t,检验:平均值的成对二样本分析”,第,4,步:,当出现对话框后,在“变量,1,的区域”方框内键入,数据区域,在“变量,2,的区域”方框内键入,数据区域,在“假设平均差”方框内键入,8.5,显著性水平保持默认值,两个总体比例之差的检验,1.,假定条件,两个总体是独立的,两个,总体都服从二项分布,可以用正态分布来近似,检验统计量,两个总体比例之差的,Z,检验,两个总体比例之差的检验,(,假设的形式,),假设,研究的问题,没有差异,有差异,比例,1,比例,2,比例,1,比例,2,H,0,P,1,P,2,=0,P,1,
28、P,2,0,P,1,P,2,0,H,1,P,1,P,2,0,P,1,P,2,0,两个总体比例之差的,Z,检验,(,例题分析,),单侧检验,【,例,】,对两个大型企业青年工人参加技术培训的情况进行调查,调查结果如下:甲厂:调查,60,人,,18,人参加技术培训。乙厂调查,40,人,,14,人参加技术培训。能否根据以上调查结果认为乙厂工人参加技术培训的人数比例高于甲厂?,(,=0.05,),两个总体比例之差的,Z,检验,(,例题分析,),H,0,:,1,-,2,0,H,1,:,1,-,2,0,=,0.05,n,1,=,60,,,n,2,=,40,临界值,(s):,检验统计量,:,决策,:,结论,:
29、在,=0.05,的水平上不拒绝,H,0,没有证据表明乙厂工人参加技术培训的人数比例高于甲厂,-1.645,Z,0,拒绝域,两个总体方差比的检验,两个总体方差比的检验,(,F,检验,),假定条件,两个总体都服从正态分布,且方差相等,两个独立的随机样本,假定形式,H,0,:,s,1,2,=,s,2,2,或,H,0,:,s,1,2,s,2,2,(,或,),H,1,:,s,1,2,s,2,2,H,1,:,s,1,2,),检验统计量,F,=,S,1,2,/,S,2,2,F,(,n,1,1,n,2,1),两个总体方差的,F,检验,(,临界值,),0,不能拒绝,H,0,F,拒绝,H,0,a,/2,a,/2,拒绝,H,0,两个总体方差的,F,检验,(,例题分析,),H,0,:,1,2,=,2,2,H,1,:,1,2,2,2,=0.05,n,1,=15,,,n,2,=20,临界值,(s):,检验统计量,:,决策,:,结论,:,在,=0.05,的水平上不拒绝,H,0,不能认为这两个总体的方差有显著差异,0,F,F,0.0975,=0.352,.025,拒绝,H,0,拒绝,H,0,.025,F,0.025,=2.62,本章小节,1.,假设检验的概念和类型,2.,假设检验的过程,基于一个样本的假设检验问题,4.,基于两个样本的假设检验问题,5.,利用,p,-,值进行检验,结 束,






