1、假设检验概述一、假设检验的基本概念1。假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整的统计推断内容。假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。本章分别讨论这两类检验方法。 2。与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要,这要由实际问题来确定,一般把期望出现的结论作为备选假设. 构造一个统计量来决定是“接受原假设,拒绝
2、备选假设”,还是“拒绝原假设,接受备选假设”。对不同的问题,要选择不同的检验统计量。检验统计量确定后,就要利用该统计的分布以及由实际问题中所确定的显著性水平,来进一步确定检验统计量拒绝原假设的取值范围,即拒绝域。在给定的显著性水平下,检验统计量的可能取值范围被分成两部分:小概率区域与大概率区域。小概率区域就是概率不超过显著性水平的区域,是原假设的拒绝区域;大概率区域是概率为1-的区域,是原假设的接受区域。 二、两种类型的错误 接受拒绝 真实判断正确弃真错误(第一类错误或错误) 不真实取伪错误(第二类错误或错误) 判断正确原假设1. 研究者想收集证据予以反对的假设2. 又称“0假设”3. 总是有
3、符号 =, 或 4.表示为 H0n H0 : m = 某一数值 n 指定为符号 =, 或 备择假设1. 研究者想收集证据予以支持的假设2. 也称“研究假设3. 总是有符号 , 4. 表示为 H1n H1 : m 某一数值,或m 某一数值n 例如, H1 : m 10cm,或m 10cm提出假设(结论与建议)1. 原假设和备择假设是一个完备事件组,而且相互对立n 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)显著性水平a1.是一个概率值
4、 2。原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域3.表示为 a (alpha) 常用的 a 值有0。01, 0.05, 0。104.由研究者事先确定总体参数检验一、单侧检验与双侧检验1. 备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(twotailed test) 2. 备择假设具有特定的方向性,并含有符号“或“,称为右侧检验 假设双侧检验单侧检验左侧检验右侧检验原假设H0 : m = m0H0 : m m0H0 : m m0备择假设H1 : m m0H1 : m m0H1 : m m0用单侧检验还是双侧检验,使用左侧检验还是右侧检验,决定于备选假设中
5、的不等式形式与方向。与“不相等对应的是双侧检验,与“小于”相对应的是左侧检验,与“大于”相对应的是右侧检验. 二、参数检验参数检验都是先对样本所属总体的性质作出若干的假定,或对总体的分布形状加以限定,然后对总体的有关参数情况进行统计假设检验。因此,参数检验又称为限定分布检验。如在总体服从正态分布条件下,对其均值进行检验。下面通过具体例子来说明参数检验方法。在例1中,按历史资料,总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升,来判断饮料厂商是否欺骗了消费者。程序如下: 第一步:确定原假设与备选假设。 : =250; : 250 以上的备选假设是总体均值小于250毫升,因为消费者协会
6、希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。 第二步:构造出检验统计量。 我们知道,如果总体的标准差已知,则正态总体(正常情况下,生产饮料的容量服从正态分布)的抽样平均数,也服从正态分布,对它进行标准化变换,可得到: 可用z作为检验统计量。 第三步:确定显著性水平,确定拒绝域。 通常显著水平由实际问题确定,我们这里取=0。05,左侧检验,拒绝域安排在左边,查标准正态分布表得临界值: =-1。645,拒绝域是zm0统计量s 已知:s 未知:拒绝域P值决策拒绝H0总体均值的检验(t检验)1。假定条件 总体服从正态分布2. 检验统计量s 2 未知总体均值的检
7、验 (检验方法的总结)假设双侧检验左侧检验右侧检验假设形式H0 : m =m0H1 : m m0H0 : m m0H1 : m m0H0 : m m0 H1 : m m0统计量s 未知:拒绝域P值决策拒绝H01将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是( b ).a. 单侧检验b。双侧检验c.右侧检验d。左侧检验2.检验功效定义为( b ).a. 原假设为真时将其接受的概率b. 原假设不真时将其舍弃的概率c. 原假设为真时将其舍弃的概率d. 原假设不真时将其接受的概率3。符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(c )。a
8、。存在试验误差(随机误差)b。存在着条件误差c.不存在什么误差d.既有抽样误差,也有条件误差4.得出两总体的样本数据如下:甲:8,6,10,7,8乙:5,11,6,9,7,10秩和检验中,秩和最大可能值是( c )。a。 15b. 48c. 45d。 661。显著性水平与检验拒绝域关系( a b d )a. 显著性水平提高(变小),意味着拒绝域缩小b。 显著性水平降低,意味着拒绝域扩大 c. 显著性水平提高,意味着拒绝域扩大d. 显著性水平降低,意味着拒绝域扩大化e。 显著性水平提高或降低,不影响拒绝域的变化2. 错误( a c d e )a. 是在原假设不真实的条件下发生b. 是在原假设真实
9、的条件下发生c。 决定于原假设与真实值之间的差距d. 原假设与真实值之间的差距越大,犯错误的可能性就越小e。 原假设与真实值之间的差距越小,犯错误的可能性就越大1假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平a=0。01与a=0.05,分别检验这批产品的平均重量是否是800克。解:假设检验为 (产品重量应该使用双侧检验)。采用t分布的检验统计量.查出0。05和0。01两个水平下的临界值(df=n-1=15)为2。131和2。947。因为2.1312。34(2。32),所以拒绝原假设,无故障时间有显著增加。3回顾本章开头的案例
10、,医院从2008年元旦出生的新生儿中随机抽取了50名,测量他们的平均体重为3300克,而2007年元旦时抽取的50名新生儿的平均体重是3200克.现假设根据以住的调查,新生儿体重的标准差是65克。试问:(1)以0。05的显著性水平,检验新生儿体重在这两年中是否有显著的变化?(2)计算检验的p值,并根据p值重新检验(1)中的结论。解:(1)假设检验为。新生儿体重服从正态分布,构造检验统计量.查出0。05水平下的临界值为1.645。计算统计量值.因为z1。645,所以拒绝原假设.(2)对应p值1/2(1-F(z)) ,由于z=10.878573,可以认为p值几乎等于0,拒绝原假设。(1)、(2)都
11、说明这两年新生儿的体重显著增加了。4某加油站经理希望了解驾车人士在该加油站的加油习惯.在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准差是3。2加仑,有19人购买无铅汽油。试问:(1)以0。05的显著性水平,是否有证据说明平均加油量并非12加仑?(2)计算(1)的p值。(3)以0。05的显著性水平来说,是否有证据说明少于20的驾车者购买无铅汽油?(4)计算(3)的p值。(5)在加油量服从正态分布假设下,若样本容量为25,计算(1)和(2)。解:(1)(2)假设检验为。采用正态分布的检验统计量。查出0。05水平下的临界值为1。96。计算统计量值。因为
12、z=4。68751。96,所以拒绝原假设。对应p值2(1-F(z) ,查表得到F(z)在0.999 994和0.999 999之间,所以p值在0.000 006和0。000 001之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值1F(|z),直接查表即得F(z))。p值0.05,拒绝原假设。都说明平均加油量并非12加仑。(3)(4)假设检验为.采用成数检验统计量。查出0。05水平下的临界值为1。64和1.65之间.计算统计量值,因此z2.51。65(1。96,所以拒绝原假设。对应p值2(1F(z)) ,查表得到F(z)在0。9807和0.9817之间,所以p值在0.0193和0.0183之间(因为表中给出了双侧检验的接受域概率,因此本题中双侧检验的p值1-F(|z),直接查表即得F(z))。显然p值0.05,拒绝原假设。